Je hebt een klacht over de onderstaande posting:
En dan moet je je voorstellen dat unicode niet alleen alle karakters ooit wil codificeren, maar ook alle varianten, en dat ze daar per karakter(variant) minstens twee, vaak nog meer, manieren voor hebben. Je hebt bijvoorbeeld niet alleen de e-met-trema, maar ook de (e)+(trema). En dan hebben we het nog niet over varianten die vrijwel (of zelfs exact) eruitzien maar semantisch net een tikkeltje anders zijn, of truuks als beedteloze spaties ertussenzetten, en ga zo maar door. En dat is nadat je je netjes hebt ingedekt tegen rotten met encodering als invalide utf-8 reeksen in je input, wat nog niet eens heel makkelijk is om correct te doen. Zelfs met het toch behoorlijk ingeperkte IDN (unicode voor domeinnamen) kan je al behoorlijk rotten. Je wil niet weten wat er met het volledige unicode allemaal kan. Wat dat betreft is unicode gewoon niet zo vreselijk geschikt voor algemeen gebruik. Het kan teveel, wil teveel, en eet van veelteveel walletjes tegelijk.
Beschrijf je klacht (Optioneel):