Vego's geïllustreerde encyclopedie van de elektronica
vorige woord
volgende woord
index van de letter K
algemene index
Karakter
Een symbool uit de beschikbare symbolenset van een computer. De
symbolenset van een computer is opgebouwd uit alle letters,
cijfers, leestekens en enige specifieke grafische tekens, zoals
cirkeltjes, blokjes, etc. De karakters maken deel uit van de
zogenoemde 'karakter-tabel'. In de loop der tijden zijn diverse standaarden
ontwikkkeld.
7 bit ASCII
Lang geleden werd besloten tot een bepaalde vorm van standaardisatie. Dat was de 7 bit brede ASCII-code, afkorting van 'American Standard Code of Information Interchange'. Omdat deze code uit slechts zeven bit bestaat, kunnen er maximaal 128 karakters gedefinieerd worden. Er worden 33 codes gebruikt voor het definiëren van besturingscodes, zoals:
- BS: back space;
- DEL: delete;
- LF: line feed.
Er is dus alleen ruimte voor de 26 kleine en grote letters van het alfabet, de cijfers en enige leestekens.
Deze karakter-tabel voldoet uitstekend voor de Engelse taal, deze kent immers geen letters met accenten. Om de tabel bruikbaar te maken voor andere talen, heeft men tien codes niet star gedefinieerd. Deze kunnen in andere talen ingevuld worden door plaatselijk veel gebruikte karakters.
ISO 8859-1
Een beter bruikbare gestandaardiseerde karakter-tabel heet officieel ISO 8859-1, maar gaat door het leven onder de populaire benaming Latin-1. Deze tabel gaat uit van 8 bit brede codes, zodat in totaal 256 verschillende karakters kunnen worden gedefinieerd. Als men er de noodzakelijke besturingstekens aftrekt, blijven er ongeveer 220 cijfercodes over. Dit geeft de mogelijkheid de voornaamste accent-letters door een eigen code voor te stellen.
De ISO 8859-1 karakterset is ook van belang voor het Internet. De HTML-specificaties geven opdat alle HTML-pagina's volgens deze standaard moeten worden gecodeerd. Alle browsers zijn dan ook in staat alle karakters van deze set uit te lezen en op het beeldscherm te zetten.
Ook de ISO 8859-1 set heeft echter zware beperkingen. Zo stelt men vast dat er slechts weinig Griekse letters aanwezig zijn. Toch zijn deze letters zeer belangrijk voor wetenschappelijke verhalen, omdat een heleboel natuurkundige grootheden worden voorgesteld door Griekse letters. Verder zijn geen Cyrillische karakters gedefinieerd, terwijl er toch een aantal Europese talen zijn die van deze karakters gebruik maken. Japanse, Chinese en Koreaanse letters zal men natuurlijk ook tevergeefs zoeken, terwijl dit toch drie talen zijn die in technisch opzicht op dit moment niet onbelangrijk zijn.
Dubbel-byte codering
Voor het ondersteunen van dergelijke talen werden verschillende systemen ontwikkeld, die gebruik maken van dubbel-byte codering. Om compatibel te zijn met de 'Europese' karakter-coderingen, worden sommige karakters voorgesteld door één byte en andere door twee bytes. Het zal duidelijk zijn dat hierdoor de problemen die komen kijken bij het inlezen van deze tekenset's in programma's alleen maar toenemen.
UNICODE
In 1988 werd, op initiatief van Apple en Xerox, een werkgroep in het leven geroepen die tot taak had een nieuwe standaard voor karakter-identificatie te ontwikkelen, die universeel bruikbaar moest zijn. In 1991 sloten alle bekende hard- en software-producenten zich hierbij aan en werd de werkgroep officieel het 'Unicode-consortium' gedoopt. Dit consortium werkte nauw samen met de ISO, de 'International Organisation for Standardisation'. Het gevolg was dat er een ISO-gecertificeerde norm tot stand kwam, die ISO 10646 werd genoemd.
In de loop der jaren zij diverse versies ontwikkeld, zodat op dit moment in de praktijk sprake in van Unicode 2.0. Deze norm kan in totaal niet minder dan 65.536 karakters definiëren en ondersteunt in de praktijk ongeveer 40.000 karakters van alle bekende en minder bekende Aardse talen.
Maar omdat deze 40.000 karakters blijkbaar toch nog niet alle talen afdekken, wordt gewerkt aan versie 3.0. Deze zal nog een paar duizend extra karakters ondersteunen van minder bekende talen zoals Ethiopisch of Khmer. Unicode 3.0 zal ook het nieuwe symbool van de Europese munt gaan ondersteunen.
Diverse software-fabrikanten zijn bezig Unicode 2.0 en 3.0 in hun pakketten te implementeren. Een paar pakketten die in de komende versies Unicode zullen ondersteunen zijn:
- Windows NT;
- Windows 98 en 2000;
- Netscape Navigator;
- Internet Explorer;
- Office 98;
- Java.
Natuurlijk is een herkenbaar symbool ontwikkeld, dat leveranciers mogen vermelden op de verpakking als zij de officiële Unicode-norm ondersteunen. Dit symbool is voorgesteld in onderstaande figuur.
Interessante elektronica links
Klik hier ... Kattenschrikdraad installatie houdt katten in of uit uw tuin
Klik hier ... Boeken voor de elektronicus
Klik hier ... Software voor schema tekenen, print ontwerpen en simulatie
Klik hier ... Goedkope digitale oscilloscopen, via USB aan te sluiten op uw PC
Klik hier ... Goedkope meetapparatuur voor het testen van uw onderdelen
Klik hier ... Draadloze elektronica in uw huis
Klik hier ... Inbraakalarm van Marmitek en KlikAanKlikUit
Klik hier ... Bespaar energie met PowerSafer
Klik hier ... Goedkope dataloggers voor t, RH, CO, V en I
Klik hier ... Educatieve producten voor het basisonderwijs