Naar inhoud springen

Diakritisch teken

Uit Wikipedia, de vrije encyclopedie
Toetsenbord met letters met diakritische tekens
De ontwikkeling van de umlaut, geïllustreerd aan de hand van het woord schön in Sütterlin-handschrift. De schrijfwijze gaat van schoen naar schon met een kleine e boven de o, tot uiteindelijk schön met twee kleine haaltjes boven de o

Een diakritisch teken is een schriftteken dat boven, onder of door een letter gezet wordt ter aanduiding van de uitspraak.

Met diakritische tekens kunnen verschillende aspecten van de uitspraak worden aangegeven:

Soms is een diakritisch teken niet (of niet meer) nodig voor de uitspraak maar wordt het alleen gebruikt om etymologische redenen, bijvoorbeeld het accent circonflexe in het Franse woord maître, of om homografen te onderscheiden, bijvoorbeeld het accent grave in het Franse woordpaar ou (of) en (waar).

Diakritische tekens kunnen in verschillende talen een verschillende status hebben:

  • Een letter met een diakritisch teken is een aparte letter met een eigen plaats in het alfabet van de desbetreffende taal. Dit is onder andere het geval met het Poolse alfabet, waar de ł na de l komt en het Spaanse alfabet, met de ñ na de n. In de Scandinavische talen volgen na de letter z nog de æ, ø, å, ä en ö. In een woordpuzzel, zoals een kruiswoordraadsel, is het ondenkbaar dat letters met en zonder diakriet als identiek worden beschouwd, wat in de hierna volgende situaties wél kan.
  • Het diakritische teken levert geen nieuwe letter op, de letter met en zonder diakritisch teken staan dus op dezelfde plek in alfabetische volgorde. Het diakritische teken mag niet weggelaten worden. Dit is het geval met de Duitse umlaut en in het Iers met de síneadh.
  • Het diakritische teken levert geen nieuwe letter op en het diakritische teken moet soms weggelaten worden. Dit is het geval bij het trema in het Nederlands: direct na een woordafbreking vervalt het trema, dus:[2] officiële, offici-ele.
  • Het diakritische teken wordt in de praktijk soms weggelaten, vooral op hoofdletters. Volgens sommigen is het zelfs correct de tekens op hoofdletters weg te laten. In het Frans is dit vaak de praktijk, hoewel volgens de officiële regels van de Académie française ook op hoofdletters diakritische tekens verplicht zijn.[3] Ook Spaanse schrijvers staan erom bekend dat ze zich weinig gelegen laten liggen aan de juiste plaatsing van de accentjes (ñ is daarop een uitzondering, want dat is een aparte letter). In het Nederlands worden officieel ook geen accenten op hoofdletters geschreven (behalve als het woord volledig in hoofdletters is geschreven[4]), maar in de praktijk gebeurt dit vaak wel (Één in plaats van Eén).
  • Het diakritische teken hoort niet bij het woord, maar wordt geschreven om nadruk te geven, de klemtoon aan te geven of te verplaatsen, of om verwarring met andere woorden te voorkomen. Dit wordt in het Nederlands nogal eens gebruikt: vóórkomen versus voorkómen, alléén.

Een letter met diakritisch teken kan een ligatuur zijn. Zo is de Duitse ä eigenlijk een combinatie van a en e. Er zijn ook ligaturen die niet als letter met diakritisch teken beschouwd kunnen worden, zoals æ en ß.

In vreemde namen wordt een diakriet vaak niet geschreven, vooral als het een diakriet is die plaatselijk niet bekend is. Zo treft men in Noord-Amerika vaak namen als Fernandez aan (oorspronkelijk Fernández). Bekend is ook het ruimtevaartcentrum Cape Canaveral, oorspronkelijk Cabo Cañaveral. Ook in het Nederlands komt dit voor: hotel, controle, marechaussee.

Soms is een alternatieve schrijfwijze mogelijk:

  • In het Duits kan in plaats van een umlaut een e achter de klinker worden gezet. In de praktijk gebeurt dat alleen in noodgevallen, als het gebruikte lettertype geen umlaut toelaat. Het komt ook voor bij internetdomeinen, zoals maerklin.de. In namen van personen en steden ligt het iets anders, sommige namen behoren met een umlaut, andere met een e te worden geschreven zoals blijkt uit Göring en Goebbels, München en Bad Oeynhausen.
  • In het Ierse lettertype schrijft men een punt boven sommige medeklinkers. In het Latijnse lettertype wordt die punt vervangen door een h achter de letter. Dit kan resulteren in een andere alfabetische volgorde: in een modern woordenboek in Latijns lettertype komt comhrá (conversatie) vóór compás, in Iers lettertype komt compás vóór coṁrá of coṁráḋ.

In het Engels komen diakritische tekens weinig voor. Een voorbeeld is résumé, maar dat wordt ook gespeld resume.

In verschillende talen

[bewerken | brontekst bewerken]

Diakritische tekens komen vooral veel voor in talen die vroeger in een ander schrift werden geschreven, zoals het Turks, dat vroeger in het Arabische en tegenwoordig in het Latijns schrift wordt geschreven. Ook het Quốc ngữ in Vietnam, het Tsjechisch en het Pools zijn hier voorbeelden van.

Het Latijnse schrift kent een heel scala aan diakritische tekens. Ook het Arabische, het cyrillische, het Griekse, het Hebreeuwse en het Thaise schrift maken gebruik van diakritische tekens.

Het hanyu pinyin, het transliteratiesysteem van het Chinees schrift, gebruikt diakritische tekens om de toon van het woord aan te geven.

In het Nederlands komen diakritische tekens niet zo heel vaak voor, en vanouds maakten scholieren er vaak pas kennis mee als ze Frans leerden. Dat zou kunnen verklaren waarom ze, ook in het Nederlands, meestal met de Franse naam worden aangeduid. Typografen gebruiken Nederlandse namen (kuut, graaf) die van de Franse zijn afgeleid. De umlaut is natuurlijk vooral uit het Duits bekend. In de Limburgse dialecten komen diakritische tekens veel vaker voor. Zo bevat het Maastrichts in vrijwel iedere zin een diakritisch teken.

In het Nederlands zijn er:

Voor het gebruik van deze diakritische tekens, zie accenttekens in de Nederlandse spelling.

Tekens die niet in het Nederlands worden gebruikt zijn:

Soms hebben twee tekens vrijwel hetzelfde uiterlijk, terwijl ze van oorsprong zeer verschillend zijn. Dat is het geval met het trema en de umlaut: twee puntjes of twee streepjes. In zeer verzorgd drukwerk wordt onderscheid gemaakt, maar in digitale tekencoderingen zijn er geen aparte codes voor.

Samengesteld symbool

[bewerken | brontekst bewerken]

Onderstaande tabel geeft een deel van de mogelijke diakritische tekens.

  • Wat er in de kolom Afk staat is de manier om het teken samen te stellen in het typesettingpakket LaTeX dat vooral voor (technisch) wetenschappelijke teksten wordt gebruikt. LaTeX bouwt voort op TeX als een verzameling macro's.
  • In HTML gebeurt dat met:
  • In Windows kan dat door de Alt-toets (zie de kolom Alt) vast te houden terwijl men de cijfers op het numerieke eiland (NumLock áán) intoetst.
  • UTF-8 is een methode om Unicode in bytes te coderen. Wordt dit door de software geïnterpreteerd als ISO 8859-1, maar dan zonder teken voor bytes die hexadecimaal geschreven beginnen met 8 of 9, dan verschijnen de tekens die in de kolom "verkeerde weergave" staan.
  • De kolom cp geeft met een 1 aan dat de tekens in de in Nederland gebruikelijke Latin-1-codepagina beschikbaar is. De A geeft aan dat hiervoor een andere codering nodig is.[5]
  • In de laatste kolom staat een zo mogelijk Nederlandse vertaling van de benaming.
Teken Afk HTML Alt UTF-8 hexadecimaal verkeerde weergave cp Naam   Teken Afk HTML Alt UTF-8 verkeerde weergave cp Naam
à \`a à 0224 C3A0 à 1 a-grave À \`A À 0192 C380 à 1 A-grave
á \'a á 0225 C3A1 á 1 a-aigu Á \'A Á 0193 C381 à 1 A-aigu
â \^a â 0226 C3A2 â 1 a-circonflex  \^A  0194 C382 à 1 A-circonflex
ã \~a ã 0227 C3A3 ã 1 a-tilde à \~A à 0195 C383 à 1 A-tilde
ä \"a ä 0228 C3A4 ä 1 a-trema Ä \"A Ä 0196 C384 à 1 A-trema
å \oa å 0229 C3A5 Ã¥ 1 a-corona Å \oA Å 0197 C385 à 1 A-corona
ā \-a ā 0257 C481 Ä A a-macron Ā \-A Ā 0256 C480 Ä A A-macron
ă \Ua ă 0259 C483 Ä A a-breve Ă \UA Ă 0258 C482 Ä A A-breve
ą \;a ą 0261 C485 Ä A a-ogonek Ą \;A Ą 0260 C484 Ä A A-ogonek
ç \,c ç 0231 C3A7 ç 1 c-cedille Ç \,C Ç 0199 C387 à 1 C-cedille
ć \'c ć 0263 C487 Ä A c-aigu Ć \'C Ć 0262 C486 Ä A C-aigu
ĉ \^c ĉ 0265 C489 Ä A c-circonflex Ĉ \^C Ĉ 0264 C488 Ä A C-circonflex
ċ \.c ċ 0267 C48B Ä A c-puntop Ċ \.C Ċ 0266 C48A Ä A C-puntop
č \<c &#0269; 0269 C48D Ä A c-caron Č \vC &#0268; 0268 C48C Ä A C-caron
ď \vd &#0271; 0271 C48F Ä 1 d-caron Ď \vD &#0270; 0270 C48E Ä 1 D-caron
đ \-d &#0273; 0273 C491 Ä 1 d-macron Đ \-D &#0272; 0272 C490 Ä 1 D-macron
è \`e &egrave; 0232 C3A8 è 1 e-grave È \`E &Egrave; 0200 C388 à 1 E-grave
é \'e &eacute; 0233 C3A9 é 1 e-aigu É \'E &Eacute; 0201 C389 à 1 E-aigu
ê \^e &ecirc; 0234 C3AA ê 1 e-circonflex Ê \^E &Ecirc; 0202 C38A à 1 E-circonflex
ë \"e &euml; 0235 C3AB ë 1 e-trema Ë \"E &Euml; 0203 C38B à 1 E-trema
ē \-e &#0275; 0275 C493 Ä A e-macron Ē \-E &#0274; 0274 C492 Ä A E-macron
ĕ \ue &#0277; 0277 C495 Ä A e-breve Ĕ \uE &#0276; 0276 C494 Ä A E-breve
ė \.e &#0279; 0279 C497 Ä A e-puntop Ė \.E &#0278; 0278 C496 Ä A E-puntop
ę \;e &#0281; 0281 C499 Ä A e-ogonek Ę \;E &#0280; 0280 C498 Ä A E-ogonek
ě \ve &#0283; 0283 C49B Ä A e-caron Ě \vE &#0282; 0282 C49A Ä A E-caron
ĝ \vg &#0285; 0285 C49D Ä A g-circonflex Ĝ \vG &#0284; 0284 C49C Ä A G-circonflex
ğ \ug &#0287; 0287 C49F Ä A g-breve Ğ \uG &#0286; 0286 C49E Ä A G-breve
ġ \.g &#0289; 0289 C4A1 Ä¡ A g-puntop Ġ \.G &#0288; 0288 C4A0 Ä  A G-puntop
ģ \;g &#0291; 0291 C4A3 Ä£ A g-ogonek Ģ \;G &#0290; 0290 C4A2 Ä¢ A G-ogonek
ĥ \vh &#0293; 0293 C4A5 Ä¥ A h-circonflex Ĥ \vH &#0292; 0292 C4A4 Ĥ A H-circonflex
ħ \-h &#0295; 0295 C4A7 ħ A h-macron Ħ \-H &#0294; 0294 C4A6 Ħ A H-macron
ì \`i &igrave; 0236 C3AC ì 1 i-grave Ì \`I &Igrave; 0204 C38C à 1 I-grave
í \'i &iacute; 0237 C3AD í 1 i-aigu Í \'I &Iacute; 0205 C38D à 1 I-acute
î \^i &icirc; 0238 C3AE î 1 i-circonflex Î \^I &Icirc; 0206 C38E à 1 I-circonflex
ï \"i &iuml; 0239 C3AF ï 1 i-trema Ï \"I &Iuml; 0207 C38F à 1 I-trema
ĩ \~i &#0297; 0297 C4A9 Ä© A i-tilde Ĩ \~I &#0296; 0296 C4A8 Ĩ A I-tilde
ī \-i &#0299; 0299 C4AB Ä« A i-macron Ī \-I &#0298; 0298 C4AA Ī A I-macron
ĭ \ui &#0301; 0301 C4AD Ä­ A i-breve Ĭ \uI &#0300; 0300 C4AC Ĭ A I-breve
ı \i &#0305; 0305 C4B1 ı A i-puntloos
İ \.I &#0304; 0304 C4B0 Ä° A I-puntop
į \;i &#0303; 0303 C4AF į A i-ogonek Į \;I &#0302; 0302 C4AE Ä® A I-ogonek
ĵ \^j &#0309; 0309 C4B5 ĵ A j-circonflex Ĵ \^J &#0308; 0308 C4B4 Ä´ A J-circonflex
ķ \,k &#0311; 0311 C4B7 Ä· A k-cedille Ķ \,K &#0310; 0310 C4B6 Ķ A K-cedille
ĸ ??? &#0312; 0312 C4B8 ĸ A k-ra
ĺ \'l &#0314; 0314 C4BA ĺ A l-aigu Ĺ \'L &#0313; 0313 C4B9 Ĺ A L-aigu
ļ \,l &#0316; 0316 C4BC ļ A l-cedille Ļ \,L &#0315; 0315 C4BB Ä» A L-cedille
ľ \;l &#0318; 0318 C4BE ľ A l-ogonek Ľ \;L &#0317; 0317 C4BD Ľ A L-ogonek
ŀ \.l &#0320; 0320 C580 Å A l-puntna Ŀ \.L &#0319; 0319 C4BF Ä¿ A L-puntna
ł \/l &#0322; 0322 C582 Å A l-streep Ł \/L &#0321; 0321 C581 Å A L-streep
ñ \~n &ntilde; 0241 C3B1 ñ 1 n-tilde Ñ \~N &Ntilde; 0209 C391 à 1 N-tilde
ń \'n &#0324; 0324 C584 Å A n-aigu Ń \'N &#0323; 0323 C583 Å A N-aigu
ņ \,n &#0326; 0326 C586 Å A n-cedille Ņ \,N &#0325; 0325 C585 Å A N-cedille
ň \vn &#0328; 0328 C588 Å A n-caron Ň \vN &#0327; 0327 C587 Å A N-caron
ŋ \;n &#0331; 0331 C58B Å A n-ogonek Ŋ \;N &#0330; 0330 C58A Å A N-ogonek
ò \`o &ograve; 0242 C3B2 ò 1 o-grave Ò \`O &Ograve; 0210 C392 à 1 O-grave
ó \'o &oacute; 0243 C3B3 ó 1 o-aigu Ó \'O &Oacute; 0211 C393 à 1 O-aigu
ô \^o &ocirc; 0244 C3B4 ô 1 o-circonflex Ô \^O &Ocirc; 0212 C394 à 1 O-circonflex
ö \:o &ouml; 0246 C3B6 ö 1 o-trema Ö \:O &Ouml; 0214 C396 à 1 O-trema
õ \~o &otilde; 0245 C3B5 õ 1 o-tilde Õ \~O &Otilde; 0213 C395 à 1 O-tilde
ø \/o &oslash; 0248 C3B8 ø 1 o-streep Ø \/O &Oslash; 0216 C398 à 1 O-streep
ō \-o &#0333; 0333 C58D Å A o-macron Ō \-O &#0332; 0332 C58C Å A O-macron
ŏ \uo &#0335; 0335 C58F Å A o-breve Ŏ \uO &#0334; 0334 C58E Å A O-breve
ő \"o &#0337; 0337 C591 Å A o-umlaut Ő \"O &#0336; 0336 C590 Å A O-umlaut
ŕ \'r &#0341; 0341 C595 Å A r-aigu Ŕ \'R &#0340; 0340 C594 Å A R-aigu
ŗ \,r &#0343; 0343 C597 Å A r-cedille Ŗ \,R &#0342; 0342 C596 Å A R-cedille
ř \vr &#0345; 0345 C599 Å A r-caron Ř \vR &#0344; 0344 C598 Å A R-caron
ś \'s &#0347; 0347 C59B Å A s-aigu Ś \'S &#0346; 0346 C59A Å A S-aigu
ŝ \^s &#0349; 0349 C59D Å A s-circonflex Ŝ \^S &#0348; 0348 C59C Å A S-circonflex
ş \,s &#0351; 0351 C59F Å A s-cedille Ş \,S &#0350; 0350 C59E Å A S-cedille
š \vs &scaron; 0353 C5A1 Å¡ A s-caron Š \vS &Scaron; 0352 C5A0 Å  A S-caron
ţ \'t &#0355; 0355 C5A3 Å£ A t-cedille Ţ \'T &#0354; 0354 C5A2 Å¢ A T-cedille
ť \,t &#0357; 0357 C5A5 Å¥ A t-caron Ť \,T &#0356; 0356 C5A4 Ť A T-caron
ŧ \,t &#0359; 0359 C5A7 ŧ A t-macron Ŧ \,T &#0358; 0358 C5A6 Ŧ A T-macron
ù \`u &ugrave; 0249 C3B9 ù 1 u-grave Ù \`U &Ugrave; 0217 C399 à 1 U-grave
ú \'u &uacute; 0250 C3BA ú 1 u-aigu Ú \'U &Uacute; 0218 C39A à 1 U-aigu
û \^u &ucirc; 0251 C3BB û 1 u-circonflex Û \^U &Ucirc; 0219 C39B à 1 U-circonflex
ü \"u &uuml; 0252 C3BC ü 1 u-trema Ü \"U &Uuml; 0220 C39C à 1 U-trema
ũ \~u &#0361; 0361 C5A9 Å© A u-tilde Ũ \~U &#0360; 0360 C5A8 Ũ A U-tilde
ů \ou &#0367; 0367 C5AF ů A u-corona Ů \oU &#0366; 0366 C5AE Å® A U-corona
ū \-u &#0363; 0363 C5AB Å« A u-macron Ū \-U &#0362; 0362 C5AA Ū A U-macron
ŭ \uu &#0365; 0365 C5AD Å­ A u-breve Ŭ \uU &#0364; 0364 C5AC Ŭ A U-breve
ű \=u &#0369; 0369 C5B1 ű A u-umlaut Ű \=U &#0368; 0368 C5B0 Å° A U-umlaut
ų \;u &#0371; 0371 C5B3 ų A u-ogonek Ų \;U &#0370; 0370 C5B2 Ų A U-ogonek
ŵ \^w &#0373; 0373 C5B5 ŵ A w-circonflex Ŵ \^W &#0372; 0372 C5B4 Å´ A W-circonflex
ý \'y &yacute; 0253 C3BD ý 1 y-aigu Ý \'Y &Yacute; 0221 C39D à 1 Y-aigu
ÿ \"y &yuml; 0255 C3BF ÿ 1 y-trema Ÿ \"Y &Yuml; 0376 C5B8 Ÿ 1 Y-trema
ŷ \^y &#0375; 0375 C5B7 Å· A y-circonflex Ŷ \^Y &#0374; 0374 C5B6 Ŷ A Y-circonflex
ź \^z &#0378; 0378 C5BA ź A z-aigu Ź \^Z &#0377; 0377 C5B9 Ź A Z-aigu
ż \.z &#0380; 0380 C5BC ż A z-puntop Ż \.Z &#0379; 0379 C5BB Å» A Z-puntop
ž \vz &#0382; 0382 C5BE ž A z-caron Ž \vZ &#0381; 0381 C5BD Ž A Z-caron
æ \Ae &aelig; 0230 C3A6 æ 1 ae-ligatuur Æ \AE &AElig; 0198 C386 à 1 AE-ligatuur
œ \Oe &oelig; 0156 C593 Å A oe-ligatuur Œ \OE &OElig; 0140 C592 Å A OE-ligatuur
ij \Ij &#0307; 0307 C4B3 ij A ij-ligatuur IJ \IJ &#0306; 0306 C4B2 IJ A IJ-ligatuur
ß \ss &szlig; 0223 C39F Ä 1 Ringel s ? &#7838; geen E1BA9F ẠA Ringel S

Complicaties bij computergebruik

[bewerken | brontekst bewerken]

Diakritische tekens worden soms weggelaten in bijvoorbeeld URL's, e-mailadressen, en transactiegegevens in het betalingsverkeer (naam rekeninghouder en omschrijving transactie). Soms zijn ze technisch niet mogelijk, en anders kunnen ze vaak complicaties geven, met name in de genoemde voorbeelden van communicatie, waar andere partijen met uiteenlopende software bij betrokken zijn. Zie ook Eenvoudige tekensets.

De verschillende coderingen kunnen resulteren in een verkeerde weergave. In 2015 stond in een advertentie het woord prandeacute, wat in geen enkel woordenboek stond. Bedoeld was pré, wat in HTML geschreven werd als pr&eacute;. Kennelijk had een applicatie het teken & veranderd in and, wat in het merkwaardige woord resulteerde.[6]

  • Unicode pagina's met afbeeldingen en coderingen van symbolen