Table des caractères Unicode/U0B00
Table des caractères Unicode U+0B00 à U+0B7F (2 816 à 2 943 en décimal).
Oriyâ (ou odia) (Unicode 1.1 à 6.0)
[modifier | modifier le code]Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) oriyâ (ou odia) : signes diacritiques, voyelles indépendantes, consonnes, signes divers, voyelles diacritiques simples, voyelles diacritiques scindées, virâma, signes de longueur, consonnes supplémentaires, voyelles supplémentaires pour le sanskrit, voyelles dépendantes, chiffres décimaux, signe divers, consonne supplémentaire, signes fractionnaires.
Depuis 2012, en Inde, cette écriture, qui est aussi une langue, s’appelle officiellement « odia ». En raisons de règles de stabilité des normes Unicode/ISO/CEI 10646, ce changement terminologique n’affecte pas le bloc Unicode ou les noms des caractères, utilisant le terme « oriyâ » qui avait été normalisé auparavant.
Les caractères U+0B01 à U+0B03, U+0B3C, U+0B3E à U+0B43, U+0B47 et U+0B48, U+0B4B à U+0B4D, U+0B55 à U+0B57, U+0B62 et U+0B63 sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont présentés ici combinés avec la lettre oriya ka « କ » (U+0B15).
Le diacritique U+0B57 (signe de longueur aou) est normalement visuellement indiscernable de l’association des deux diacritiques U+0B3E (voyelle diacritique â, à droite) et U+0B56 (signe de longueur aï, au-dessus) ; cependant cette identité visuelle n’est pas traitée comme canoniquement équivalente par Unicode.
Au contraire, le diacritique U+0B48 (voyelle diacritique aï) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B56 (signe de longueur aï, au dessus) ; le diacritique U+0B4B (voyelle diacritique ô) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B3E (voyelle diacritique â, à droite) ; le diacritique U+0B4C (voyelle diacritique aou) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B57 (signe de longueur aou, à droite et au-dessus).
Note : certains navigateurs ne gèrent pas correctement l’affichage des voyelles oriyâ (ou odia) normalement placées à gauche de la lettre de base (U+0B47, U+0B48) ou décomposables en deux parties à gauche et à droite (U+0B4B, U+0B4C), même si les polices de caractères adéquates sont installées. Cela cause des problèmes sérieux d'interprétation du texte à la lecture.
Table des caractères
[modifier | modifier le code] en fr | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0B00 | କଁ | କଂ | କଃ | ଅ | ଆ | ଇ | ଈ | ଉ | ଊ | ଋ | ଌ | ଏ | ||||
U+0B10 | ଐ | ଓ | ଔ | କ | ଖ | ଗ | ଘ | ଙ | ଚ | ଛ | ଜ | ଝ | ଞ | ଟ | ||
U+0B20 | ଠ | ଡ | ଢ | ଣ | ତ | ଥ | ଦ | ଧ | ନ | ପ | ଫ | ବ | ଭ | ମ | ଯ | |
U+0B30 | ର | ଲ | ଳ | ଵ | ଶ | ଷ | ସ | ହ | କ଼ | ଽ | କା | କି | ||||
U+0B40 | କୀ | କୁ | କୂ | କୃ | କୄ | କେ | କୈ | କୋ | କୌ | କ୍ | ||||||
U+0B50 | କ୕ | କୖ | କୗ | ଡ଼ | ଢ଼ | ୟ | ||||||||||
U+0B60 | ୠ | ୡ | କୢ | କୣ | ୦ | ୧ | ୨ | ୩ | ୪ | ୫ | ୬ | ୭ | ୮ | ୯ | ||
U+0B70 | ୰ | ୱ | ୲ | ୳ | ୴ | ୵ | ୶ | ୷ |
Historique
[modifier | modifier le code]Version initiale Unicode 1.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0B00 | କଁ | କଂ | କଃ | ଅ | ଆ | ଇ | ଈ | ଉ | ଊ | ଋ | ଌ | ଏ | ||||
U+0B10 | ଐ | ଓ | ଔ | କ | ଖ | ଗ | ଘ | ଙ | ଚ | ଛ | ଜ | ଝ | ଞ | ଟ | ||
U+0B20 | ଠ | ଡ | ଢ | ଣ | ତ | ଥ | ଦ | ଧ | ନ | ପ | ଫ | ବ | ଭ | ମ | ଯ | |
U+0B30 | ର | ଲ | ଳ | ଶ | ଷ | ସ | ହ | କ଼ | ଽ | କା | କି | |||||
U+0B40 | କୀ | କୁ | କୂ | କୃ | କେ | କୈ | କୋ | କୌ | କ୍ | |||||||
U+0B50 | କୖ | କୗ | ଡ଼ | ଢ଼ | ୟ | |||||||||||
U+0B60 | ୠ | ୡ | ୦ | ୧ | ୨ | ୩ | ୪ | ୫ | ୬ | ୭ | ୮ | ୯ | ||||
U+0B70 | ୰ |
Compléments Unicode 4.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0B30 | ଵ | |||||||||||||||
U+0B70 | ୱ |
Compléments Unicode 5.1
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | ||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0B40 | କୄ | ||||||||||||||||
U+0B60 | କୢ | କୣ |
Compléments Unicode 6.0
[modifier | modifier le code]0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
U+0B70 | ୲ | ୳ | ୴ | ୵ | ୶ | ୷ |
Voir aussi
[modifier | modifier le code]Liens externes
[modifier | modifier le code]Articles connexes
[modifier | modifier le code]- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Singhalais
- Limbou
- Taï tham (ou lanna)
- Sylotî nâgrî
- Saurachtra
- Dévanâgarî étendu
- Meitei mayek – extensions
- Meitei mayek
- Brahmî
- Kaïthî
- Chakma
- Charada
- Singhalais – nombres archaïques
- Multanais (ou multanî)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Siddham
- Tâkrî
- Dévanâgarî étendu – A
- Commandes C0 et latin de base
- Commandes C1 et latin étendu – 1
- Arabe
- N’ko
- Dévanâgarî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Kannara (ou kannada)
- Malayâlam
- Thaï
- Lao (ou laotien)
- Tibétain
- Birman
- Éthiopien
- Khmer (ou cambodgien)
- Mongol (ou bitchig)
- Limbou
- Nouveau taï-lue
- Khmers (ou cambodgien) – symboles
- Taï tham (ou lanna)
- Balinais
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Exposants et indices
- Formes numérales
- Alphanumériques délimités
- Casseau
- Ponctuation CJC
- Kanboun
- Lettres et mois CJC délimités
- Compatibilité CJC
- Vaï
- Bamoun
- Formes numériques communes indiennes
- Saurachtra
- Dévanâgarî étendu
- Kayah-li
- Javanais
- Cham
- Meitei mayek
- Formes de demi et pleine chasse
- Grec – nombres égéens
- Grec – nombres antiques
- Copte – nombres épactes
- Vieil italique
- Gotique
- Cunéiforme persépolitain (vieux perse)
- Néwar (ou newari, prachalit népalais, nepalbhasha, nepāla lipi)
- Osmanya
- Araméen impérial
- Phénicien
- Kharochthî
- Ancien sud-arabique
- Parthe des inscriptions
- Pehlevi des inscriptions
- Hanifi
- Arabe – symboles numéraux rûmîs (chiffres de Fès)
- Brahmî
- Sora sompeng
- Chakma (ou changma, ojhapath)
- Charada (ou shard)
- Singhalais – nombres archaïques
- Tâkrî
- Cunéiforme – nombres et ponctuation
- Mrou
- Chiffres-bâtonnets chinois
- Symboles mathématiques alphanumériques
- Adlam
- Alphanumériques délimités – supplément
Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :
- Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Sinogrammes de compatibilité unifiés CJC
- Formes de compatibilité unifiés CJC
Caractères ajoutés dans des blocs existants :
Caractères supprimés dans des blocs existants :
- Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)
Nouveaux blocs ajoutés :
- Limbou
- Latin étendu – extensions phonétiques
- Linéaire B – syllabaire
- Linéaire B – idéogrammes
- Grec – nombres égéens
- Ougaritique
- Shavien
- Osmanya
- Sélecteurs de variante – supplément
- ...
Nouveaux caractères dans des blocs existants :
- Latin étendu – B
- Latin étendu – alphabet phonétique international
- Lettres modificatives avec chasse
- Diacritiques
- Grec et copte
- Arabe
- Syriaque
- Dévanagârî
- Bengalî
- Gourmoukhî
- Goudjarati (ou gujarâtî)
- Oriyâ (ou odia)
- Tamoul
- Kannara (ou kannada)
- Khmer (ou cambodgien)
- Ponctuation générale
- Signes techniques divers
- Lettres et mois CJC délimités
Nouveaux blocs ajoutés :
- Soundanais
- Lepcha
- Ol tchiki (ou santâlî)
- Vaï
- Cyrillique étendu – A
- Cyrillique étendu – B
- Saurachtra
- Kayah-li
- Redjang (ou rejang)
- Cham
- Symboles antiques
- Disque de Phaïstos
- Lycien
- Carien
- Lydien
- Tuiles de mah-jong
- Dominos
Nouveaux caractères dans des blocs existants :
- Grec et copte
- Cyrillique
- Cyrillique – supplément
- Arabe
- Arabe – supplément
- Dévanâgarî
- Gourmoukhî
- Oriyâ (ou odia)
- Tamoul
- Télougou
- Malayâlam
- Tibétain
- Birman
- Mongol (ou bitchig)
- Latin étendu – supplément phonétique
- Diacritiques – supplément
- Latin étendu – supplément
- Ponctuation générale
- Diacritiques pour symboles
- Symboles de type lettres
- Formes numérales
- Symboles divers
- Symboles mathématiques divers – A
- Symboles divers et flèches
- Latin étendu – C
- Ponctuation – supplément
- Bopomofo
- Sinogrammes unifiés CJC – traits
- Sinogrammes unifiés CJC : 1re partie, 2e partie, 3e partie, 4e partie, 5e partie, 6e partie
- Lettres modificatives de ton
- Latin étendu – D
- Demi-signes diacritiques
- Symboles musicaux byzantins
- Symboles musicaux occidentaux
Nouveaux blocs ajoutés :
- Mandéen
- Batak
- Éthiopien étendu – A
- Brahmî
- Bamoun (ou bamoum, shü-mom) – supplément
- Katakana – supplément phonétique
- Cartes à jouer
- Symboles et pictogrammes divers
- Émoticônes
- Symboles du transport et cartographiques
- Symboles alchimiques
- Sinogrammes unifiés CJC – supplément D
Nouveaux caractères dans des blocs existants :
- Cyrillique – supplément
- Arabe
- Dévanâgarî
- Oriyâ (ou odia)
- Malayâlam
- Tibétain
- Éthiopien
- Diacritiques – supplément
- Exposants et indices
- Symboles monétaires
- Signes techniques divers
- Symboles divers
- Casseau
- Symboles mathématiques divers – A
- Tifinagh
- Bopomofo étendu
- Cyrillique étendu – B
- Latin étendu – D
- Formes de présentation arabes – A
- Alphanumériques délimités – supplément
- Sinogrammes CJC délimités – supplément
Notes et références
[modifier | modifier le code]- DerivedAge.txt, base de données sur le site Unicode.