Table des caractères Unicode/U0B00

Données clés
U+0000-0FFF	U+8000-8FFF
U+1000-1FFF	U+9000-9FFF
U+2000-2FFF	U+A000-AFFF
U+3000-3FFF	U+B000-BFFF
U+4000-4FFF	U+C000-CFFF
U+5000-5FFF	U+D000-DFFF
U+6000-6FFF	U+E000-EFFF
U+7000-7FFF	U+F000-FFFF
U+0000-0FFF	plan 0 (PMB/BMP)
U+10000-10FFF	plan 1 (PMC/SMP)
U+20000-20FFF	plan 2 (PSC/SIP)
U+30000-30FFF	plan 3 (PST/TIP)
U+40000-DFFFF	plans 4 à 13 (réservés)
U+E0000-E0FFF	plan 14 (PCS/SSP)
U+F0000-F0FFF	plan 15 (privé A)
U+100000-100FFF	plan 16 (privé B)

Table des caractères Unicode U+0B00 à U+0B7F (2 816 à 2 943 en décimal).

Oriyâ (ou odia) (Unicode 1.1 à 6.0)

Caractères utilisés pour l’écriture avec l’alphasyllabaire (ou abugida) oriyâ (ou odia) : signes diacritiques, voyelles indépendantes, consonnes, signes divers, voyelles diacritiques simples, voyelles diacritiques scindées, virâma, signes de longueur, consonnes supplémentaires, voyelles supplémentaires pour le sanskrit, voyelles dépendantes, chiffres décimaux, signe divers, consonne supplémentaire, signes fractionnaires.

Depuis 2012, en Inde, cette écriture, qui est aussi une langue, s’appelle officiellement « odia ». En raisons de règles de stabilité des normes Unicode/ISO/CEI 10646, ce changement terminologique n’affecte pas le bloc Unicode ou les noms des caractères, utilisant le terme « oriyâ » qui avait été normalisé auparavant.

Les caractères U+0B01 à U+0B03, U+0B3C, U+0B3E à U+0B43, U+0B47 et U+0B48, U+0B4B à U+0B4D, U+0B55 à U+0B57, U+0B62 et U+0B63 sont des signes diacritiques se combinant avec le caractère qu’ils suivent ; ils sont présentés ici combinés avec la lettre oriya ka « କ » (U+0B15).

Le diacritique U+0B57 (signe de longueur aou) est normalement visuellement indiscernable de l’association des deux diacritiques U+0B3E (voyelle diacritique â, à droite) et U+0B56 (signe de longueur aï, au-dessus) ; cependant cette identité visuelle n’est pas traitée comme canoniquement équivalente par Unicode.

Au contraire, le diacritique U+0B48 (voyelle diacritique aï) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B56 (signe de longueur aï, au dessus) ; le diacritique U+0B4B (voyelle diacritique ô) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B3E (voyelle diacritique â, à droite) ; le diacritique U+0B4C (voyelle diacritique aou) est totalement équivalent aux deux diacritiques U+0B47 (voyelle diacritique é, à gauche) et U+0B57 (signe de longueur aou, à droite et au-dessus).

Note : certains navigateurs ne gèrent pas correctement l’affichage des voyelles oriyâ (ou odia) normalement placées à gauche de la lettre de base (U+0B47, U+0B48) ou décomposables en deux parties à gauche et à droite (U+0B4B, U+0B4C), même si les polices de caractères adéquates sont installées. Cela cause des problèmes sérieux d'interprétation du texte à la lecture.

Table des caractères

v · d · m en fr	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0B00		କଁ	କଂ	କଃ		ଅ	ଆ	ଇ	ଈ	ଉ	ଊ	ଋ	ଌ			ଏ
U+0B10	ଐ			ଓ	ଔ	କ	ଖ	ଗ	ଘ	ଙ	ଚ	ଛ	ଜ	ଝ	ଞ	ଟ
U+0B20	ଠ	ଡ	ଢ	ଣ	ତ	ଥ	ଦ	ଧ	ନ		ପ	ଫ	ବ	ଭ	ମ	ଯ
U+0B30	ର		ଲ	ଳ		ଵ	ଶ	ଷ	ସ	ହ			କ଼	ଽ	କା	କି
U+0B40	କୀ	କୁ	କୂ	କୃ	କୄ			କେ	କୈ			କୋ	କୌ	କ୍
U+0B50						କ୕	କୖ	କୗ					ଡ଼	ଢ଼		ୟ
U+0B60	ୠ	ୡ	କୢ	କୣ			୦	୧	୨	୩	୪	୫	୬	୭	୮	୯
U+0B70	୰	ୱ	୲	୳	୴	୵	୶	୷

Historique

Version initiale Unicode 1.1

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0B00		କଁ	କଂ	କଃ		ଅ	ଆ	ଇ	ଈ	ଉ	ଊ	ଋ	ଌ			ଏ
U+0B10	ଐ			ଓ	ଔ	କ	ଖ	ଗ	ଘ	ଙ	ଚ	ଛ	ଜ	ଝ	ଞ	ଟ
U+0B20	ଠ	ଡ	ଢ	ଣ	ତ	ଥ	ଦ	ଧ	ନ		ପ	ଫ	ବ	ଭ	ମ	ଯ
U+0B30	ର		ଲ	ଳ			ଶ	ଷ	ସ	ହ			କ଼	ଽ	କା	କି
U+0B40	କୀ	କୁ	କୂ	କୃ				କେ	କୈ			କୋ	କୌ	କ୍
U+0B50							କୖ	କୗ					ଡ଼	ଢ଼		ୟ
U+0B60	ୠ	ୡ					୦	୧	୨	୩	୪	୫	୬	୭	୮	୯
U+0B70	୰

Compléments Unicode 4.0

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0B30						ଵ
U+0B70		ୱ

Compléments Unicode 5.1

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0B40					କୄ
U+0B60			କୢ	କୣ

Compléments Unicode 6.0

v · d · m	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
U+0B70			୲	୳	୴	୵	୶	୷

Voir aussi

Liens externes

(en) [PDF] Oriya, table sur le site Unicode.
(fr) [PDF] Oriya, table sur le site Unicode.

Articles connexes

Blocs de caractères Unicode pour les écritures asiatiques méridionales dérivées de l’alphasyllabaire brahmî[ modifier ]

Blocs de caractères Unicode contenant des chiffres ou nombres[ modifier ]

Caractères ajoutés ou supprimés dans Unicode 1.1 (partiellement obsolète)^[1][ modifier ]

Nouveaux blocs ajoutés (normalisés plus tard après l’unification de la norme ISO/CEI 10646-1 avec le standard Unicode 2.0) :

Tibétain (codage Unicode 1.1 de U+1000 à U+104F obsolète, car cet ancien bloc a été supprimé dans Unicode 2.0, les caractères tibétains ayant été normalisés différemment dans un nouveau bloc ajouté dans Unicode 2.0 ; cet ancien bloc sera ensuite totalement couvert par le nouveau bloc « Birman » ajouté dans Unicode 3.0)
Sinogrammes unifiés CJC : 1^re partie, 2^e partie, 3^e partie, 4^e partie, 5^e partie, 6^e partie
Sinogrammes de compatibilité unifiés CJC
Formes de compatibilité unifiés CJC

Caractères ajoutés dans des blocs existants :

Caractères supprimés dans des blocs existants :

Cyrillique (4 caractères supprimés, même si 4 caractères ont été réintroduits et normalisés à l’identique dans Unicode 3.2)

Caractères ajoutés dans Unicode 4.0^[1][ modifier ]

Nouveaux blocs ajoutés :

Nouveaux caractères dans des blocs existants :

Caractères ajoutés dans Unicode 5.1^[1][ modifier ]

Nouveaux blocs ajoutés :

Nouveaux caractères dans des blocs existants :

Caractères ajoutés dans Unicode 6.0^[1][ modifier ]

Notes et références

↑ ^{a b c et d} DerivedAge.txt, base de données sur le site Unicode.

[unicode-age-1] {a b c et d} DerivedAge.txt, base de données sur le site Unicode.

[1]