Langues romanes

On nomme langue romane toute langue issue essentiellement du latin vulgaire (au sens étymologique de « populaire »), c'est-à-dire la forme de latin vernaculaire utilisée pour la communication de tous les jours, par opposition au latin classique et littéraire ; ce sont donc des langues indo-européennes. Ces langues ont été parlées ou le sont encore dans un ensemble géographique désigné par le terme de Romania, couvrant en grande partie le sud européen de l'ancien Empire romain ; roman(e) comme Romania remontent bien sûr à des dérivés de l'adjectif latin romanus : l'on considérait en effet que leurs locuteurs utilisaient une langue issue de celle des Romains, par opposition à d'autres présentes dans les territoires de l'ancien Empire, comme le francique en France, langue des Francs appartenant à la famille des langues germaniques. La première attestation du terme de roman, sous une forme ou une autre, remonte au synode de Tours, en 813 de notre ère ; c'est lors de ce synode que la première langue vulgaire à s'être détachée du latin est désignée ; il s'agit d'une forme de proto-français, que l'on nomme romana lingua, ou encore roman. Le français est donc la première langue romane attestée.

L'on date grosso modo l'évolution du latin vulgaire vers les langues romanes ainsi :

entre -200 et 400 environ : différentes formes de latin vulgaire ;
entre 500 et 600 : ces formes commencent à se différencier nettement ;
vers 800 : l'existence de langues romanes est reconnue (synode de Tours) ;
842 : premier texte complet rédigé en une langue romane (le roman, forme de protofrançais), les Serments de Strasbourg.

Les langues romanes partagent un ensemble de traits communs donnant une bonne cohérence à cette famille de langues, parmi lesquels les plus importants sont :

un lexique principalement issu du latin vulgaire avec divers substrats dont le gaulois pour toutes les langues romanes sauf le roumain ;
une réorganisation du système vocalique latin (par diphtongaison, apophonie et syncope principalement) ;
des phénomènes importants de palatalisation des consonnes ;
la disparition quasi complète du neutre ;
une réorganisation importante du système verbal, par le développement, notamment, de verbes auxiliaires, la suppression du futur latin, la création d'un futur périphrastique formé à partir du verbe avoir (chanter-as → chanteras), celle d'un conditionnel ;
le développement des articles, inconnus du latin.

Liste des langues romanes

Les langues romanes sont classées en neuf groupes, chacun pouvant comprendre plusieurs « dialectes » ; il faut noter que le choix d'un de ces dialectes comme langue officielle est purement politique et, surtout, récent dans de nombreux pays (sauf en France, par l'édit de Villers-Cotterêts). Quoi qu'il en soit, les langues romanes forment un continuum de nombreuses langues dont les différences sont parfois minimes ; il est toujours possible de distinguer au sein d'un ensemble ce que l'on nommera un ou plusieurs « dialectes », mais la liste suivante se limitera aux langues les plus connues (entre parenthèses : nom dans la langue envisagée, date de la première attestation connue) :

ibéro-roman :
- castillan (castellano ; X^e s. : Glosas emilianenses et Glosas silenses) : l'une des langues officielles de l'Espagne ; souvent nommé, à tort, « espagnol », puisque l'Espagne n'a plus une seule langue officielle, chaque communauté autonome pouvant uitiliser la sienne ; n'a que très peu de dialectes et s'avère très conservateur,
- portugais (português ; XII^e s. : docs. juridiques) : langue officielle du Portugal, il possède encore moins de dialectes différenciés que le castillan ; encore plus conservateur que le castillan,
- galicien (galego ; XII^e s.) : dialecte portugais parlé en Espagne, peut-être à l'origine du portugais ; portugais et galicien archaïques ne formaient qu'une seule langue au Moyen Âge,

italo-roman
- italien (italiano ; X^e s. : docs. juridiques, XI^e s. : texte complet) : très nombreux dialectes (plus de deux cents) ; le toscan florentin, promu par Dante au XIII^e s., constitue la base de la langue officielle italienne ;
- corse : parlé en Corse et en Sardaigne.

illyro-roman (ou dalmate ; veklisuṅ pour le dialecte septentrional ; attestations indirectes fin XIII^e s., directe : vers 1840) ; langue éteinte à la mort du dernier locuteur en 1898) : parlé autrefois dans certaines villes côtières de l'ancienne Yougoslavie ; comprenait deux dialectes recensés :
- végliote, au nord,
- ragusain, au sud ;

gallo-roman. On trouve dans cette famille de nombreux dialectes appartenant au groupe des langues d'oïl (parfois dénomés de manière péjorative patois) :
- français (842 : Serments de Strasbourg, 881 : prem. txt. litt. Cantilène de sainte Eulalie, XI^e s. : prem. txt. en ancien français Vie de saint Léger) : la langue officielle de la France; de la Belgique en concurrence avec l'allemand et le néerlandais; de la Suisse avec l'allemand, l'italien et le romanche; du Val d'Aoste avec l'italien; du Luxembourg avec le luxembourgeois; des îles anglo-normandes avec l'anglais) correspond principalement à un ensemble de traits d'oïl provenant de divers dialectes répartis historiquement autour de Paris ; dans les faits, la langue actuelle est très composite et doit beaucoup à une langue littéraire interrégionale. L'existence d'un dialecte francien à l'origine du français est un mythe du XIX^e s. qui n'a plus cours,
- gallo : parlé en France en Bretagne;
- normand : parlé en France en Normandie; aux îles anglo-normandes, dont le jersiais, le guernesiais et le sercquiais;
- picard (cht'i ; vers les XII^e, XIII^e s.) : parlé en France dans le Nord-Pas-de-Calais et en Picardie, ainsi que dans l'ouest de la Wallonie ; en Belgique, il a le statut de langue régionale, tandis qu'en France il est considéré comme une langue de France ;
- poitevin-saintongeais : parlé en France dans le Poitou-Charentes et Saintonge ;
- wallon (walon ; vers les XII^e, XIII^e s.) : parlé principalement en Belgique, où il a le statut de langue régionale;

franco-provençal (francoprovensal ou, mieux, arpitan ; XIII^e s. : Méditations de Marguerite d'Oingt) : ensemble de langues réparties entre l'Italie (Val d'Aoste, Piémont), la Suisse (autour des cantons de Fribourg, du Valais, de Vaud et de Genève), la France (Dauphinois, Lyonnais, Savoie) ; le franco-provençal semble être à la croisée entre langues d'oïl et d'oc. Il est en voie d'extinction ;

occitano-roman ou occitano-catalan :
- occitan (occitan ; ou langue d'oc ; fin du X^e s. : docs. juridiques ; 1102 : prem. txt. complet) : le terme peut désigner un ensemble de dialectes dits langues d'oc ─ principalement le nord-occitan (limousin, auvergnat), le moyen-occitan (languedocien, provençal) et le gascon ─ connus en France sous l'appellation dépréciative de « patois » ; le vieux catalan et l'occitan médiéval ne constituaient qu'une seule langue ; c'est seulement entre la fin du XII^e et le début du XIV^e siècle que les deux langues se sont nettement séparées,
- catalan (català ; fin du IX^e siècle : traces de vulgarismes catalans dans des texte latin ; fin du XII^e s. : prem. txt. complet dans un doc. juridique ; XIII^e s. : sous l'égide de Ramon Llull, le catalan accède au statut de langue littéraire et de pensée reconnue) : l'une des langues officielles de la Catalogne (Espagne) ; il est parlé principalement dans cette Communauté autonome et dans celle de Valence, ainsi qu'aux Îles Baléares, en Andorre (où il est la seule langue officielle), dans le Roussillon (France), et à Alguer (Sardaigne) ;

rhéto-roman (XII^e s.) :
- dialectes romanches (rumantsch) : sursilvan (haute vallée du Rhin), le sutsilvan et le surmiran (centre du canton des Grisons), le puter et le vallader (Engadine) forment les cinq dialectes écrits ; ils sont parlés en Suisse (dans les Grisons) par environ 45 000 personnes. le premier texte en puter a été écrit en 1527 à Zuoz (La chanzun da la guerra dal chasté da Müsch), le premier en vallader en 1560 à Susch.
  - interromanche (rumantsch grischun) : forme de lingua franca romanche utilisée en Suisse pour unifier la vingtaine de dialectes romanches ; il s'appuie sur en grande partie sur le sursilvan, le vallader et le surmiran ; l'interromanche est une langue officielle en Suisse dans le canton des Grisons,
- dialectes ladins (ladin) : utilisé dans les Dolomites italiennes,
- frioulan (furlan) : parlé dans la province italienne d'Udine ; frioulan et ladin n'ont qu'un statut de langue régionale ;

roumain (română ; attestations partielles au XII^e s., complète au XV^e) : langue de l'ancienne province romaine de Dacie coupée du reste de la Romania ; le superstrat slave reste d'importance faible et le roumain s'avère assez conservateur ; c'est en cela qu'il est relativement différent des autres langues romanes ; on considère qu'il possède principalement quatre dialectes :
- daco-roumain, ce que l'on appelle généralement le roumain ; c'est la langue officielle de la Roumanie et la Moldavie, et langue coofficiele en Voïvodine (Serbie-et-Monténégro).
- istrio-roumain, parlé en Istrie (en voie d'extinction),
- mégléno-roumain (ou méglénite), parlé en Macédoine,
- macédo-roumain (ou aroumain), parlé principalement en Albanie, Serbie, Macédoine, Thessalie (Grèce) et Roumanie ;

sarde (sardu, limba sarda ; XI^e s.) : parlé en Sardaigne ; c'est une des langues romanes des plus conservatrices, ce que l'on explique par son statut de lieu isolé ; il a connu de nombreux substrats, parmi lesquels le catalan, le castillan puis l'italien les plus importants ; on distingue plusieurs dialectes :
- campidanien,
- logoudorien, qui constitue la langue considérée classique,
- nuorais ; ces deux derniers dialectes sont plus archaïsants que le premier.

Du latin classique au latin vulgaire

Quelques modifications phonétiques propres au latin vulgaire

À propos du latin vulgaire, il convient de noter que les Romains vivaient en situation de diglossie : la langue de tous les jours n'est plus le latin classique, celui des textes littéraires ou sermo urbanus (« langue de la ville », c'est-à-dire « raffinée »), figé par la grammaire comme l'a été le sanskrit, mais une forme distincte bien que très proche, au développement plus libre, le sermo plebeius (« langue vulgaire »). Il semble acquis que le latin classique ne se limitait pas à un emploi livresque, mais qu'il était parlé par les catégories sociales élevées, tandis que le sermo plebeius était la langue des sodats, des commerçants, du petit peuple ; n'ayant jamais accédé au statut de langue littéraire, le latin vulgaire nous est surtout connu par la phonétique historique, des citations et des critiques prononcées par les tenants d'un latin littéraire ainsi que de nombreuses inscriptions, des registres, comptes et autres textes courants. D'autre part, le Satyricon de Pétrone, sorte de « roman » écrit vraisemblablement au premier siècle de notre ère et se passant dans les milieux interlopes de la société romaine, est un témoignage important de cette diglossie : selon leur catégorie sociale, les personnages s'y expriment dans une langue plus ou moins proche de l'archétype classique.

Parmi les textes qui ont blâmé les formes jugées décadentes et fautives, il faut retenir l'Appendix Probi, sorte de compilation d'« erreurs » fréquentes relevées par un certain Probus et datant du III^e siècle de notre ère. Ce sont bien ces formes, et non leur équivalent en latin classique, qui sont à l'origine des mots utilisés dans les langues romanes. Voici quelques exemples de « fautes » citées par Probus (selon le modèle : A non B, « [dites] A et non B »), classées ici par type d'évolution phonétique et assorties de commentaires permettant de signaler les principales différences phonologiques entre le latin classique et le latin vulgaire ; il n'est bien sûr pas possible d'être exhaustif en la matière et de référencer toutes les différences entre le latin classique et le latin vulgaire, mais l'Appendix Probi peut constituer une introduction pertinente sur le sujet :

1. calida non calda, masculus non masclus, tabula non tabla, oculus non oclus, etc.

Ces exemples montrent l'amuïssement des voyelles post-toniques (et aussi pré-toniques) brèves ; les mots latins sont en effet accentués cálida, másculus, tábula et óculus, la voyelle suivante étant brève. Cet amuïssement prouve aussi que l'accent de hauteur du latin classique est devenu un accent d'intensité en latin vulgaire (en effet, un accent de hauteur n'a pas d'influence sur les voyelles atones environnantes). L'on reconnaît dans cette liste les ancêtres de chaude (ancien français chalt), mâle (ancien français masle), table et œil ; ce processus a donné naissance à des transformations importantes des consonnes entrées en contact après la chute de la voyelle les séparant : ainsi, un /l/ devant consonne est passé à /l/ vélaire (soit /ɫ/) puis à /u/ en français (vocalisation), d'où chaud ; de même, /kl/ a pu donner un /l/ palatalisé (voir au point 2) ;

2. vinea non vinia, solea non solia, lancea non lancia, etc.

L'on voit là le passage en latin vulgaire de /e/ bref devant voyelle à /j/ (son initial de yacht ; le phénomène est nommé consonification) qui, après consonne, la palatalise ; ces consonnes palatalisées (qui peuvent provenir d'autres sources), sont importantes dans l'évolution des langues romanes. Cette transformation explique pourquoi l'on obtient, par exemple, vigne (avec /nj/ devenant /ɲ/, noté dans les langues romanes par le digramme gn en français, ñ en castillan, ny en catalan, nh en portugais et occitan, etc.), seuil (avec anciennement un /l/ palatal, soit /ʎ/, noté par ill / il en français, devenu ensuite un simple /j/, conservé en castillan, où il est noté ll, double l [sauf quand il provient de /lj/, où il passe à /x/, phonème dit jota], comme en catalan, en portugais et occitan, écrit lh, etc.), et lance (avec le son /s/ issu de /ts/, forme palatalisée de /k/, que notait bien la lettre c latine ; de même en castillan lanza /lanθa/, anciennement lança /lantsa/, ou en roumain lance /lanʧe/, etc.) ;

3. auris non oricla.

Probus note dans cet exemple plusieurs phénomènes : premièrement la réduction des anciennes diphtongues (ici /au/ devenant /ɔ/, soit /o/ ouvert ; l'on a aussi en latin vulgaire /ae/ donnant /ɛ/, /e/ ouvert, ainsi que /oe/ passant à /e/, /e/ fermé), puis l'utilisation d'une forme de diminutif au lieu de la forme simple (auris : « oreille », auricula : « petite oreille »). L'utilisation des diminutifs en latin vulgaire est fréquente : ainsi soleil vient de solic(u)lu(m) et non de sol, ou encore genou de genuc(u)lu(m) et non de genu. Enfin, on note l'amuïssement du /u/ bref devant voyelle accentuée : on attendrait oricula. Comme on l'a dit en 1, la rencontre de c et l, /kl/, causée par la chute de la voyelle les séparant, donne naissance à une nouvelle consonne, ici un /l/ palatal, devenu /j/ en français mais /x/ en castillan, dans oreja /ɔrexa/) ;

4. auctor non autor.

On remarque aussi des réductions de groupes de consonnes ; ainsi, /kt/ passe à /t/, donnant en français auteur, ou autor en castillan et catalan ; de même, /pt/ passe à /t/. C'est le cas dans dom(i)tare devenu domtar puis domptar et enfin dontar. L'insertion d'un /p/ entre /m/ et une occlusive est normale : on parle d'une épenthèse, donnant en français dompter que l'on prononçait /dõte/ avant que l'orthographe n'influence la prononciation, devenant parfois /dõpte/. Autre simplification : /pt/ donne /t/, comme dans comp(u)tare devenu comptare puis compter et conter /kõte/ en français, contar en castillan, etc.

5. rivus non rius, sibilus non sifilus.

Le son /w/ du latin, noté par la lettre u (ou v dans les éditions modernes) a évolué de manières diverses, soit en s'amuïssant entre voyelles (ri(v)us donnant rio en castillan, pa(v)or donnant peur, italien paura), en devenant une spirante bilabiale sonore (/β̞/, en castillan et catalan) puis se renforçant en /v/ (dans la majorité des langues romanes) ; /p/ et /b/ entre voyelles connaissent le même sort, ce qui explique que sibilus donne sifilus, sachant que /f/ n'est que la variante sourde de /v/ ; ainsi explique-t-on siffler (de sibilare, devenant sifilare puis siflare) ou savoir (de sapere, puis sabere, savere ; le castillan saber montre, par son orthographe, qu'il en est resté au stade /β̞/), etc.

6. pridem non pride.

Dernier exemple (la liste n'est bien sûr pas exhaustive, loin de là) montrant que le /m/ en fin de mots n'est plus prononcé (ce qui est déjà le cas en latin classique : la scansion du vers latin le prouve facilement). Cet amuïssement est, entre autres, à l'origine de la disparition du mécanisme des flexions : les langues romanes, en effet, n'utilisent plus la déclinaison.

Cette liste n'est bien sûr pas exhaustive ; il faudrait aussi aborder la question de la diphtongaison « pan-romane » (que toutes les langues romanes ont connue) et signaler que nombre de voyelles ont subi par la suite des diphtongaisons secondaires.

Transformations en profondeur du système morpho-syntaxique

Système nominal

La chute du /m/ final, consonne que l'on rencontre souvent dans la flexion, crée donc une ambiguïté : Romam se prononçant comme Roma, l'on ne peut savoir si le mot est au nominatif, à l'accusatif ou à l'ablatif. Ainsi, les langues romanes ont dû utiliser des prépositions pour lever l'ambiguïté. Plutôt que dire Roma sum (classique Romæ sum avec un locatif que n'a pas gardé le latin vulgaire) pour « je suis à Rome » ou Roma(m) eo pour je vais à Rome, il a fallu exprimer ces deux phrases par sum in Roma et eo ad Roma. À cet égard, il convient de rappeler que si en latin classique déjà, dès l'époque impériale, le /m/ en fin de mots s'amuïssait, Roma sum et Roma(m) eo ne pouvaient être confondus : à l'ablatif (Roma sum), le /a/ final est long ; il est cependant bref à l'accusatif : ainsi l'on prononçait /rōmā/ pour le premier, /rōmă/ pour le second. Le latin vulgaire, toutefois, n'utilise plus le système de quantité vocalique : les deux formes sont d'autant plus ambiguës.

Dans un même mouvement, les adverbes et les prépositions simples sont parfois renforcées : ante, « avant », ne suffit plus ; il faut remonter à ab + ante en vulgaire pour expliquer le français avant, le castilan antes et l'occitant avans, ou bien in ante pour le roumain înainte, etc. ; de même avec provient de apud + hoc, dans de de intus, etc. Le cas limite semble être atteint avec le français aujourd'hui, notion qui se disait simplement hodie en latin classique. Le terme français s'analyse en à + le + jour + de + hui, où hui vient de hodie (que l'on retrouve en castillan, hoy, en romanche, hoz ou en wallon, oûy). Le composé agglutiné résultant est donc redondant, puisqu'il signifie mot à mot : « au jour d'aujourd'hui ». Certaines langues conservatrices ont cependant gardé des adverbes et prépositions simples : le castillan con, « avec », et le roumain cu viennent bien de cum, de même que en castillan ou în roumain sont hérités de in. L'on voit aussi ce phénomène avec les mots simples hérités de hodie.

De langue flexionnelle à la syntaxe souple (l'ordre des mots ne comptant pas énormément pour le sens mais principalement pour le style et l'emphase), le latin vulgaire est devenu un ensemble de langues utilisant nombre de prépositions, dans lesquelles l'ordre des mots est fixe : s'il est possible de dire en latin Petrus Paulum amat ou amat Petrus Paulum ou Paulum Petrus amat ou encore amat Paulum Petrus pour signifier que « Pierre aime Paul », ce n'est plus possible dans les langues romanes, qui ont plus ou moins rapidement abandonné les déclinaisons ; ainsi, en castilan Pedro ama a Pablo et Pablo ama a Pedro ont un sens opposé, seul l'ordre des mots indiquant qui est sujet et qui est objet. Lorsque les langues romanes ont gardé un système de déclinaisons, celui-ci est simplifié et se limite à quelques cas (à l'exception du roumain) : c'est ce qui arrive en ancien français, qui n'en possède que deux, le cas sujet (hérité du nominatif) et le cas régime (venant de l'accusatif), pour tout ce qui n'est pas sujet. En français, toujours, le cas sujet a disparu ; les noms actuels hérités de l'ancien français sont donc presque tous d'anciens cas régime (il existe quelques exceptions, comme chandeleur, provenant d'un génitif pluriel latin candelorum) et, partant, d'anciens accusatifs ; on peut le constater avec un exemple simple :

Latin classique			Ancien français			Français
	singulier	pluriel		singulier	pluriel	singulier	pluriel
nominatif	murus	muri	cas sujet	murs	mur	-	-
accusatif	murum	muros	cas régime	mur	murs	mur	murs

Le roumain, toutefois, conserve un système flexionnel fonctionnant avec trois cas syncrétiques : cas direct (nominatif + accusatif), cas oblique (génitif + datif) et vocatif. Ces cas se distinguent principalement si le nom est marqué par l'article défini. Dans le cas contraire, ils ont tendance à être confondus.

D'autres points méritent d'être signalés : tout d'abord, encore à l'exlusion du roumain, les trois genres, masculin, féminin et neutre, sont réduits à deux par l'élimination du neutre ; ainsi, le mot latin folia, nominatif / accusatif neutre pluriel de folium, « feuille », est réinterprété comme un féminin : c'est le cas, par exemple, en français, où il devient feuille, mais aussi en castillan, sous la forme hoja, en italien foglia, romanche föglia, wallon fouye, portugais folha, catalan fulla, etc., tous mots féminins. De plus, les langues romanes ont développé un système d'articles définis, inconnus du latin classique. Ainsi, en français, le et la proviennent respectivement des pronoms / adjectifs démonstratifs ille et illa ; de même en castillan pour el et la (plus un neutre lo < illud), en italien pour il et la (ainsi que lo, neutre, < illud), etc. Le roumain se distingue en étant la seule langue romane dans laquelle l'article est enclitique : om, « un homme », om-ul, « l'homme ». Les articles indéfinis, pour leur part, proviennent simplement du numéral unus, una (et unum au neutre), qui, en latin, auraient pu servir à cet usage.

Enfin, le système de l'adjectif est revu : alors que les degrés d'intensité étaient marqués par des suffixes, les langues romanes ne se servent plus que d'un adverbe devant l'adjectif simple, soit magis (devenant más en castillan, mai en occitan et en roumain, mais en portugais, més en catalan, etc.) soit plus (più en italien, plus en français, pus en wallon, plu en romanche, etc.) : ainsi, pour dire plus grand (comparatif de supériorité) en latin classique, grandior suffisait ; il faut en castillan más grande, en italien più grande, etc. De même, le superlatif le plus grand se disait grandissimus en classique, mais el más grande et il più grande dans ces mêmes deux langues.

Système verbal

En outre, les conjugaisons sont profondément modifiées, notamment par la création de temps composés : ainsi notre j'ai chanté, castillan he cantado ou encore catalan he cantat, viennent d'un habeo cantatu(m) vulgaire, qui n'existe pas en classique. L'utilisation de verbes auxiliaires, être et avoir, est notable : le latin utilisait déjà, d'une manière différente, être dans sa conjugaison, mais pas d'une manière aussi systématique que dans les langues romanes, qui ont généralisé leur emploi afin de créer un jeu complet de formes composées répondant aux formes simples. Généralement, les formes composées marquent l'aspect accompli

Un mode nouveau apparaît, le conditionnel (attesté pour la première fois dans une langue romane dans la Séquence de sainte Eulalie), construit à partir de l'infinitif (parfois modifié) suivi des désinences d'imparfait : vivr(e) + -ais donne vivrais en français, et, mutatis mutandis , viviría en castillan, viuria en catalan. Certaines modifications du radical sont à noter : devoir + ais > devrais et non *devoirais, ou bien haber + ía > habría et non *habería. De la même manière, le futur classique est abandonné au profit d'une formation comparable à celle du conditionnel, c'est-à-dire l'infinitif suivi du verbe avoir (ou précédé en sarde) : ainsi cantare habeo (« j'ai à chanter ») donne chanterai, castillan cantaré, catalan cantaré, etc.

Le passif est évacué au profit du système composé qui préexistait en latin (cantatur, « il est chanté », classique devient le vulgaire est cantatus, qui, en classique signifiait « il a été chanté »). Enfin, certaines conjugaisons irrégulières (comme celle de volle, « vouloir ») sont rectifiées (mais restent souvent irrégulières dans les langues romanes) et les verbes déponents cessent d'être utilisés.

Le lexique du latin vulgaire

Le latin vulgaire et le latin classique ne diffèrent pas seulement par des aspects phonologiques et phonétiques, mais aussi par le lexique ; les langues romanes, en effet, n'utilisent que dans des proportions variables le vocabulaire classique. Souvent, des termes populaires ont été retenus, évinçant ceux propres à la langue plus soutenue.

Certains termes latin ont entièrement disparu et ont été remplacés par leur équivalement populaire ; c'est le cas de celui pour « cheval », equus en classique mais caballus (« canasson » ; le mot est peut-être d'origine gauloise) en vulgaire, que l'on retrouve dans toutes les langues romanes : caballo en castillan, cavall en catalan, cheval en français, cal en roumain, cavallo en italien, dj'vå en wallon, chavagl en romanche, etc.

D'autre part, si certains termes classiques ont disparu, ils n'ont pas forcément été remplacés par le même mot vulgaire : le terme soutenu pour « parler » est loqui en classique, remplacé par :

parabolare (terme emprunté à la liturgie chrétienne et d'origine grecque ; proprement : « parler par parabole ») : français parler, italien parlare, catalan et occitan parlar, etc. ;
fabulare (proprement : « affabuler ») : castillan hablar, portugais falar, sarde faedhàre, etc.

Enfin, certaines langues romanes continuent d'utiliser la forme classique, tandis que d'autres, que l'on dit moins « conservatrices », se servent d'une forme vulgaire ; l'exemple que l'on donne traditionnellement est celui du verbe « manger »

latin classique edere : se retrouve (sous une forme composée ; cette forme est cependant sentie moins « noble » que le classique puriste edere) en castillan et portugais comer (de comedere) ;
latin vulgaire manducare (proprement « mâcher ») : en français, manger, italien mangiare, catalan manjar, ou encore roumain mâncar, par exemple.

Les raisons de la diversité des langues romanes

L'évolution phonétique naturelle des langues, à laquelle le latin n'a bien sûr pas échappé, explique en grande partie les différences importantes entre certaines des langues romanes. À ce processus s'est aussi ajouté la non-unicité lexicale de ce que l'on désigne sous le terme de latin vulgaire : la taille de l'Empire romain et l'absence d'une norme littéraire et grammaticale ont permis à cette langue vernaculaire de ne pas être figée. Ainsi, chaque zone de la Romania a utilisé une saveur particulière du latin vulgaire (il vaudrait même mieux dire « des latins vulgaires »), comme on l'a vu plus haut, telle langue préférant tel terme pour signifier « maison » (latin casa en castillan, catalan, italien, portugais, roumain), telle autre un terme différent (mansio pour le même sens en français), par exemple.

S'est greffée à ces deux données la présence de substrats: langues parlées initialement dans une zone et recouvertes par une autre, ne laissant que des traces éparses, tant lexicales ou grammaticales que phonologiques, dans la langue d'arrivée. Ainsi, le substrat gaulois en français lui laisse quelque cent quatre-vingts mots comme braies, char ou bec, et serait à l'origine du passage du /u/ (de loup) latin à /y/ (de lune). Cette hypothèse ne fait cependant pas l'unanimité. Bien entendu, l'influence du gaulois ne s'est pas limitée à la France : le portugais ou les dialectes de l'Italie du Nord, par exemple, en possèdent quelques termes. De même le basque pour les langues ibérico-romanes (où le mot pour gauche, soit sinistra en latin classique, est remplacé par des dérivés du basque ezker, soient izquierda en castillan et esquerdo en portugais), ou encore l'étrusque pour le dialecte italien de Toscane, qui lui devrait sa gorgia toscana, c'est-à-dire la prononciation des /k/ comme des /h/ (anglais home) ou des /χ/ (allemand Bach). Il faut noter que cette influence de l'étrusque sur le toscan est de nos jours considérée comme un mythe sans fondements réels : en effet, le phénomène n'est pas limité à la Toscane, il n'est pas présent dans toutes les zones à dominante linguistique toscane (la Corse, par exemple qui ─ bien qu'éloignée ─ a été fortement toscanisée), il n'est pas attesté avant le XVIe siècle et il ne correspond pas réellement à des caractéristiques phonétiques étrusques. Enfin et surtout, on voit mal comment une langue morte bien avant l'apparition des dialectes italiens aurait pu transmettre cet unique trait sans avoir laissé ni vocabulaire ni même coutumes.

Enfin, les superstrats ont aussi joué un rôle prépondérant dans la différenciation des langues romanes : ce sont les langues de peuples s'étant installés dans un territoire sans réussir à imposer leur langue. Celle-ci a cependant laissé des traces importantes. Le superstrat francique (donc germanique) en France est important ; le vocabulaire médiéval en est émaillé, surtout dans le domaine de la guerre et de la vie rurale (ainsi heaume, adouber, flèche, hache, etc., mais aussi framboise, blé, saule, etc., ou encore garder et, plus surprenant, trop), et le français actuel compte plusieurs centaines de mots ainsi hérités du francique. C'est un superstrat arabe que l'on remarque le plus en castillan : plus de quatre mille termes, parmi lesquels des toponymes et des composés, viennent de cette langue. Le trait le plus remarquable est le maintien quasi systématique de l'article arabe dans le mot, alors que les autres langues romanes ayant aussi emprunté le même terme s'en sont souvent débarrassées : ainsi algodón (contre français coton), de l'arabe أَلْقُطْن, ʾal-quṭn, algarroba (français caroube), de al-harūbah ou encore aduana (français douane), de أَلدِّيوَان, ʾad-dīwān (qui donne aussi divan). Enfin, dernier superstrat remarquable, le slave, dont l'influence en roumain est notable. Le roumain devrait aux langues slaves alentour son vocatif, quelques termes du lexique ainsi que des processus de palatalisation différents de ceux des autres langues romanes.

L'influence des langues romanes les unes sur les autres, d'autre part, est considérable.

L'on peut donner ici les résultats d'une étude menée par M. Pei en 1949, qui a comparé le degré d'évolution de diverses langues par rapport à leur langue-mère ; pour les langues romanes les plus importantes, si l'on ne considère que les voyelles toniques, l'on obtient, par rapport au latin, les coefficients d'évolution suivants :

sarde : 8 % ;
italien : 12 % ;
castillan : 20 % ;
roumain : 23,5 % ;
occitan (provençal) : 25 % ;
portugais : 31 % ;
français : 44 %.

L'on voit ainsi facilement le degré variable de conservatisme des langues romanes, la plus proche du latin phonétiquement (en ne considérant que les voyelles toniques) étant le sarde, la plus éloignée le français.

Diffusion mondiale des langues romanes

Du fait de la colonisation, l'aire géographique des locuteurs de langues romanes s'étend largement au delà de l'Europe. Les plus largement diffusées sont l'espagnol (Mexique, Amérique centrale et Amérique du Sud, Philippines, etc.), le portugais (Brésil, Angola, Mozambique, etc.) et le français (Canada, Afrique, etc.).

Le castillan et le français sont comptés parmi les langues officielles de l'ONU.

Annexes

Bibliographie

Pierre Bec, Manuel pratique de philologie romane, Paris, 1970-1971, deux tomes ;
Mireille Huchon, Histoire de la langue française, Paris, 2002 ;
Édouard Bourciez, Éléments de linguistique romane, Paris, 1967 pour la 5e édition ;
Max Niedermann, Phonétique historique du latin, Paris, 1953 pour la 3e édition.

Liens internes

linguistique
- dictionnaire des langues
  - langues par famille
    - langues indo-européennes

Cet article est reconnu comme « article de qualité » depuis sa version du (comparer avec la version actuelle).
Pour toute information complémentaire, consulter sa page de discussion et le vote l'ayant promu.

La version du de cet article a été reconnue comme « article de qualité », c'est-à-dire qu'elle répond à des critères de qualité concernant le style, la clarté, la pertinence, la citation des sources et l'illustration.