Ponctuation et syntaxe
dans la langue française médiévale
Étude d'un corpus de chartes originales écrites à Liège entre 1236 et 1291
Nicolas Mazziotta (nicolas.mazziotta@ulg.ac.be)
Tübingen: Niemeyer, 2009 (Beihefte zur Zeitschrift für romanische Philologie 354)
Analyses syntaxiques
Cette section comporte les analyses syntaxiques complètes des documents qui ont été dépouillés dans le cadre de notre étude. Nous détaillons également les conventions de représentation que nous avons suivies pour rendre ces analyses lisibles par un humain (elles sont, au départ, prévues pour être traitées par des programmes informatiques). Nous donnons une légende complète des symboles employés dans ces représentations.
Intégralité des analyses
Toutes les analyses peuvent être consultées en cliquant sur les références des documents dans la liste figurant sous le menu de navigation. L'analyse exhaustive du document ainsi sélectionné apparaîtra dans une nouvelle fenêtre pour faciliter la consultation simultanée de plusieurs textes.
Conventions de représentation
Nous détaillons ici nos conventions de représentation. D'un point de vue technique les principes d'encodage suivis sont ceux que nous avons présenté dans ce document de travail, transmis aux participants de l'atelier du CCFM des 5 et 6 octobre 2006 à l'ENS de Lyon. Les fichiers source où sont encodées les analyses ne sont pas transmis sur ce disque et diffèrent légèrement de ceux présentés dans le document (exclusivement par le nom des balises).
Représentation sous forme de boîtes
Les constituants sont représentés suivant un schéma arborescent, où chacun d'entre eux a un unique parent. Un constituant n'est ainsi le constituant immédiat que d'une seule structure, qu'il sert à construire. La hiérarchie des constituant prend la forme de boîtes imbriquées et étiquetées à l'aide des symboles détaillés ci-dessous. Chaque étiquette est suivie d'une référence entre parenthèses. Cette référence unique est utilisée pour indiquer certaines relations. Voici un exemple de représentation sous forme de boîtes (voir l'analyse complète):
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
| (...) |
L'emploi de boîtes, choisi pour des raisons techniques, ne permet pas de placer les étiquettes sur les relations comme nous le faisons dans le livre. Nous sommes obligé d'annoter les constituants eux-mêmes.
En syntaxe argumentale, chaque constituant est identifié par la fonction qui le relie à un autre constituant de même niveau. Le prédicat prend l'étiquette P0 et le sujet (qui contracte avec lui la fonction S1) est étiquetté S1.
En syntaxe immédiate, à moins qu'ils ne soient étiquetés à l'aide du sigle Dt (→ ), tous les constituants ont par défaut la fonction d'apposition (→ 3.4.6.1 a). Par exemple, dans le A4 ci-dessus, sa et terre sont apposés.
Légende
Symboles des structures
Chaque structure isolée est associée à une icône qui traduit visuellement sa fonction.
Les symboles utilisés en syntaxe argumentale sont les suivants:
Énoncé (→ 3.4.1.2)
- N pour les énoncés non phrastiques (→ 3.4.5), P pour les phrases.
Prédicat, P0 (→ 3.4.2 et 3.4.3)
- prédicat principal, auxiliaire ou auxilié (indistinctement).
Sujet, S1 (→ 3.4.2.2 b)
- commute avec il.
Régimes, R2 et R3 (→ 3.4.2.2 b)
- R2 commute avec le et R3 commute avec li.
A4 (→ 3.4.2.4)
- non actant de forme dépendante du lexème exprimant le prédicat.
Circonstant, C5 (→ 3.4.2.3 a)
- non actant de forme indépendante du lexème exprimant le prédicat; exprime le cadre du procès.
C6 (→ 3.4.2.3 b)
- non actant de forme indépendante du lexème exprimant le prédicat; exprime l'organisation entre les énoncés.
En syntaxe immédiate (→ 3.4.6), nous avons employé les symboles suivants:
Groupe d'appositions
- appositions devant être regroupées pour en expliciter la hiérarchie (→ 3.4.6.1 a sur les appositions et 3.4.7.3 sur leur hiérarchie; voir également ci-dessous).
Déterminant, Dt (→ 3.4.6.1 b)
- constituant sélectionnant en syntaxe immédiate.
Certains constituants et constructions sont communs à la syntaxe argumentale et à la syntaxe immédiate (→ notamment 3.4.7). Nous avons employé les symboles suivants pour les identifier:
Relateur (→ 3.4.4.2 a)
- mot spécifiant une relation qu'il n'entretient pas directement.
Coordination (→ 3.4.7.2)
- ensemble de constituants coordonnés (groupe) ou relateur coordonnant (Co).
Groupe de constituants coordonnés
- groupe de constituants fonctionnant ensemble et coordonnés (→ 3.4.7.2 a; voir en outre ci-dessous).
Annotations supplémentaires
Les constituants de nature propositionnelle (→ 3.4.4.5, 3.4.4.6, 3.4.6.5 et 3.4.6.6) sont identifiés à l'aide d'une annotation supplémentaire prenant la forme = prop. pers., = prop. inf., etc.
Traitement des structures et relations particulières
Relation de spécification
La spécification est indiquée à la suite de l'étiquette des relateurs, par une flèche suivie de la référence du constituant impliqué dans la relation spécifiée.
Hiérarchie des appositions
Les hiérarchies d'appositions (→ 3.4.7.3) sont rendues explicites par l'imbrication de boîtes portant l'étiquette syntagme.
Coordinations
Les différents constituants coordonnés sont rassemblés dans une boîte étiquetée groupe. Cette dernière contient également les éventuels coordonnants spécifiant la coordination. Par exemple (voir l'analyse complète du document):
|
|
|
|
|
|
Les constituants _723 et _728 ont chacun la fonction de S1 dans la proposition.
Groupes coordonnés
Dans certains cas, la coordination porte sur des groupes d'arguments (→ 3.4.7.1 a). Par exemple, dans (toute l'analyse)
|
|
|
| (...) |
Les constituants _1006 et _1007 fonctionnent ensemble et sont coordonnés au constituant _1056.
Problèmes
Cette section aborde les problèmes que nous n'avons pu résoudre de manière totalement satisfaisante. Nous continuons à travailler sur les techniques d'encodage et de description qui permettront de parfaire les annotations.
Hiérarchie de la structure argumentale
Prédicats complexes
Du fait que nous avons choisi d'encoder les analyses syntaxiques en suivant un modèle de données arborescent, nous n'avons pu rendre compte de la structure des prédicats complexes (→ 3.4.3). Les prédicats conjugués à un "temps composé" ont été encodés comme si chacun des mots (auxiliaire et auxilié) était un prédicat indépendant, c'est-à-dire dans deux boîtes étiquetées P0.
Par exemple, les constituants _305 (auxiliaire) et _306 (auxilié) dans l'analyse ci-dessus sont chacun dans une boîte P0.
Arguments partagés
Il arrive que plusieurs prédicats de niveaux d'intégration syntaxique différents aient en commun un ou plusieurs arguments. Dans ce cas, nous avons considéré que le prédicat en relation avec ces arguments était celui qui se trouvaint au niveau le plus élevé.
5 attestations de la structure.- Document 1263-05-27c, structure _601
- Document 1270-04-07, structure _4161
- Document 1272-03, structure _2854
- Document 1272-03, structure _3005
- Document 1237-10-12, structure _512
Circonstants figés
Un certain nombre de circonstants dont la structure paraît figée (codée dans le lexique) pourraient certainement être mieux décrits en tenant compte de cette dimension lexicale.
Nous nous contenterons d'énumérer ici quelques attestations intéressantes que nous avons pu repérer. Cette démarche n'est absolument pas satisfaisante, mais nous ne pouvons faire mieux actuellement. Pour espérer un relevé exhaustif, il faudrait que les données soient enrichies d'une lemmatisation, identifiant chaque mot au lexème qu'il actualise. Un traitement approfondi pourra être fait une fois le corpus entièrement lemmatisé. L'observation des quelques attestations relevées montre également que notre balisage n'a pas toujours été consistant (nous avons préféré laisser ces inconsistances aléatoire en l'état, → 4.2.5.2). L'homogénéisation de l'ensemble ira de pair avec le dépouillement exhaustif. Elle dépend donc de la lemmatisation.
de ci à...
6 attestations de la structure.- Document 1244-01-19, structure _3481
- Document 1270-09-29, structure _1659
- Document 1271-12-03a, structure _810
- Document 1271-12-03b, structure _706
- Document 1275-08, structure _1289
- Document 1289-01-12, structure _3213
de dont en avant
7 attestations de la structure.- Document 1265-05b, structure _1600
- Document 1265-05b, structure _1764
- Document 1265-05b, structure _1768
- Document 1278-08-01, structure _3335
- Document 1280-05-04, structure _1071
- Document 1288-02a, structure _3735
- Document 1288-02b, structure _805
petit/peu plus ou petit/peu moins
6 attestations de la structure.- Document 1282-12-22, structure _1723
- Document 1268-05-31, structure _1571
- Document 1284-06-09, structure _1126
- Document 1283-02-13a, structure _11160
- Document 1281-03, structure _585
- Document 1290-08-24, structure _2010
soit... soit...
3 attestations de la structure.- Document 1277-06-12, structure _3463
- Document 1260-02-21b, structure _1542
- Document 1278-04-06, structure _3383
Hiérarchie des appositions
Cetraines appositions sont en relation simultanée avec deux constituants qui ne se trouvent pas au même niveau.
2 attestations de la structure.