Ponctuation et syntaxe

dans la langue française médiévale
Étude d'un corpus de chartes originales écrites à Liège entre 1236 et 1291

Nicolas Mazziotta (nicolas.mazziotta@ulg.ac.be)

Tübingen: Niemeyer, 2009 (Beihefte zur Zeitschrift für romanische Philologie 354)

Analyses syntaxiques

Cette section comporte les analyses syntaxiques complètes des documents qui ont été dépouillés dans le cadre de notre étude. Nous détaillons également les conventions de représentation que nous avons suivies pour rendre ces analyses lisibles par un humain (elles sont, au départ, prévues pour être traitées par des programmes informatiques). Nous donnons une légende complète des symboles employés dans ces représentations.

Intégralité des analyses

Toutes les analyses peuvent être consultées en cliquant sur les références des documents dans la liste figurant sous le menu de navigation. L'analyse exhaustive du document ainsi sélectionné apparaîtra dans une nouvelle fenêtre pour faciliter la consultation simultanée de plusieurs textes.

Conventions de représentation

Nous détaillons ici nos conventions de représentation. D'un point de vue technique les principes d'encodage suivis sont ceux que nous avons présenté dans ce document de travail, transmis aux participants de l'atelier du CCFM des 5 et 6 octobre 2006 à l'ENS de Lyon. Les fichiers source où sont encodées les analyses ne sont pas transmis sur ce disque et diffèrent légèrement de ceux présentés dans le document (exclusivement par le nom des balises).

Représentation sous forme de boîtes

Les constituants sont représentés suivant un schéma arborescent, où chacun d'entre eux a un unique parent. Un constituant n'est ainsi le constituant immédiat que d'une seule structure, qu'il sert à construire. La hiérarchie des constituant prend la forme de boîtes imbriquées et étiquetées à l'aide des symboles détaillés ci-dessous. Chaque étiquette est suivie d'une référence entre parenthèses. Cette référence unique est utilisée pour indiquer certaines relations. Voici un exemple de représentation sous forme de boîtes (voir l'analyse complète):

L'emploi de boîtes, choisi pour des raisons techniques, ne permet pas de placer les étiquettes sur les relations comme nous le faisons dans le livre. Nous sommes obligé d'annoter les constituants eux-mêmes.

En syntaxe argumentale, chaque constituant est identifié par la fonction qui le relie à un autre constituant de même niveau. Le prédicat prend l'étiquette P0 et le sujet (qui contracte avec lui la fonction S1) est étiquetté S1.

En syntaxe immédiate, à moins qu'ils ne soient étiquetés à l'aide du sigle Dt (→ ), tous les constituants ont par défaut la fonction d'apposition (→ 3.4.6.1 a). Par exemple, dans le A4 ci-dessus, sa et terre sont apposés.

Légende

Symboles des structures

Chaque structure isolée est associée à une icône qui traduit visuellement sa fonction.

Les symboles utilisés en syntaxe argumentale sont les suivants:

Dossier bleu Énoncé (→ 3.4.1.2)
N pour les énoncés non phrastiques (→ 3.4.5), P pour les phrases.
Dossier bleu foncé Prédicat, P0 (→ 3.4.2 et 3.4.3)
prédicat principal, auxiliaire ou auxilié (indistinctement).
Dossier jaune Sujet, S1 (→ 3.4.2.2 b)
commute avec il.
Dossier orange Régimes, R2 et R3 (→ 3.4.2.2 b)
R2 commute avec le et R3 commute avec li.
Dossier rouge A4 (→ 3.4.2.4)
non actant de forme dépendante du lexème exprimant le prédicat.
Dossier rouge foncé Circonstant, C5 (→ 3.4.2.3 a)
non actant de forme indépendante du lexème exprimant le prédicat; exprime le cadre du procès.
Dossier rose C6 (→ 3.4.2.3 b)
non actant de forme indépendante du lexème exprimant le prédicat; exprime l'organisation entre les énoncés.

En syntaxe immédiate (→ 3.4.6), nous avons employé les symboles suivants:

Dossier vert Groupe d'appositions
appositions devant être regroupées pour en expliciter la hiérarchie (→ 3.4.6.1 a sur les appositions et 3.4.7.3 sur leur hiérarchie; voir également ci-dessous).
Dossier vert foncé Déterminant, Dt (→ 3.4.6.1 b)
constituant sélectionnant en syntaxe immédiate.

Certains constituants et constructions sont communs à la syntaxe argumentale et à la syntaxe immédiate (→ notamment 3.4.7). Nous avons employé les symboles suivants pour les identifier:

Dossier violet Relateur (→ 3.4.4.2 a)
mot spécifiant une relation qu'il n'entretient pas directement.
Dossier gris Coordination (→ 3.4.7.2)
ensemble de constituants coordonnés (groupe) ou relateur coordonnant (Co).
Dossier gris foncé Groupe de constituants coordonnés
groupe de constituants fonctionnant ensemble et coordonnés (→ 3.4.7.2 a; voir en outre ci-dessous).

Annotations supplémentaires

Les constituants de nature propositionnelle (→ 3.4.4.5, 3.4.4.6, 3.4.6.5 et 3.4.6.6) sont identifiés à l'aide d'une annotation supplémentaire prenant la forme = prop. pers., = prop. inf., etc.

Traitement des structures et relations particulières

Relation de spécification

La spécification est indiquée à la suite de l'étiquette des relateurs, par une flèche suivie de la référence du constituant impliqué dans la relation spécifiée.

Hiérarchie des appositions

Les hiérarchies d'appositions (→ 3.4.7.3) sont rendues explicites par l'imbrication de boîtes portant l'étiquette syntagme.

Coordinations

Les différents constituants coordonnés sont rassemblés dans une boîte étiquetée groupe. Cette dernière contient également les éventuels coordonnants spécifiant la coordination. Par exemple (voir l'analyse complète du document):

Les constituants _723 et _728 ont chacun la fonction de S1 dans la proposition.

Groupes coordonnés

Dans certains cas, la coordination porte sur des groupes d'arguments (→ 3.4.7.1 a). Par exemple, dans (toute l'analyse)

Les constituants _1006 et _1007 fonctionnent ensemble et sont coordonnés au constituant _1056.

Problèmes

Cette section aborde les problèmes que nous n'avons pu résoudre de manière totalement satisfaisante. Nous continuons à travailler sur les techniques d'encodage et de description qui permettront de parfaire les annotations.

Hiérarchie de la structure argumentale

Prédicats complexes

Du fait que nous avons choisi d'encoder les analyses syntaxiques en suivant un modèle de données arborescent, nous n'avons pu rendre compte de la structure des prédicats complexes (→ 3.4.3). Les prédicats conjugués à un "temps composé" ont été encodés comme si chacun des mots (auxiliaire et auxilié) était un prédicat indépendant, c'est-à-dire dans deux boîtes étiquetées P0.

Par exemple, les constituants _305 (auxiliaire) et _306 (auxilié) dans l'analyse ci-dessus sont chacun dans une boîte P0.

Arguments partagés

Il arrive que plusieurs prédicats de niveaux d'intégration syntaxique différents aient en commun un ou plusieurs arguments. Dans ce cas, nous avons considéré que le prédicat en relation avec ces arguments était celui qui se trouvaint au niveau le plus élevé.

5 attestations de la structure.
  1. Document 1263-05-27c, structure _601
  2. Document 1270-04-07, structure _4161
  3. Document 1272-03, structure _2854
  4. Document 1272-03, structure _3005
  5. Document 1237-10-12, structure _512

Circonstants figés

Un certain nombre de circonstants dont la structure paraît figée (codée dans le lexique) pourraient certainement être mieux décrits en tenant compte de cette dimension lexicale.

Nous nous contenterons d'énumérer ici quelques attestations intéressantes que nous avons pu repérer. Cette démarche n'est absolument pas satisfaisante, mais nous ne pouvons faire mieux actuellement. Pour espérer un relevé exhaustif, il faudrait que les données soient enrichies d'une lemmatisation, identifiant chaque mot au lexème qu'il actualise. Un traitement approfondi pourra être fait une fois le corpus entièrement lemmatisé. L'observation des quelques attestations relevées montre également que notre balisage n'a pas toujours été consistant (nous avons préféré laisser ces inconsistances aléatoire en l'état, → 4.2.5.2). L'homogénéisation de l'ensemble ira de pair avec le dépouillement exhaustif. Elle dépend donc de la lemmatisation.

de ci à...

6 attestations de la structure.
  1. Document 1244-01-19, structure _3481
  2. Document 1270-09-29, structure _1659
  3. Document 1271-12-03a, structure _810
  4. Document 1271-12-03b, structure _706
  5. Document 1275-08, structure _1289
  6. Document 1289-01-12, structure _3213

de dont en avant

7 attestations de la structure.
  1. Document 1265-05b, structure _1600
  2. Document 1265-05b, structure _1764
  3. Document 1265-05b, structure _1768
  4. Document 1278-08-01, structure _3335
  5. Document 1280-05-04, structure _1071
  6. Document 1288-02a, structure _3735
  7. Document 1288-02b, structure _805

petit/peu plus ou petit/peu moins

6 attestations de la structure.
  1. Document 1282-12-22, structure _1723
  2. Document 1268-05-31, structure _1571
  3. Document 1284-06-09, structure _1126
  4. Document 1283-02-13a, structure _11160
  5. Document 1281-03, structure _585
  6. Document 1290-08-24, structure _2010

soit... soit...

3 attestations de la structure.
  1. Document 1277-06-12, structure _3463
  2. Document 1260-02-21b, structure _1542
  3. Document 1278-04-06, structure _3383

Hiérarchie des appositions

Cetraines appositions sont en relation simultanée avec deux constituants qui ne se trouvent pas au même niveau.

2 attestations de la structure.
  1. Document 1265-05b, structure _4582
  2. Document 1272-03, structure _7414
Pour éviter tout problème d'affichage, merci de faire usage d'un des navigateurs fournis sur le disque compact (voir la page des ressources).