La textométrie est la discipline et science qui permet d’explorer les structures lexicales, syntaxiques et discursives d’un corpus, en révélant des régularités, des spécificités ou des évolutions dans l’usage de la langue.
Utilisée dans les sciences humaines et sociales, elle offre une approche rigoureuse et reproductible de l’analyse littéraire, tout en ouvrant la voie à des interprétations nouvelles.
Dans le contexte des littératures africaines, la textométrie représente un outil puissant pour revisiter les œuvres, qu’elles soient orales ou écrites, anciennes ou contemporaines. Elle permet de dépasser les lectures impressionnistes ou thématiques pour entrer dans les mécanismes profonds de la textualité africaine, souvent marquée par la diversité linguistique, la richesse stylistique et l’ancrage culturel.
Qu’est-ce que la textométrie ?
La textométrie repose sur plusieurs opérations clés :
- L’encodage des textes, souvent en XML-TEI, pour structurer les données.
- La lemmatisation, qui consiste à regrouper les formes fléchies d’un mot sous une même entrée.
- Le calcul de fréquences, pour repérer les mots les plus utilisés, les cooccurrences ou les spécificités lexicales.
- La segmentation, qui permet d’analyser les textes par parties (chapitres, paragraphes, vers, etc.).
- La visualisation, via des nuages de mots, des graphes ou des cartes sémantiques.
Des logiciels comme TXM, Voyant Tools, ou Hyperbase sont couramment utilisés pour mener ces analyses.
Appliquer la textométrie aux œuvres africaines
Les littératures africaines francophones offrent un terrain fertile pour la textométrie. Ces œuvres, souvent traversées par des enjeux identitaires, politiques et esthétiques, peuvent être explorées sous un angle nouveau grâce à cette méthode.
Prenons l’exemple de “Le devoir de violence” de Yambo Ouologuem, roman malien publié en 1968. Une analyse textométrique de ce texte révèle une fréquence élevée de termes liés à la violence, à la domination et à la mémoire.
Le champ lexical du pouvoir (roi, empire, esclavage, fouet) y est surreprésenté, traduisant la critique acerbe du colonialisme et des élites africaines. En comparant ce corpus avec d’autres romans postcoloniaux, on peut mesurer l’intensité du discours critique et la singularité stylistique de Ouologuem.
Autre exemple : les romans de Ahmadou Kourouma, notamment “Allah n’est pas obligé” et “En attendant le vote des bêtes sauvages”.
La textométrie permet d’analyser l’usage du français ivoirien, des proverbes, des interjections et des tournures orales. On observe une hybridation linguistique marquée, où le français cohabite avec des structures mandingues ou malinkés.
Cette analyse met en lumière la stratégie de Kourouma pour africaniser la langue française et créer une esthétique propre à son univers narratif.
Corpus et enjeux méthodologiques
Pour mener une étude textométrique sur les œuvres africaines, il est essentiel de constituer un corpus représentatif. Celui-ci peut inclure :
- Des romans francophones d’Afrique de l’Ouest (Sénégal, Côte d’Ivoire, Mali, Burkina Faso).
- Des textes de théâtre ou de poésie (Soyinka, Césaire, Tansi).
- Des traductions de récits oraux ou de contes traditionnels.
L’un des défis majeurs est la normalisation linguistique : les textes africains intègrent souvent des mots en langues locales, des néologismes ou des expressions idiomatiques. Il faut donc adapter les outils de lemmatisation et enrichir les dictionnaires pour tenir compte de cette diversité.
Ce que révèle la textométrie
L’analyse textométrique permet de :
- Identifier les spécificités lexicales d’un auteur ou d’un courant littéraire.
- Comparer les styles entre plusieurs écrivains africains.
- Repérer les motifs récurrents (colonialisme, identité, exil, oralité).
- Étudier l’évolution du langage dans les littératures africaines depuis les indépendances.
Par exemple, une étude menée sur les œuvres de Mohamed Mbougar Sarr, prix Goncourt 2021, montre une densité lexicale élevée, une prédilection pour les termes philosophiques et une structure narrative complexe. La textométrie permet ici de quantifier l’ambition intellectuelle et la richesse intertextuelle de son écriture.
Vers une africanisation des outils ?
Un enjeu important est l’adaptation des outils textométriques aux réalités africaines. Cela implique :
- Le développement de corpus multilingues intégrant les langues africaines.
- La création de dictionnaires morphologiques pour le wolof, le bambara, le lingala, etc.
- L’intégration de métadonnées culturelles (contexte historique, oralité, genre).
Des initiatives émergent, notamment dans les universités africaines, pour former des chercheurs à ces méthodes et produire des corpus annotés localement.
La textométrie offre une voie prometteuse pour renouveler l’étude des littératures africaines. En combinant rigueur scientifique et sensibilité culturelle, elle permet de mieux comprendre les dynamiques internes des textes, de valoriser la diversité linguistique et de révéler les stratégies d’écriture propres aux auteurs africains.
Dans un monde où les humanités numériques prennent de plus en plus de place, il est essentiel que les œuvres africaines soient pleinement intégrées à ces nouvelles approches, pour que leur richesse soit explorée, reconnue et partagée à l’échelle mondiale.


