Session 4
La tradition orale du Sénégal: corpus, lieu de stockage, conservation
Lylian Kesteloot
On n’a aucune idée de l’importance de la tradition orale dans ce pays. On sait seulement su’elle est grande. Le corpus est loin d’avoir été entièrement recensé, encore moins recolté. La sonoteque de l’Ifan a selectionné une dizaine d’épopées, plusieurs dizaines de chroniques, des centaines de contes et fables, des mythes et des chants par centaines également, bref, environ 1500 cassettes de soixante minutes .
En dehors de l’Ifan, il n’y a guère que le service du patrimoine au Ministère de la culture qui a recueilli le fonds laissé par les archives culturelles, soit plus au moins 500 enregistrements.
Enfin il existe des collections privées, comme celle de Raphaël Ndiaye sur les textes et chants serer, et celle du Professeur Bassirou Dieng sur les contes et épopées wolof.
Il y a encore d’autres collectionneurs non recensés, aussi bien à Dakar qu’en province. L’enquête est a faire.
La conservation se passe de deux manières: par le stockage et par la mise par écrit. Là encore, peu de textes arrivent au niveau de la publication .Donc les neuf dixième du corpus demeurent en stock et se déteriorent lentement. Tel est le problème.
Lylian Kesteloot est Directrice de Recherche à l’IFAN
Conserver l’oral
Michel Jacobson
Depuis très longtemps, l’homme cherche à garder la trace de ses productions orales. Une des premières tentatives a certainement été l’invention des écritures (alphabétiques, syllabiques, idéographiques). C’est dans la continuité de cette approche, qu’à la fin du 19ème siècle, la mise au point de l’alphabet de phonétique international (API) a permis aux linguistes de noter la parole dans ses aspects fonctionnels eux-mêmes basés sur des critères articulatoires. C’est encore plus récemment que les aspects acoustiques ont pu être conservés sur des supports. Les premières techniques d’enregistrements analogiques (rouleaux, fils, disques, bandes magnétiques) du début du 20ème on fait place aujourd’hui à des enregistrements numériques, mais le principe de codage reste le même: il s’agit de coder cette fois les propriétés acoustiques du son (les variations de pression de l’air).
L’arrivée de l’informatique et des réseaux a permis de repenser la gestion de ce type de données. La conservation des anciens enregistrements passe maintenant obligatoirement par leur numérisation qui en permet la duplication à l’identique et à l’infini. Cette numérisation doit se faire avec des préoccupations de fidélité, de traçabilité et de normalisation.
- La fidélité de la version numérique à la version analogique d’origine est bien sûr importante d’un point de vue scientifique mais des contraintes économiques, techniques et même conceptuelles empêchent qu’elle soit parfaite. La numérisation est donc toujours le résultat d’un compromis où l’on accepte de perdre une partie de l’information (cf. les recommandations de IASA en termes de fréquence d’échantillonnage, de taille des échantillons et de compression)
- La traçabilité est, entre autre, ce qui nous permet de retrouver les supports d’origine, mais aussi tout le contexte social, culturel, etc. de l’époque. L’organisation de cette traçabilité passe en grande partie par la documentation et la standardisation. En particulier, il est important de documenter précisément les techniques et les matériels employés lors de l’enregistrement et de la numérisation.
- La normalisation peut être vue pour certains de ces aspects comme un langage partagé et explicite qui permet de décrire un objet, un procédé. Une description normalisée permet une interprétation non ambigue, dont la stabilité est garantie par le concept même de norme (résultat de la réflexion d’un grand nombre que l’on stabilise et que l’on fige dans une version puis qui est maintenu par un organisme dont c’est la mission et qui n’est pas directement influencé par des interêts commerciaux ou industriels).
Pour mettre en place une organisation permettant la conservation, l’échange et l’exploitation des ressources orales issues de la production scientifique, le CNRS a mis en place un Centre de Ressource Numérique. Ce centre, le CRDO[1] (http://crdo.risc.cnrs.fr), entre autre activité, maintient une archive de ressources orales. Pour le moment, elle contient quelques centaines d’heures d’enregistrements audio ou vidéo dans environ 80 langues, accompagnées parfois de documents associés tels que des transcriptions, des traductions et autres annotations. Cette archive s’est défini des formats en accord avec les organismes de conservations, des outils pour la création, la gestion et la diffusion de ce type de ressource. Il s’agit d’une « archive ouverte » au sens de l’OAI. Les ressources dont nous disposons sont celles issues du travail du monde de la recherche. Il s’agit d’objets à la fois culturels et scientifiques. Certaines de ces ressources ont acquis un caractère patrimonial indiscutable du fait de leur apport à la recherche, de leur aspect historique et parfois parce qu’il s’agit tout simplement des dernières, seules ou rares traces d’une langue ou d’un état de langue disparu. Conserver ces données est donc non seulement un outil de mutualisation pour la communauté académique mais aussi une responsabilité vis à vis des sociétés qui ont participé à leur élaboration.
[1] Centre de Ressources pour la Description de l’Oral. (site web http://crdo.risc.cnrs.fr)
Michel Jacobson est Ingénieur d’étude au CNRS (UMR 7107 –LACITO)
Le Thesaurus Occitan : traitement et valorisation des données orales
Guylaine Brun-Trigaud
Le Thesaurus Occitan ou THESOC est une base de données multimédias contenant des données linguistiques et péri-linguistiques issues d’enquêtes de terrain, des données linguistiques procédant d’analyses déjà réalisées : lemmatisations, morphologie, étymologie, microtoponymie, des outils d’analyse : représentations cartographiques, instruments d’analyse diachronique, procédures de cartographie comparative, instruments d’analyse morphologique, etc.
Il comprend également des données sonores et des illustrations (dessins, photos).
La démonstration du logiciel montrera les différentes manières de consulter les données et les différents modules permettant leur exploitation.
Guylaine Brun est Ingénieur d’étude au CNRS