Problème du cours 2-27-1 - Informations

Le problème investigue la combinatoire de l'ambiguité utile. Le double vers de l'exercice Gal exploite en poèsie une ambiguité de segmentation. La documentation ZEN en donne un autre exemple, avec un quatrain en anglais.

Il existe dans certaines cultures une tradition de langage "crépusculaire". Le sens caché exploite une ambiguité où l'interprétation la plus immédiate (garden path) dissimule une interprétation secrète, réservée à des initiés.

Le contrepet va un cran plus loin en cachant le sens par une permutation phonétique. Ces considérations de combinatoire de jeux de langue ont une longue tradition, liée aux débuts des mathématiques. On consultera avec profit l'historique de la question raconté par Donald Knuth dans la section 7.2.1.7 de son opus major "The Art of Computer Programming" qui peut être téléchargée ici en format ps compressé gzip.

Organisation

Tous les élèves qui ont inscrit leur adresse électronique sur la feuille circulée dans le cours recevront un message le 12 décembre, leur demandant confirmation de leur participation à l'équipe de résolution du problème. Ceux qui souhaitent valider le cours dans leur parcours de Master me le signaleront avant le 31 décembre. Que ceux qui veulent participer à la résolution du problème et ne sont sont pas signalés m'envoient rapidement un courrier électronique à GH.

Une réunion de coordination aura lieu le 16 janvier entre 13h et 14h30, dans la salle du cours. D'ici là il serait utile qu'un volontaire se manifeste pour installer un wiki Contrepet de travail coopératif.

Une tâche prioritaire sera d'établir l'interface phonetics.ml définissant les codes phonétiques, et une translitération latine permettant la saisie des signifiants dans une base de donnée partagée. La signature de cette interface, et une ébauche d'implémentation, seront discutés le 16 janvier, et les fonctionnalités des principaux modules seront arrêtées. Les étudiants se grouperont en équipes pour se partager les tâches, et se répartir la saisie du corpus.

A la mi-février, chaque étudiant désirant être noté devra soumettre un court rapport expliquant sa participation à l'exercice et au problème, accompagné des réflexions qu'il jugera utiles sur une modélisation linguistique plus poussée des phénomènes étudiés.

Fin février le site sera ouvert au public et un rapport collectif publié.

Stages

Les étudiants souhaitant faire leur stage de M2 sur des sujets reliés au traitement de la langue peuvent se renseigner en écrivant à l'adresse électronique GH ci-dessus, à partir de la mi-janvier.


© Gérard Huet 2005 Enoncé du problème | MPRI fr | MPRI en |