Page web de Benoît Sagot  —  équipe ALMAnaCH (Inria / EPHE)

En
Chercheur en TAL (traitement automatique des langues) à l'Inria, responsable de l'équipe Inria ALMAnaCH (Inria Paris et EPHE)
Ancien ingénieur du Corps des Télécommunications (X-ENST)
Membre de la Société Informatique de France, de l'Association pour le Traitement Automatique des Langues (ATALA) et de la Société de Linguistique de Paris

Thèmes de recherche :

  • Développement de ressources lexicales (morphologiques, syntaxiques, sémantiques), pour le français (lexique syntaxique Lefff, lexique sémantique WOLF) et d'autres langues
  • Morphologie computationnelle et quantitative
  • Analyse syntaxique symbolique (LFG) et probabiliste (PCFG), étiquetage en parties du discours
  • Traitement de corpus bruts (reconnaissance et résolution d'entités nommées, correction orthographique, segmentation non-supervisée…)
  • Grammaires formelles (LCFRS, RCG)
  • Applications du TAL

Coordonnées postales :

Inria Paris (équipe ALMAnaCH)
2 rue Simone Iff
CS 42112
75589 Paris Cedex 12
FRANCE
Tél.: +33 1 80 49 43 14
e-mail :

Activités pour la communauté :

  • Membre du Bureau du Comité des Projets d'Inria Paris — 2016–
  • Membre du Conseil Scientifique de l'EquipEx Ortolang — 2013–
  • Membre du Conseil Scientifique Restreint (CSR) du LabEx EFL, ancien responsable de l'axe 6 Ressources — 2011–2015, désormais responsable adjoint et membre suppléant du CSR)
  • Membre du Comité de Pilotage du consortium Corpus Écrits de la TGIR Huma-Num
  • Membre du Groupe de Travail Relations Internationales du Conseil d’Orientation Scientifique et Technologique de l'Inria (COST-GTRI)
  • Porteur du projet ANR EDyLex — 2010–2013
  • Membre du Conseil d'Administration et ancien Secrétaire de l'ATALA
  • Évaluateur pour l'ANR
  • Rédacteur en chef invité, avec Núria Bel, d'un numéro de la revue TAL sur les Ressources Linguistiques
  • Organisateur de WoLeR 2011, workshop ESSLLI sur les Ressources Lexicales
  • Membre du comité de programme ou relecteur pour les revues Computational Linguistics, Language Resources and Evaluation, TAL, la session étudiante de LACL 2005, l'atelier sur les formalismes linguistiques de haut niveau de TALN 2007, et les conférences TALN 2008, IIS 2008, ALTW 2008, TALN 2009, ACL 2009, TALN 2010, TALN 2011
  • Relecteur secondaire pour IJCNLP 2005, EACL 2006, TALN 2007 et LREC 2008
  • Membre de comités de recrutement pour différents types de postes d'enseignants-chercheurs ou d'ingénieurs de recherche (3 en 2010, 3 en 2011, 1 en 2012, 1 en 2013, 2 en 2014)
  • De 2007 à 2010, secrétaire de rédaction de la revue TAL

Encadrement :

  • Co-encadrant de la thèse de Marion Baranes (thèse industrielle au sein de l'entreprise viavoo / Université Paris 7, de janvier 2012 à la soutenance en octobre 2015)
  • Co-encadrant de la thèse de Valérie Hanoka (thèse CIFRE Université Paris 7 — Verbatim Analysis, de janvier 2011 à la soutenance en juillet 2015)
  • Co-encadrant de la thèse de Pierre Magistry (Allocataire Moniteur Université Paris 7, de septembre 2010 à la soutenance en décembre 2013)
  • Co-encadrant de la thèse de Rosa Stern (thèse CIFRE Université Paris 7 — Agence France-Presse, de septembre 2009 à la soutenance en juin 2013)
  • Encadrant du Master 2 de Sarah Beniamine (Université Paris 7, 2014)
  • Examinateur de la thèse de Rania Voskaki (Université Paris-Est Marne-la-Vallée, 2011)
  • Examinateur de la thèse de Claire Mouton (Université Paris Sud, 2010)
  • Examinateur de la thèse de Lionel Nicolas (Université de Nice, 2010)
  • Rapporteur de la thèse de Juan Otero (Université de Vigo, Espagne, 2009)
  • Examinateur de la thèse de Laurence Delort (Université Paris 7, 2008)

Divers :

  • Traducteur (en->fr) de 3 chapitres de la nouvelle édition du Dragon Book (Aho, Lam, Sethi, Ullman)