Outils pour utilisateurs

Outils du site


user:alexandra_volanschi:langages_il_m1_2013

Linguistique de corpus : « Langages IL » 2014/2015 S1

Repartition en groupes

  • Groupe 1 : lundi 9h30-11h30 : étudiants dont le nom de famille commence par les lettres A-L
  • Groupe 2 : lundi 12h00-14h00 : étudiants dont le nom de famille commence par les lettres M-Z

Modalités de contrôle des connaissances

  • Pour les étudiants en contrôle continu :
    • 1/2 : présence et activité en cours et qualité du corpus construit
    • 1/2 : DST
  • Pour les étudiants dispensés de contrôle continu :
    • 1/2 : qualité du corpus constitué
    • 1/2 : rapport sur le travail de constitution du corpus

Exemples d'annotation : étiquetage morpho-syntaxique, lemmatisation, analyse syntaxique, information textuelle (annotation TEI) }

Introduction à la compilation, l'interrogation et l'annotation des corpus

L'objectif de ce cours est de vous présenter les aspects appliqués, techniques, de la constitution, compilation, annotation, et utilisation des corpus. Il est, de ce point de vue, complémentaire à “Introduction à la Linguistique de corpus” que vous suivez en même temps.

Un des objectifs de ce cours est la constitution d'un corpus comparable de langue spécialisée (français et anglais|espagnol|allemand selon la langue que vous étudiez) pour un micro-domaine en sciences de la terre (volcanologie, climatologie, ou orogenèse — selon la distribution en groupes effectuée par Mmes Kübler, Pecman) et moi-même. Cet objectif est partagé avec le cours Linguistique de corpus appliquée à la traduction. En effet, ce corpus vous sera nécessaire par la suite pour l'extraction terminologique (validation de termes, extraction de définitions, collocations, notes techniques, etc.), pour la constitution de bases de données en vue d'applications telles l'aide à la rédaction en langue de spécialité et la traduction spécialisée. D'autre part, dans le cadre du cours « Langages IL », il sera utilisé pour illustrer le processus de conception et réalisation d'un corpus ainsi que les outils d'annotation, d'indexation et requête de corpus.

  1. Votre corpus ou, à défaut, celui-ci ou celui-ci (renommer .txt.zip)
  2. anti-dictionnaire anglais (pour la fonctionnalité word list)
  3. anti-dictionnaire français (pour la fonctionnalité word list)
  4. corpus de référence pour l'anglais (pour la fonctionnalité keyword list)


exemple_annotation_corpus.txtwilliams_2007.txt

user/alexandra_volanschi/langages_il_m1_2013.txt · Dernière modification: 2016/01/20 08:01 par Alexandra Volanschi