Outils pour utilisateurs

Outils du site


user:yamina_abdallahi:corpus:memo-etudiants-corpus

Notes aux étudiants pour la mise en ligne de corpus

Pour intégrer les fruits de vos travaux en corpus, une nomenclature a été choisie pour permettre une indexation, un classement et une gestion automatisée.

C'est la norme dite “Dublin Core” qui a été retenue pour cela. Elle est documentée de manière formelle par les RFCs 2413 et 2731. Les RFC (Request For Comments) sont les documents qui norment Internet et les réseaux publics depuis le matériel utilisé jusqu'aux informations qui y transitent et la manière dont elles doivent être transférées entre les machines. Cette normalisation permet à des machines différentes utilisées par des gens répartis aux quatre coins du monde et parlant des langues différentes de communiquer correctement.

Pour en revenir aux notices des documents et au Dublin Core, voilà quelques liens pour mieux voir de quoi il s'agit :

La construction d'une notice suppose le respect strict de certaines règles

  • Les noms de rubriques ne doivent pas être changés selon l'inspiration. “Intitulé” ne doit pas devenir “intitulé-site” ou “intitulé-source”.
  • Une rubrique ne doit pas être remplie parce qu'il faut la remplir mais parce que l'information correspondante existe : mieux vaut une notice incomplète que fausse. Il ne s'agit pas cependant d'opter pour la solution de facilité, en ne remplissant qu'une ou deux rubriques. De plus, les rubriques ne doivent pas être renseignées à l'aide d'un “idem” ou autre.

Pour vous aider, voici un modèle de notice :

Notes préalables

  • le fichier où seront renseignées les notices devra être au format .txt (donc écrit avec Notepad.exe sous Windows), afin de dissuader certains d'entre vous d'utiliser de la couleur, du gras, de l'italique, des cadres…
  • les notices des textes de référence de Nature ayant été faites par mes soins, ils ne doivent pas apparaître dans vos notices.
  • le séparateur entre les notices est #### (4 dièses). En particulier, il ne doit pas y avoir de “saut de page” ou autre. Vous pouvez cependant mettre un, et un seul, “saut de paragraphe” (touche “entrée”) avant et après le séparateur.
  • le séparateur entre le nom de la rubrique et les renseignements y figurant est la tabulation (une seule).
  • le séparateur, lorsqu'il y a plusieurs informations, de même nature, pour une même rubrique est le point-virgule. Typiquement, losqu'il y a plusieurs auteurs.
  • Lorsqu'il y a plusieurs informations de nature différentes, le séparateur est la virgule.

Notice commentée

  • Intitulé Titre du document

S'il n'y a pas de titre, ce qui arrive, cette rubrique ne sera pas renseignée.

  • Sujet : cette nouvelle rubrique permet de palier au problème de l'absence de titre. C'est le thème de l'article ( à ne pas confondre avec le domaine). Il peut ainsi y avoir un document dont le sujet est “El nino” et le domaine la “climatologie”.
  • Source En particulier nom de la revue d'origine (lieu)…

Cette rubrique est utile lorque le document internet a préalablement été publié sur un autre support. Elle permettra, par exemple, de mentionner la revue où l'article a été publié.

  • Langue en, en-uk, fr, de, it, es, ar, he, jp

La langue doit apparaître sous cette forme et non sous les formes français, ang ou Engl

  • Auteur Auteur(s) sous la forme Nom1, Prénom1 ; Nom2, Prénom2…

Cette rubrique ne sert pas à donner la qualité de l'auteur. Elle ne peut pas, par exemple, être renseignée par “étudiant”…

  • Editeur Nom de l'éditeur, lieu de publication

Seulement lorqu'il existe.

  • Date Date sous la forme AAAA-MM-JJ ou AAAA-MM ou AAAA, selon la précision de l'information. Lorsqu'il y a plusieurs dates, précisez, pour chacune, de quelle date il s'agit entre parenthèses. Exemple : 1995-02-22 (création) ; 1999-05-19 (dernière modification) ; 2003-10-26 (consultation). Attention, il s'agit de dates et non de périodes (il ne peut donc y avoir 2002-2003).
  • Public vulgarisation…

Essayez de condenser en un seul mot.

  • Complément Vous êtes libre d'y mettre toute information que vous jugez utile mais qui ne trouve sa place dans aucune des autres rubriques. Attention cependant à ne pas décrire le document : il existe une autre rubrique pour cela.
  • Type article, article scientifique, glossaire, lexique…
  • Format “logiciel” de création du document ou type de format (“document PDF”, par exemple)… Cette nouvelle rubrique apparaît pour résoudre le problème posé à certains d'entre vous par les fichiers PDF.
  • Domaine SVT, Économie…
  • Sous-domaine Climatologie…
  • Identifiant En particulier URL. Attention, il ne s'agit pas de mettre l'URL de la page d'accueil du site mais celle où se trouve le document. Il ne doit pas y avoir de chevrons (< et >). Il ne s'agit pas, non plus, de vous identifier (votre nom ne doit pas y figurer).
  • Description contenu du document (libre)
  • Commentaire Commentaire de l'auteur ou du contributeur. Il s'agit, le plus souvent, d'une petite note de l'auteur du document (et pas de vous) ou d'une série de mots clés.
user/yamina_abdallahi/corpus/memo-etudiants-corpus.txt · Dernière modification: 2010/12/19 20:58 par Yamina Abdallahi