-
-
- Formations :
-
-
-
Moyen d’encoder de l’information afin de la stocker sur l’ordinateur.
.jpg
, .png
, etc.txt
, uniquement des caractères textuels ordinairesFichiers formatés :
.doc
: format propriétaire (Microsoft).rtf
: format propriétaire (Microsoft) : lisible, inter-opérable.odt
(Open Format Document) : logiciel libre, sources disponibles.html
, .xml
: langages à balises.pdf
: format propriétaire (Adobe Systems), même si ouvert ; préserve polices, images, graphiques et la mise en forme
Démonstration : comparaison entre les documents de type .txt
, .doc
, .html
, .rtf
, .odt
Observer la taille des documents
Pour plus de détails, voir les commentaires de l'équipe informatique
.xml
; .txt
Associations entre caractères et un ‘code’ afin de faciliter le stockage et le transfert des fichiers.
CORPUS_NOM_PRENOM/
CORPUS_NOM_PRENOM/ANGLAIS/
CORPUS_NOM_PRENOM/ANGLAIS/JDOE_2005.txt
CORPUS_NOM_PRENOM/ANGLAIS/JDOE_2005_a.txt
CORPUS_NOM_PRENOM/ANGLAIS/DFOO_2007.txt
CORPUS_NOM_PRENOM/ALLEMAND/
CORPUS_NOM_PRENOM/FRANCAIS/
CORPUS_NOM_PRENOM/FRANÇAIS/
La référence de chaque fichier doit apparaître sur la première ligne de chaque texte ! (Droits d’auteurs)
Comment citer la source ?
Démonstration : comment stocker les fichiers constituant son corpus ?
UFR EILA
Notice