L1: tu as pas le fichier finalement L2: je voulais le faire dans ce sens-là moi et j' ai plus de mal de le faire comme toi L3: une entité L4: ah oui tu t' en sortiras mieux dans le sens là L3: responsable L2: oui oui oui oui je voulais le faire dans le sens-là L3: responsable du contenu de la ressource le créateur L4: donc c' est L5: bien ah oui L4: ouais respons~ responsable du contenu de la ressource L3: ouais de la fabrication va dire du contenu de la ressource L4: moi je le dis L3: on va dire ça veut dire globalement ça L4: fichier L3: non hum ouais ouais il y a pas de souci L1: ouais L2: creator L4: c' est responsable du corpus L3: hum L1: donc L4: date L3: ben il y a date de l' enregistrement L5: hum L4: ouais L2: ouais L4: on n' a que ça comme date nous hein L3: non il y a les dates de naissance et caetera mais il faut voir si on les met là ou L4: pas hum L3: non L1: à priori non moi je pense que c' est date du corpus un peu hein L4: date de l' enregistrement L1: par contre il y a date des révisions et tout ça L5: non hum hum L4: on n' a pas nous ça L1: non on n' a pas ça L2: non on a les noms des réviseurs mais on n' a pas les dates L3: vous êtes sûres L1: bon d' accord L4: hum mais on pourrait aussi avoir euh par la suite date des annotations par exemple comme c' est le cas dans OLAC L1: ben je sais pas bon enfin en tout cas pour l' instant L4: hum on a juste L1: voilà L4: date de l' enregistrement L1: O K alors description description L3: moi j' imagine c' est un texte libre ça description L5: description oui description L1: donc ce serait commentaire divers chez nous L4: description L1: par exemple L3: euh description euh L5: oui voilà L1: ah non a description détaillée du lieu nous alors attends je vais reprendre dans l' ordre L3: là c' est le contenu de la ressource L2: oui c' est ça L5: c' est un texte un texte sur la ressource L4: c' est quoi c' est celui qui est en rouge ou c' est celui qui est en bleu L5: non c' est celui là là L2: ah d' accord L3: ouais c' est commentaire sur description L1: en fait on a des notes pour plein de trucs hein on a s note sur l' enregistrement euh L3: ouais L5: donc tu l' as validée L1: note s sur la version des conventions de transcription s note sur la validité juridique au sens peut-être on s' en fout note s sur l' anonymisation description détaillée du lieu cadre situationnel L3: NNAAMMEE L1: situation d' énonciation L3: c' est pareil L1: d' accord L5: c' est pas s note sur l' enregistrement le lieu L1: et commentaires divers L5: ah non peut-être L2: pas c' est c' est c' est vague c' est c' est sur le contenu de la ressource est L4: tout oui L3: hum mais on n' a pas un champ spécifique pour ça il faudrait qu' on ait un champ L5: en fait il faudrait un résumé de la chose voilà L3: ouais un résumé L1: justement pourquoi tu veux qu' on rajoute un champ L3: parce que ça peut être utile d' avoir un résumé de du contenu de l' an-~ de la de la de l' enregistrement L1: mais on l' a pas quelque part ça L2: mais si on a ça L4: mais si on a ça ça dépend ce que tu appelles par contenu L3: ben L1: c' est oui qu' est-ce que tu entends L4: ce que tu appelles ouais L3: mais non un résumé L1: de bah si il y a thème il y a thème du corpus L3: il y a thème abordé résumé ouais L1: thème abordé résumé L3: ouais ben voilà L1: c' est pas mal ça L5: c' est ça L3: voilà L1: allez vas-y L2: c' est celui-là tu crois que c' est ça L5: oui sûr L2: ah ouais L5: sûr c' est un résumé de du succint du voilà L4: du contenu L2: ah d' accord donc ça c' est le description L1: O K c' est euh description L2: O K L4: format L1: alors L2: mais euh L1: alors c' est c' est quoi C P U c' est la taille L5: non c' est la c' est le c' est le C P U le utilisé c' est L1: la donc c' est la taille du corpus c' est ça L5: non non non L3: c' est C P U c' est pas L5: le c' est la-~ pff on est pour la mémoire ordinateur utilisé pour euh L3: voilà C P U c' est le processeur L5: travailler ta ressource L1: oui c' est tant de mégaoctets c' est ça L3: non c' est microprocesseur C P U L5: voilà L3: c' est-à-dire c' est quel ordinateur tu as utilisé quoi en gros je pense L5: parce que là c' est alors ça L1: c' est non tu dois utiliser L5: c' est quel ordinateur tu dois utiliser pour travailler avec ces ressources cette ressource L3: ça c' est certain L5: si tu as besoin de machine L1: ça on n' a L3: pas ça on n' a pas ça ouais L2: ça c' est sûr qu' on n' a pas nous hein L5: c' est ce que j' allais dire toutes ces choses~ là c' était L2: voilà L1: encoding L5: à part le l' encoding ou le le makap là mak L1: markup L5: voilà markup L3: format encoding il faut qu' on le rajoute ou on l' a pas encore encodage L5: mais-ce que c' est nécessaire L3: oui et U T F huit et caetera je pense qu' il faudra le rajouter L1: ouais ouais ça c' est sûr qu' on en aura L5: ah d' accord L3: mais celui-là on l' a pas encore il faut qu' on rajoute un champ L4: ouais L1: on le met dans transcription L3: de quoi eh ben attends encodage on l' a L1: pas on le met dans euh dans transcription L3: mais attends L1: l' encodage L3: c' est où ça L1: là L4: quand est-ce qu' on pourra mettre T E I L3: format de la transcription L4: hein NNAAMMEE L3: et votre format de la transcription c' est T R S L1: et caetera oui mais dans le format tu peux avoir T R S et puis non mais rajoutez un champ euh encodage L3: oui moi je pensais rajouter un champ encodage L1: non mais dans ce coin-là quoi je veux dire L3: oui L5: tout à fait tu auras le le type d' ordinateur le type de mémoire d' ordinateur qui aura été utilisé pour travailler avec L3: on aura juste un champ L1: voilà entre convention et note par exemple L5: normalement on met pas on met L2: pas et encoding alors L1: donc encodage des caractères L3: on rajoute pas encodage des caractères ouais L4: oui mais c' est-à-dire c' est ça L5: et le format L1: tout court U T F huit ISO latin ANSI euh L3: c' est plus voilà c' est encodage format d' encodage c' est pas T E I L1: tu sais les trucs qui font que quand tu ouvres un fichier texte chez toi tu vois euh des trucs bizarres L2: oui mais on le rajoute dans notre fiche signalétique L3: voilà L1: ouais L3: il faut qu' on le rajoute L2: et on et ça ça correspond à euh L4: format L2: format L3: format L5: format encoding L2: O K L3: format markup pour les cent vingt pages L1: donc c' est format L2: format markup c' est quoi ça L3: c' est euh le système de balisage L2: hum hum d' accord L5: ben c' est T E I L1: ben on a le T R S quand même L3: ouais L2: et alors L1: le balisage L5: non le markup skin donc en fait la la le schéma L3: c' est donc c' est format de la transcription L1: le markup c' est la D T D tu veux dire L5: c' est L4: le le format de la transcription ça rentre dans le markup L3: je pense L1: non je sais pas je sais pas ou T L5: R non non non non pour moi c' est le schéma L6: le schéma d' annotation L5: voilà le schéma d' annotation oui c' est ça markup skin L3: tu crois L1: oui donc ça on n' en a pas pour l' instant tant qu' on n' est pas en T E I on n' en a L2: pas L6: non si pour l' instant c' est T R S L5: si c' est la T E I c' est la T R S L3: c' est T R S L2: oui c' est donc on met quoi le format de transcription L1: c' est T R S L3: pour l' instant c' est le format de la transcription L2: d' accord L1: format L3: de et entre parenthèses on peut mettre D T D L6: je pense que tu mets carrément la D T D de toute façon attends tu peux pas mettre un schéma directement L5: si si si mais c' est que c' est même marqué schéma L6: ou trans L3: donc la D T D L6: de machin machin L1: de euh L3: mais ça on l' a pas on l' a pas dans l' autre sens là pour le coup L5: bah L3: si on l' a on l' a le format de la transcription D T D mais on n' a pas la la D T D de Transcriber qui est prévue on a juste le format le signaler que c' est du T R S et pas autre chose L4: hum d' accord L5: O S ça donc ça on le rajoute ou pas ou ça correspond à quoi le mark~ le markup là L4: alors L2: ah hum L1: c' est format de transcription L2: format L5: de d' accord L1: puis on mettra D T D sous ol-~ la D T D sous OLAC L3: ouais sous OLAC L1: et T R S L3: O S on s' en cogne L2: non attends L4: c' c' est quoi O S L5: O S L3: c' est c' est Operating System c' est le windows L5: et voilà c' est ça L2: et alors L5: tout pour le ou on le met pas on n' a L3: pas on s' en fout L4: on met L1: pas mais on n' a pas ça L3: ouais L2: O K d' accord ça marche L5: et so~ source code c' est le la le langage de programmation pareil donc pour la ressource L3: python L2: c' est un langage de programmation ça python c' est vrai L3: oui L5: oui L3: oui L5: bah ça va être refait L2: python pardon L6: python comme dans les Monty L2: py-~ python L6: c' est comme dans les Monty python L5: ouais ouais L2: hum hum d' accord ça va hein L4: c' est plus joli L5: python L1: je vois pas ce que ça avoir à faire à un langage de programmation dans une ressource L6: ça dépend si la ressource est un outil ou si c' est du L1: ah d' accord L5: hum L2: ben moi pas accord mais L5: mais nous on l' a L1: pas aqu-~ aque a que que a que que que L5: nous on l' a pas L3: en tout cas L1: non voilà L2: de l' année d' avant ils ont rien compris L5: identifieur s euh je pense que c' est le nom du dossier contenant le corpus L2: alors oui L3: oui L1: ben on en a plusieurs en fait L3: mais le nom du dossier c' est L5: premier ben non c' est pas possible L1: ben si attends attends-tends-tends-tends-tends j' ai j' ai vu une autre fois référencement du corpus L5: un champ juste voilà non non pour ma base il faut que c' est soit L1: non mais attends NNAAMMEE je te dis que c' est dans la fiche signalétique L5: oui L4: donc ça correspond à ton premier champ en fait L1: on a nom du dossier ici et là on a nom du corpus L4: voilà L3: identifiant c' est le même L4: mais c' est le même L1: d' accord donc on a deux instances de du même truc L3: ouais parce que là c' est pour les citations en fait on a on a étiqueté le truc parce que là c' est uniquement un champ de citation L2: d' où le troisième nom du corpus L3: voilà hum L2: il y en a L4: pas parce que il y en a un autre L1: ah bon donc c' est i- L3: à la fin pour le citer L4: à la fin tu sais quand tu pour citer le truc là L2: ah oui L3: mais c' est des champs bloqués à la fin L2: oui d' accord donc ça c' est identifieur d' accord L1: hum on a fait presque une page en langage ça va être vite fait L2: ouais langage euh L3: c' est mais est-ce qu' on l' a le champ L4: corpus ouais L3: mais on a la réponse mais-ce qu' on a le champ L2: non on n' a pas le champ L5: non n' a pas le champ L4: si si on a le champ L3: où on a langue première et caetera mais L4: on a le champ dans les locuteurs L5: oui L2: dans les locuteurs L4: ah tu veux dire on n' a pas on n' a rien qui nous dit se passe en français L3: on a statut français par défaut vu qu' on a fait que du eh oui L2: non on n' a rien nous dit que le corpus il est en français L3: eh ben il faut rajouter le champ langue L2: ouais L3: langue du corpus L2: ouais oui oui L5: donc ça c' est à rajouter L3: si c' est à rajouter L6: si si c' est pour dire toujours français ça sert à rien L3: oui mais po-~ potentiellement on pourrait en avoir d' autres L4: oui c' est pour ça qu' on l' avait pas mis de toute façon on l' avait pas mis parce qu' on L3: hum c' est qu' au départ par défaut on pensait qu' on faisait que du français mais on sait jamais on fera autre chose L5: ben NNAAMMEE peut-être il en a d' avant L3: oui L2: ben oui ben oui c' est ça L4: non mais non ses corpus sont en français de toute façon c' est la langue maternelle qui va primer L2: oui mais rien nous dit que on peut absorber d' autres corpus qui ne sont pas du français enfin c' est moins sachant qu' on travaille sur le français parlé c' est plus difficile oui L3: bah oui mais écoutez voir sait-on L2: jamais mais avant av on peut faire de l' analyse contrastive je ne sais pas moi L4: mouais ça ça coûte rien de rajouter le champ sinon L1: mais euh attendez voir à quoi ça nous sert de rajouter le champ dans la fiche signalétique si de toute façon pour NNAAMMEE concernant nos corpus ça correspondra systématiquement quand elle fera le passage d' une autre fiche à un truc OLAC à affecter la valeur français à langage L5: ah oui si vous me dîtes si L4: si bah si un jour on a autre chose L5: voilà c' est du L6: tout à fait en tout cas pour l' instant on n' a L4: pas tu fais ta mauvaise tête L6: aujourd' hui mais non mais L2: toi tu le tu tu tu tu le mettrais L6: pas tant qu' il n' y en a pas besoin je le mettrais pas je veux dire il y a pas de raison L4: mais alors à ce moment-là tout ce qu' on fait ça sert à rien puisque notre fiche elle a été créée sur nos besoins donc euh à quoi ça sert L6: de c' est un peu ce que je pense je pense que la seul intérêt c' est de projeter sur euh sur OLAC ce qui se projette bien et L4: pour et laisser tomber le reste L3: d' accord on oublie le français O K L6: moi c' est ce que je ferais hein mais L2: d' accord donc on laisse tomber le le la case L1: de ben on le rajoute pas euh L6: ta fiche L5: oui dans la fiche L6: c' est c' est exactement ce qu' a fait NNAAMMEE c' est euh que ça soit dans ta fiche ou pas quand tu traduis en en en OLAC langage français L2: d' accord L1: hum L5: mais si vous me dîtes ça moi je mets ça et euh L2: non non non non c' est L5: bon on change pas la fiche c' est L2: c' est change L4: pas donc on change L1: pas autant l' encodage des caractères on est sûr que ça on en aura besoin L6: j' ai numéroté les lignes vous avez pas le droit de rajouter L5: c' est ça qu' il veut pas qu' on change les lignes L2: parce que hé on en rajoute une déjà hein NNAAMMEE de ligne hein L1: eh mais là il a rien dit parce que l' encodage des caractères alors là L2: c' est important d' accord on a rajouté l' encodage des caractères oui là tu vas te faire rater L1: en tout cas euh L6: mais on s' en fout c' est du X M L on l' a en tête du fichier X M L ça sert à rien L2: d' accord donc voilà donc très bien on l' a met quand même ou L6: pas si ça rajoute une ligne L1: non ouais mais dans combien de temps on aura les fichiers en X M L dans combien de temps on aura les fichiers en X M L L3: il est en train là L6: ils y sont déjà T R S est du X M L L1: oui mais et il y a l' encodage des caractères dans le X M L L5: oui L6: si c' est pas marqué si c' est pas marqué c' est que oui sinon c' est marqué ce que L1: c' est ou T R S L5: on L1: ah oui donc on a mais oui bien sûr bah donc c' est bon alors on l' L2: a donc on n' a pas besoin de le mettre L1: ben plus besoin de le mettre dans la fiche L2: bon voilà allez L1: on l' a il suffit d' aller le chercher dans la transcription de dans le fichier de transcription L2: donc on rajoute pas avant L1: il y est d' office L5: il faut le chercher euh dans en L6: comment j' ai pas dit que c' était nul mais c' est L5: pas non mais c' est difficile NNAAMMEE c' est difficile de après de faire la automatique s' il faut le chercher ailleurs dans L1: une oh ben non ouais mais ça c' est pas dur dans le dans le début du du fichier X M L T R S L6: on peut s' arranger pour que ce soit toujours la même chose en U T F huit on n' est L5: pas oui si on met la même chose ça ça c' est autre chose L1: oui mais ça c' est pas sûr L5: si on met si on fixe le champ ça c' est p~ c' est c' est c' est simple mais il faut chercher dans un autre fichier ou L1: pour bon toujours le même fichier T R S ça va L5: quoi d' accord mais euh là en l' occurrence que je vais faire donc je prends ce fichier là et je L1: tu cherches le c' est le début là c' est la première ligne c' est euh L5: oui mais tandis que là il faut chercher dans un autre fichier voir euh le machin juste pour un champ L1: ouais mais tu sais si on le fait sur la fiche signalétique ben d' abord en plus les fiches signalétiques elles sont censées être remplies automatiquement deuxièmement L5: oui oui ben L4: automatiquement L5: oui sur euh sur Internet enfin sur euh sur euh ordinateur L1: bon alors l' individu lambda mettons moi il y a cinq ans je vois le champ encodage de caractères L5: tu sais pas hein L1: je reste bloquée L5: je veux bien oh oui L1: je reste bloquée devant et je sais pas quoi mettre L5: hum hum L1: je sais pas ce que c' est moi il y a cinq ans je sais pas ce que c' est l' encodage des caractères L2: non mais moi il y a cinq ans et cinq ans encore encore en plus je sais L5: toujours pas ah oui d' accord très bien très bien donc il faut L1: je pense que ça en fait il vaut mieux le laisser étiqueté par euh c-~ enfin en fait en fonction de l' ordinateur sur lequel tu vas lancer Transcriber je pense que ça va se mettre ou en U T F huit ou en ISO L5: et caetera ah bon c' est comme ça NNAAMMEE L1: mais non mais L5: tu imagines le bordel L1: c' est pas systématique mais ça peut varier selon la machine L3: mais même L1: quand comment elle est paramétrée ta machine sur laquelle tu es tu vois par défaut tu as un encodage dans chaque application L3: c' est quoi la la question j' ai pas suivi le le débat de départ L2: l' encodage encodage des caractères par exemple voilà NNAAMMEE moi je sais pas je sais pas rentrer ce truc-là L1: je vais vous donner un exemple L3: oui ben on mettra on mettra trois quatre euh L4: propositions L3: propositions L2: oui mais quand on sait L1: pas oui mais tu sais L3: pas mais tu en mets une par défaut et après tu en sélectionnes une autre L1: mais non mais tu sais tu sais pas laquelle est la bonne L2: tu sais pas les remplir du tout moi je sais pas hein remplir un truc comme ça L1: je te donne un exemple j' ouvre mon fichier mettons euh je veux faire ma fiche signalétique euh tout ça euh j' ai mon ma transcription qui est faite mon corpus il est prêt et tout je veux le rentrer je fais la fiche signalétique sur Internet d' accord j' ai fait mon corpus sous mac L3: hum hum L5: oui L1: mon éditeur s~ de texte sous mac il m' ouvre par défaut en en-~ en encodage macroman par défaut je le sais maintenant parce que j' ai regardé mais avant je savais pas donc par défaut c' est macroman moi je le sais pas je vais sur Internet pour moi le formulaire il avait toujours la même tête tout ça je mets U T F huit mettons parce que j' ai retenu T F huit NNAAMMEE elle reprend le truc elle fait automatiquement et sur euh le moissonneur on va afficher le corpus est en U T F huit en fait il est en macroman ça veut dire que très dur à exploiter L5: hum L1: alors que si euh NNAAMMEE elle prend mon fichier de transcription qui est en X M L là ce sera écrit que c' est pas U T F huit ce sera écrit mettons macroman L5: mais ça c' est autre chose L1: et elle peut l' extraire et elle est sûre d' avoir la bonne information si c' est moi qui l' a met soit je sais pas la mettre soit je me gourre et comme c' est quand même un truc d' identification des corpus euh enfin loin de nous euh loin de quelqu' un qui pourrait nous dire au fait j' arrive pas ouvrir le fichier machin L4: ouais L3: hum L1: je pense ça vaut le coup de pas f-~ de pas écrire de connerie parce que là ça enduit vraiment d' erreurs hein si tu mets un mauvais encodage L2: ben moi de toute manière je saurais pas mettre L3: ça on est d' accord mais en général dans les les balises on te demande justement notamment quand tu encodes en T E I on te demande le format de codage que tu utilises directement X M L tiens ISO L1: et oui oui quand tu encodes quand tu encodes en T E I oui mais si tu fais ta transcription sous T R S sous euh oui mais je suis d' accord mais à terme de toute façon ce sera automatique L3: oui mais à terme à terme il faut espérer qu' on ait standardisé tout ça L1: euh enfin je pense on n' a pas besoin de le mettre dans la