Accueil
 
   
   
 

Prospective - besoins du généalogiste
Les Sources

Gedcom : fonctions utiles pour une bonne gestion des sources

Réflexions sur la crédibilité d'une source

Le concept de sources

 

Pour aller plus loin sur la terminologie des sources
http://www.bibl.ulaval.ca/doelec/citedoce.html
http://www.bibliotheques.uqam.ca/InfoSphere/sciences_humaines/tutoriel7.html

comparatifs de logiciels sur l'export Gedcom des sources

 


Gedcom : fonctions utiles pour une bonne gestion des sources   Haut de la page

Possibilité d'assigner une source, non seulement aux événements courants, NMD et BMS mais à tous les événements : OCCU, RESI, etc..

Possibilité d'assigner une source sur des liens et relations (ASSO), aussi sur la création de l'individu même s'il n'a pas d'événement spécifique.

Utilisation de tous les tags permis par la norme Gedcom, et donc par la possibilité d'utiliser des citations de sources [SOURCE_CITATIONS]. [Cette fonctionnalité n'est mise en oeuvre que par quelques logiciels américains : PAF, LEGACY, TMG.) AUCUN logiciel français ne semble le gérer.
Ainsi un fichier Gedcom conforme aux normes ne sera pas reconnu complètement aux niveaux des extraits de textes dans un logiciel français ... ]
La citation de source permet de ne pas créer une source à chaque fois mais de considérer comme source non un acte par exemple mais le registre de naissance, de traiter l'acte comme citation, avec son contenu en Data. Lorsqu'on a des dizaines d'ancêtres sur le même registre cela simplifie les choses...

Un logiciel doit pouvoir lier plusieurs sources à un enregistrement (évènement, individu, famille etc ...).

Tout est source, il suffit de la citer, eventuellement en accompagnant cette citation d'un commentaire indiquant le niveau de confiance qu'on en a. Si le logiciel gère un champ de type "confiance" ou "sureté" d'une source (tag [QUAY]) il faut renseigner ce champ sinon il faut l'indiquer texto dans les commentaires de la source.
Legacy 5 (logiciel anglophone) gratuit. On y trouve la citation et la sureté [QUAY] avec les options suivantes : convincing evidence, almost certain, probable, marginal evidence, not yet decided.

Débat : le numéro dans un répertoire qui sert à identifier une pièce dans une collection (ex :cote) [CALN]. Selon la norme ce tag appartient à REPO.
Ex : un généalogiste transcrit un acte de naissance sur une feuille de papier. Quand il saisit les références de cette transcription dans son logiciel, le numéro doit-il être : la côte du registre aux Archives ou le numéro de classemment du papier dans ses archives personnelles ?
Remarques :
1) On pourrait prendre un numéro [CALN] pour chaque représentation de la source de base unique. Ce qui revient à créér deux sources.
2) Il faut pouvoir accepter les deux car tout dépend de ce que le généalogiste a dans l'optique de faire: une genealogie familiale personnelle, une généalogie pour le compte d'un tiers, une généalogie dans un but plus "administratif" (recherche en succession...)
Tout dépend si le chercheur raisonne par rapport à sa collection ou aux archives publiques.
3) Par contre il semble important pour des questions pratiques et de cohérance de sa base et de son gedcom d'avoir soit l'un soit l'autre mais pas les deux formats dans ses (citations de) sources.
4) Le Silicon Valley PAF User Group, Familiy History Documentation Guidelines, (July 2000, San Jose, CA: SV-PAF-UG] préconise des methodes de nomage des sources. Trois de leurs méthodes préconnisées reprises dans leurs exemples sont visibles sur leur site sur la page 6 de ce document : http://www.svpafug.org/syllabus.pdf

 


Réflexions sur la crédibilité d'une source   Haut de la page

Pour mesurer l'intérêt d'une source, Gedcom nous propose une échelle à quatre niveaux :
" CERTAINTY_ASSESSMENT: = {Size=1:1} [ 0 | 1 | 2 | 3 ]
The QUAY tag's value conveys the submitter's quantitative evaluation of the credibility of a piece of information, based upon its supporting evidence. Some systems use this feature to rank multiple conflicting opinions for display of most likely information first. It is not intended to eliminate the receiver's need to evaluate the evidence for themselves.
0 = Unreliable evidence or estimated data
1 = Questionable reliability of evidence (interviews, census, oral genealogies, or potential for bias for example, an autobiography)
2 = Secondary evidence, data officially recorded sometime after event
3 = Direct and primary evidence used, or by dominance of the evidence "

Legacy 5 utilise lui aussi quatre niveaux avec aussi un joker pour dire je ne sais pas conclure ou je n'ai pas eu le temps de traiter, ce qui semble un bon complément pour batir une sélection : convincing evidence, almost certain, probable, marginal evidence, not yet decided.

Dans un logiciel s'inspirant des préceptes Gentech mais encore en developpement on trouve : convincing evidence, assemblage of evidence, probable conclusion, marginal evidence, not decided
Ce qui précise le "surety level" qui s'applique à une source (enregistrement de base).

Pour compléter la citation il est possible de noter "support level for assertion" : primary and direct support, secondary or indirect, inconsistent, direct conflict, undetermined
En effet une source peut ne pas avoir la même force de preuve pour chacun des éléments qu'elle relate.

Il est possible aussi de qualifier une source selon son accessibilité, essentiellement publique ou privée.
Recevant un gedcom avec des sources il est efficace de savoir si elles sont consultables et selon quelles modalités

Mais tout cela est lourd à gérer comparé à l'avantage résultant. Seuls deux cas sont significatifs:
- la source est une preuve, en principe d'accès public
- la source procure une présomption parce qu'elle est soit imprécise soit indirecte
Tous les autres cas conflit, inconsistance, marginal .... ne constituent pas des preuves. Le besoin de les détailler n'est pas évident. L'absence de renseignement est l'indication implicite qu'il n'y a rien.

Pour les généalogies à diffusion restreinte, la parenté en général, on peut imaginer que la preuve est constituée par référence à des documents de famille sous possession privée.

 


Le concept de sources   Haut de la page

Le concept de sources par Sylvain Peyrichou

Les généalogistes désignent par SOURCES tous documents qui apportent des informations pour la construction d'une généalogie.

Face au grand nombre de données à traiter il devient naturel de prendre en charge les dites sources dans un logiciel de généalogie. Il s'agit de les enregistrer, les conserver et les consulter pour mener à bien l'analyse des liens de parenté.
Cependant les généalogistes sont amenés à échanger des informations. Il est plus efficace que le support soit compatible avec le plus grand nombre de logiciels. La solution unique au monde est celle de gedcom. Elle couvre aussi le transfert des sources.

Sans détailler le parcours pour atteidre le modèle actuel voici le schéma de base. Il consiste à distinguer deux groupes d'informations, d'abord celles qui concernent le contenu des sources et leur identification, ensuite celles qui décrivent l'usage des sources par les déductions. Par convention et pour la facilité le mot sources désignera le premier groupe et le mot citation désignera le second groupe. Cette précision concerne les données proprement dites et leur représentation dans un fichier gedcom.

Chaque éditeur organise les données selon un modèle qui lui est propre et souvent non publié.

Par contre la règle gedcom précise:
- les données composantes d'une source sont placées dans un enregistrement avec un identificateur et le fichier contient autant d'enregistrements que de sources.
- Les citations d'une source sont placées dans une sous structure intégrée dans l'enregistrement groupant les données d'une même nature d'enregistrement, en pratique ce sera pour une personne, une famille ou un événement lui même présent pour une personne ou une famille.
Les sources relatent toujours plusieurs éléments qui seront chacun documentés par une citation de la source. Il est évident que l'enregistrement unique d'une source conduit à des économies d'espace et limite les temps d'éxécution. Ce schéma citation par référence est indispensable et fait partie des fonctions d'un bon logiciel de généalogie.

La règle gedcom précise tous les cas de figures où il peut être fait appel à des citations de sources. La liste synthétique de ces cas est disponible dans le tableau des tags qui indique pour chacun les usages possibles. La recherche de bonne utilisation est plus confortable dans l'arbre qui globalise toute la grammaire.

Ce qui précède englobe tout le contour du potentiel disponible dans gedcom. Maintenant il convient de rappeler que si la syntaxe doit être conforme la règle, gedcom ne définit pas ce que doit contenir un fichier. C'est l'éditeur du logiciel qui détermine le contenu du fichier gedcom produit.

Voilà la première raison à nos difficultés d'échange de données. De plus les éditeurs ne publient jamais ce type de renseignement. Par contre ils revendiquent fort les vertus des fonctions gedcom offertes. Ceci n'a aucun sens et génère beaucoup de déception chez les utilisateurs.

Dans cet environnement flou ou souple selon l'éclairage, les utilisateurs doivent dire ce qu'ils veulent et ce dont ils ont besoin. A charge pour chacun de vérifier son logiciel et d'en changer selon ses objectifs.

 

Un enregistrement SOURCE

Une page du site normalisation présente une liste des données et une méthode sur la manière de renseigner les zones et pour les logiciels les plus courants. C'est le minimum pour un logiciel sérieux.
Bien sûr on peut toujours allonger cette liste. Souvent des critères de documentaliste sont avancés mais ils n'apportent rien à l'analyse généalogique. La frontière n'est pas la même pour tous. Et il est toujours possible d'associer un gestionnaire spécialisé qui sera plus performant et soulagera la base de données qui deviendrait lourde en espace et lente en évolution.
Dans un gedcom la présence des sources doit être précisée. Doit-on exporter toutes les sources d'une base ou seulement celles citées pour les personnes décrites dans un fichier qui n'est pas global. En d'autres termes le dictionnaire des sources doit-il faire partie du fichier. Je ne pense pas mais un logiciel offrant le choix serait bienvenu.

Une citation de source

Elle est associée au niveau le plus détaillé pour exploiter tout ce qui est relaté dans une source . Une citation contient au moins la référence de la source preuve du fait enregistré. Si la source est importante un repérage peut figurer comme un numéro de page dans le cas d'un volume. Un texte peut également être présent à propos de l'événement si la source enregistrée ne contient pas déjà le texte global.

Il serait souhaitable d'enregistrer la qualité, la force de preuve de cette source, en un mot les raisons qui conduisent le chercheur à sa déduction. Cette disposition est particulièrement utile chaque fois que le fait est probable avec un seul élément et que l'appéciation peut évoluer avec l'apparition d'autres précisions.

La réalité des échanges en début 2004

Les éléments qui précèdent ne sont pas tous convenablement traités par les logiciels dominants, par le nombre, dans la communauté généalogique. Les différences portent sur la nature des données et sur la représentation. Le détail de ces divergences apparait dans les rapports de test.
Il pourra être utile de consulter le rapport pour un logiciel donné et prévoir si le transfert sera réussi ou au contraire si des préparatifs seront indispensables

Impact des avancées technologiques

L'informatique sait parfaitement produire et transférer des images. Il est normal qu'un logiciel de généalogie fasse appel à ces technologies. Actuellemnt il n'y a pas de modèle reconnu comme dominant, chaque éditeur y va de son approche propriétaire. Il est impossible de transférer entre logiciels les données et les images de façon simple. Des bricolages un peu complexes permettent parfois des succès, c'est toujours long.

La règle gedcom n'est pas muette. L'intégration des données media n'est pas raisonnable par contre la citation des fichiers par adresse et type, avec en option un titre(nom) rend des services. Elle est disponible dans quelques logiciels.

Les textes sont enregistrés dans un gedcom sous forme de texte pur, format qui parait triste pour certains. Parfois il est possible de les transférer en RTF puisque les balises sont elles mêmes en texte, mais nous butons une nouvelle fois sur les différences d'interprétation du logiciel récepteur.

Ne devrait-on pas généraliser l'usage de fichiers externes pour les textes en soulageant les logiciels tout en apportant toute la souplesse à l'utilisateur dans son choix d'éditeur texte ou de traitement de texte ?

Mise en pratique

Le concept 'source' est relativement simple. Sa mise en oeuvre n'est pas complexe. La difficulté résulte de choix, souvent inexplicables, par les concepteurs. Les sites mentionnés au fil du document vous fourniront les commentaires et les outils pour maitriser votre gestion des sources.

 

Participant(e)s : Sylvain Peyrichou, Patrick Texier, Patrice Legoux, Daniel Durand, Jean Roger Tixier-Toutain (alias Jerotito), Jean-Pierre Riballier, Nicolas Verstraete, Renaud Anzieu.

Haut de la page

 


plan   accueil  recherche  liens  contact  avril 2005