Qué es GEDCOM

 

Opinión sobre GEDCOM Por Alejandro Milberg

Compartiendo datos genealógicos Por Carlos Glikson

 


Opinión sobre GEDCOM

por Alejandro Milberg
Boston, MA

Empiezo haciendo mías las palabras de Carlos Skovgaard – esta es una escuelita donde los que no saben enseñan a los que saben menos… es ciertamente mi caso como improvisado "profe".

GEDCOM es un formato de archivo de datos. Fue desarrollado por el Departamento de Historia Familiar de The Church of Jesus Christ of Latter-day Saints, comunmente llamada "de los mormones", para proveer un formato flexible y uniforme para el intercambio de datos genealógicos computarizados. Es un acrónimo de GEnealogical Data COMmunication (comunicación de datos genealógicos), por lo que supongo que se lo traduciría como COMDG o algo así, pero la forma universalmente usada es la original.

El propósito del GEDCOM es "propiciar el compartir información genealógica y el desarrollo de una amplia gama de productos de software operativos entre sí para asistir a genealogistas, historiadores y otros investigadores" (Fuente: The GEDCOM Standard Release 5.5).

Hasta acá, todo muy lindo, pero GEDCOM fue desarrollado en realidad para una finalidad muy específica de sus creadores – la Iglesia. Una de sus creencias es la posibilidad de bautizar antepasados difuntos que no lo fueron en vida, para poder así reunirse con ellos en la eternidad. De ahí el interés en identificar a sus antepasados. Aclaro que no soy mormón y que me pasé un largo rato en el website de la Iglesia (http://www.mormon.org/learn/); si escribo alguna burrada pido disculpas a cualquier miembro de la misma que lea esto y le ruego me corrija.

Entiendo que la información que maneja la Iglesia es relativamente sencilla – nombres y apellidos, fechas y lugares de nacimiento, matrimonio y muerte (de nuevo, si me equivoco ruego me corrijan). Sin embargo, los genealogistas manejan información mucho más compleja – datos de censos, partidas y documentos variadísimos, membresías en órdenes religiosas y militares, divorcios, confirmaciones, bar mitzvahs, emigraciones, testamentos, por mencionar solamente algunas. Lógicamente, los fabricantes de programas de computación para genealogía los han ido haciendo cada vez más complejos y ricos en posibilidades, con el fin de satisfacer una demanda de usuarios cada vez más sofisticados.

Hay docenas de programas genealógicos diferentes, empezando por Personal Ancestry File (PAF), de la misma Iglesia. Naturalmente, entre los usuarios de distintos programas hay un gran interés en intercambiar información. Simplemente porque estaba disponible, GEDCOM se transformó en el formato standard de transferencia, adoptado por los diferentes fabricantes de software genealógico.

Qué pasa cuando un formato desarrollado para una finalidad (la de la Iglesia) es utilizado para manejar datos mucho más complejos? Hay que hacer interpretaciones y concesiones. Ahí empieza el barullo – lo que el programador de un software define para la exportación de la información de su programa al GEDCOM no es necesariamente lo que el programador de otra marca de software definió para el suyo… al contrario, sería un milagro que coincidieran. Y esto lleva necesariamente a la corrupción de los datos.

Hasta hace poco estaba en el limbo. Creía que bastaba con exportar los datos de mi programa a un GEDCOM y suponía que cualquiera que importara ese archivo recibiría exactamente mis datos. Sufrí una amarga decepción al asistir a una charla de Bob Velke, creador del programa The Master Genealogist, en la reciente GenTech 2002, conferencia de genealogía realizada en Boston el 25 y 26 de enero pasados. La charla era "Data Transfer Tools and Protocols" (herramientas de transferencia de datos y protocolos). No es mi propósito transcribir la charla y dudo que pudiera hacerlo aunque quisiera, por el nivel – estaba dirigida a usuarios sofisticados de programas y a programadores. Bob mencionó que las especificaciones del GEDCOM no sólo han ido variando con el tiempo, de la versión 4.0 a la 5.5, sino que esta última tuvo tres cambios oficiales en fechas sucesivas, más dos agregados y una retracción a uno de ellos. Señaló que diferentes programadores usan diferentes especificaciones, las interpretan de manera diferente y luego dió el golpe de gracia: hasta una cosa tan simple, aparentemente, como exportar un archivo a GEDCOM y de inmediato re-importarlo al mismo programa, lo que llamó un "viaje de ida y vuelta", no garantiza EN ABSOLUTO que el archivo importado sea idéntico al archivo original.

A nivel de anécdota personal - cuando escuché ésto se me heló la sangre. Hace seis años que uso el programa Family Tree Maker (FTM); nunca usé otro. Lo compré cuando vine a vivir a EEUU porque ví una muy buena crítica en una revista norteamericana de computación. Mi archivo familiar tiene más de 45.000 nombres, tipeados uno por uno (no me parece una buena idea importar información de otros archivos/programas, prefiero copiarla). Ergo, tengo hecha una inversión enorme de tiempo y esfuerzo. Hace varios meses tuve un problema técnico con mi archivo y seguí las instrucciones del fabricante para solucionarlo. Una era, justamente, exportar el archivo a GEDCOM y re-importarlo… y lo hice. El dilema era clarísimo y horripilante: cómo iba a darme cuenta si el "viaje de ida y vuelta" había hecho algún cambio en los datos? Imposible, salvo que me tropezara accidentalmente con algo muy obvio. No era el fin del mundo; guardo backups de los datos de tiempo en tiempo así que podía volver a una versión anterior al desastre, pero iba a tener que volver a entrar todos los datos que había agregado desde entonces – unos 2.000 nombres.

Por un detalle menor me dí cuenta (tengo mala memoria) de que si bien había hecho el "viaje", evidentemente había arreglado el archivo por otro camino y la versión que estaba usando no era la del viaje. Para el que le interese: si el archivo original incluye fotos, al pasar a GEDCOM se pierden porque éste no las soporta. El mío tenía dos o tres que agregué cuando empecé a usar el programa, para probar, y seguían estando en la versión actual.

Repuesto de este episodio, se me ocurrió que debe haber muchos usuarios de programas de genealogía que deben estar en la situación en la que yo estaba antes de escucharlo a Bob Velke, y por eso pensé escribir estas líneas para intentar concientizarlos de los riesgos que implica usar GEDCOM. Espero haber tenido éxito.

Alejandro Milberg
Boston, MA


 

Compartiendo datos genealógicos

La información contenida en los archivos GEDCOM

Por Carlos Glikson

A lo largo de nuestra investigación genealógica los datos, las pistas, los comentarios recibidos, las teorías y las ocurrencias espontáneas de nuevos pasos a intentar se multiplican geométricamente.

Existen diversas modalidades de archivo en papel, esquemas de carpetas y separadores, sobres etiquetados, códigos de numeración, códigos de colores, y otros métodos que ayudan a organizarse para no confiar exclusivamente a nuestra cabeza el seguimiento en lo que a ideas se refiere. Obviamente, y aunque pudiéramos llevar todo lo demás en la mente, hay que adoptar un sistema de archivo físico para ir conservando ordenadamente la documentación en papel que avala lo que vamos determinando en la investigación.

Pero para el ordenamiento, presentación y comunicación de datos de manera rápida y sencilla y sin mover físicamente los volúmenes de papel que generamos, o para una actualización sencilla o el seguimiento dinámico de apuntes y notas organizados por individuo, por rama, o por contexto de investigación, no hay como las facilidades que permiten los diversos programas genealógicos y las ayudas para el manejo de información –sean textos o imágenes- que da el computador personal.

Así, y en lo que a textos refiere, terminamos cargando en nuestro software genealógico tanto datos verificados y precisos como notas de cosas que no debemos olvidar, comentarios de los primos a verificar, teorías por confirmar, información que nos fue confiada para nuestro uso pero no para ser difundida, e intimidades que pueden hacer a una vuelta de la investigación pero que no tienen porqué publicarse.

Se suma a estas consideraciones el elemento de la privacidad de la gente viva, el  derecho a la reserva (salvo que nos autoricen a difundir esa información, y siempre que no sea información que también nos suministró otra persona reclamando a su vez reserva), y el aprovechamiento de la información personal tanto desde la incómoda legalidad del telemarketing como por la peligrosa ilegalidad del robo de identidad.

Es tema de debate si –por ejemplo– es una violación de la privacidad publicar en un árbol genealógico el nombre y apellido de una persona viva que aparece en una guía telefónica, sin mas datos identificatorios que los nombres de padre y madre, obtenidos a su vez de un certificado de nacimiento cuya copia puede tramitar alguien sin ninguna relación de parentesco con los allí nombrados. Lo que no es tema de debate es la necesidad de respeto de los expresos pedidos de reserva de los interesados directos.

El problema del robo de identidad ha alcanzado tal magnitud en los Estados Unidos que algunos datos de gran ayuda para los genealogistas antes disponibles en la web en sitios estatales o federales han pasado a ser ahora de acceso limitado. Y en algunos casos, para acceder a la información los genealogistas han quedado entrampados en una situación de “perro que se muerde la cola”. Hay casos en que se les pide, para acceder a un certificado, que demuestren su relación de parentesco. Justamente quieren tramitar una copia del certificado… para demostrarse a sí mismos que existe el parentesco!

Ante todo esto, diversos programas genealógicos prevén opciones para ampliar o limitar la información al generar archivos que se enviarán a terceros. 

Carlos Glikson
Buenos Aires, Argentina