Inteligencia Artificial: recurso clave para leer e indexar registros históricos
Conocer acerca de nuestros antepasados es una práctica que se hace cada vez más frecuente, ya sea mediante la elaboración de un árbol genealógico, el conocimiento sobre el origen de nuestros apellidos o bien, a través del uso de las pruebas de ADN.
Además de esto, los avances tecnológicos han permitido conectarnos con nuestros ancestros o llevar a cabo investigaciones sobre el pasado. La inteligencia artificial y la indexación se han convertido en los elementos clave en el rastreo y ordenamiento de la información, lo que marca un precedente en el conocimiento sobre nuestra historia familiar y los antepasados a través de la tecnología.
“Indexar es el proceso de capturar la información proveniente de la imagen de cualquier registro histórico, como un acta de nacimiento, de modo que se pueda tener el texto del contenido de dicha imagen y, posteriormente, se pueda ordenar, clasificar y archivar”, comentó Rodolfo Derbez, Director de ExpoGenealogía.
Indexación en línea: conoce tu historia familiar de forma fácil
Tan solo el año pasado, FamilySearch anunció que, tras 83 años de desarrollo, la digitalización de su colección de más de 2.4 millones de rollos de microfilm había sido finalizada. El archivo digital que contiene información sobre más de 11,500 millones de personas representa más de 200 países y principados; en más de 100 idiomas. Las imágenes de estos registros están disponibles para ver en línea, pero aún es necesario indexar varios registros para que los usuarios de FamilySearch puedan buscarlos y encontrarlos.
FamilySearch – organización internacional sin fines de lucro, que ofrece herramientas que ayudan a descubrir las historias familiares- hace uso de la indexación asistida por computadora o CAI (Computer Assisted Indexing), recurso de inteligencia artificial para indexar y publicar registros digitalizados. Uno de los principales registros en los que CAI se está enfocando son los registros de bautizo de la Iglesia Católica española.
Karina Morales, colaboradora de contenido de FamilySearch, explica: “La tecnología CAI que creamos abarca dos partes importantes; por un lado, el que la computadora pueda transcribir registros escritos a mano (handwriting recognition), algo que varias compañías de tecnología llevan desarrollando por más de 30 años; y por otro lado, el entrenar a la computadora para tomar ciertas partes de un documento y convertirlas en el índice de un solo registro con los nombres de las personas y sus relaciones pertinentes, a esto le llaman Natural Language Processing, proceso del que somos precursores en el campo de la genealogía desde 2020”.
“Hasta ahora se han publicado 183 millones de índices en español. Estos abarcan registros de más de 20 países de Latinoamérica, España y las Filipinas. También se han publicado 57 millones de índices en portugués, principalmente de Brasil, Cabo Verde y Portugal. Se espera seguir publicando más registros con CAI en español y portugués, para posteriormente agregar la publicación de registros en italiano y francés”, concluye Karina.