La Biblioteca Nacional de España (BNE), repositorio del patrimonio bibliográfico y documental del país, emana la majestuosidad natural que otorgan más de trescientos años de historia. Erigida bajo el mandato de Felipe V, constituyó un elemento dinamizador de la cultura española dieciochesca. Dada su anciana edad hay quien la considera un organismo vetusto, enraizado en un tiempo pasado que, sin embargo, dista considerablemente de su realidad actual. Sobre ello habla para CIO España Gloria Expósito, directora de Procesos y Servicios Digitales de la BNE. “Podemos confirmar que, hoy por hoy, la BNE cuenta con una madurez digital muy alta. No solo almacenamos libros, tecnológicamente hemos conseguido estar a la vanguardia”.
La modernización de un organismo con solera nunca es sencilla, confiesa Expósito, “la estrategia digital de la Biblioteca pasó de cero a cien en milésimas de segundo”. Hace unos años, rememora, no se digitalizaba absolutamente nada, no era una prioridad ni una posibilidad. No fue hasta la década de los 90 cuando comenzó a calar hondo, cuando se empezaron a llevar a término las primeras iniciativas de digitalización. Desde entonces hasta ahora el compás no ha hecho sino acelerarse; y es que la apuesta por la digitalización es hoy quiniela ganadora.
Que los tiempos han cambiado es un hecho incontestable. La división que capitanea Expósito, pocos años atrás, era una posibilidad futurista. Sin embargo, llegó a materializarse como una escisión de la dirección técnica, “área que lleva el grueso del trabajo bibliotecario”. Arrancaron, como es costumbre, como una unidad pequeña que fue creciendo considerablemente a lo largo de la década pasada al abrigo de los proyectos pioneros en digitalización. Con la evolución tecnológica irrefrenable que ha servido como hilo conductor hasta nuestros días, las necesidades cambiaron. “Optaron entonces por focalizar nuestro trabajo en la unidad digital y en cualquier proceso de servicio digital interno con vocación hacia el ciudadano, desde la web hasta la reutilización de las colecciones digitales”.
Tal ha sido el crecimiento de las necesidades digitales de la Biblioteca que, en la actualidad, todos los servicios TIC que una vez dependieron de gerencia, parte más transversal del organismo, están integrados en esta área. La decisión, comenta la directora de Procesos y Servicios Digitales de la BNE, se produjo tras observar que era conveniente que tanto la visión bibliotecaria como la visión TIC estuvieran bajo un mismo mando para coordinar proyectos en armonía. “Ahora somos una división notable, contamos con un laboratorio para desarrollar nuestras líneas internas, pero contratamos personal externo para abordar los grandes proyectos de digitalización y migración masiva”.
Estrategia de datos y ‘cloud’
La BNE custodia una rica colección de material bibliográfico y documental que va más allá de los libros. Brindar, por tanto, un número exacto de los documentos que compila en su interior es, prácticamente, misión imposible. “Por darte una cifra aproximada, no te la facilito al dato porque varía día a día, contemplamos 7 petabytes de información digital”. Con tal volumen de datos, la BNE necesita una estrategia robusta en términos de gobernanza, almacenamiento, explotación y preservación. “Salir a comprar infraestructura o adquirir software que maneje tal cantidad de información es un reto”. La colección digital no para de crecer por distintas vías, lo que implica un esfuerzo económico y de gestión “inmensos”. “No solo necesitamos almacenamiento, sino que, al preservar las colecciones digitales, necesitamos de un software que audite y migre de formato si algo se queda obsoleto”.
En las instalaciones ubicadas en el paseo de Recoletos la BNE cuenta con su particular CPD; sin embargo, Expósito se declara “fan incondicional” de la nube, “solo por escalabilidad es más eficiente”. Al apuntar a los costes ocultos del cloud, Expósito reflexiona: “A nivel económico todavía no está tan amortizada la tecnología para que te salga mejor emprender un viaje a la nube que montar un CPD físico propio. Depende de lo que se quiera hacer”. En su caso particular, la ejecutiva recuerda que la BNE es infraestructura crítica del Estado, por lo que es “delicado” apostar por almacenar todo el patrimonio digital fuera de las instalaciones. “Es un tema que se está barajando”, confiesa.
Juan José Márquez
Más allá de eso, Expósito recuerda que el Estado español cuenta con su propia nube, bautizada como SARA, “aunque todavía no tiene las prestaciones que ofrecen compañías privadas. Espero, no obstante, que mejore; creo que los proyectos que vamos a desarrollar a la larga sí van a estar en la nube, ya sea pública o privada”. De momento, prosigue Expósito, “lo único -que no es poco- que tenemos en el cloud es el sistema de gestión bibliotecario”.
Este sistema alberga la base de datos que contempla todo el catálogo de la BNE, es decir, más de 30 millones de obras. “Para gestionar todo este sistema en sintonía con las necesidades actuales hemos evolucionado el software”. Antiguamente dicho software estaba instalado en servidores de la biblioteca; desde agosto, tras concluir la migración, “tenemos el corazón de la Biblioteca, porque sin catálogo no hay nada, en la nube”.
Ciberseguridad, una máxima
Como cabe de esperar, revela Expósito, la ciberseguridad es “básica, uno de los pilares fundamentales y de las cuestiones que más me preocupa”. El distintivo de infraestructura crítica del Estado les impone ciertas normas y estándares que han de cumplir; “actualmente nos estamos certificando en el Esquema Nacional de Ciberseguridad, en el nivel que nos corresponde”. La BNE cuenta con dos cortafuegos, uno interno y otro externo del que se ocupan Huawei y Fortinet. En paralelo, además, trabajan con el Centro de Operaciones de Ciberseguridad (COX). “Lo que hace es proveer servicios de seguridad que las organizaciones integramos en nuestras instituciones. Ahora mismo tenemos prácticamente todos los servicios del COX implementados a excepción de la seguridad perimetral”.
Contra todo pronóstico, insiste la CIO, en la BNE hay “todos los días” incidentes de ciberseguridad, “aunque afortunadamente los ataques nunca hayan pasado del primer cortafuegos, penetrado o logrado extraer información”. “La ciberseguridad es fundamental y es una partida a la que dedicamos recursos”, afirma. En términos de inversión, Expósito reconoce que con los años se ha ido incrementando “bastante”, “estamos logrando conseguir lo que queremos, aunque a veces es difícil porque es todo muy rígido; el Estado funciona como una apisonadora, lenta, pero avanzando”. A corto plazo, considera la ejecutiva, “estamos cubiertos, pero a medio plazo, quizás, haya que establecer mecanismos de colaboración entre instituciones que agilicen y viabilicen la financiación”.
Inteligencia artificial: dos puntos de mira
Al ser preguntada sobre la tecnología que más clamores ha levantado a lo largo del todavía presente 2024, Expósito sorprende. “Por un lado hay que abordar cómo la IA puede mejorar la BNE; por otro, qué tiene que ofrecer la BNE para contribuir al desarrollo y la adopción de la tecnología”. “La BNE es la institución nacional que más documentos digitales en español compila, por lo que constituye una fuente de entrenamiento brutal para la IA”. En la actualidad, de hecho, con el punto de mira en el horizonte, trabajan en un proyecto para generar corpus documentales que les permitan afinar los resultados de entrenamiento de futuros modelos.
“Nosotros hacemos recolecciones masivas de Internet, de blogs, prensa, más allá del patrimonio cultural físico y digital. Es una fuente valiosísima de información”. Ese corpus de datos tan grande, que incluye lenguas cooficiales como el catalán, el gallego o el euskera, puede servir para entrenar modelos. Y aunque la iniciativa está en pañales como quien dice debido al reto de la propiedad intelectual, dada la demanda de empresas y organismos que les piden los datos para entrenar sus IA particulares, la BNE ha optado por tomar las riendas y anticiparse a las necesidades futuras. “Ahora mismo se está trabajando a nivel ministerial para regular este acceso”. Ellos, explica, “por prevenir, dado que en algún momento tendremos que facilitar dicha información, trabajamos en unos corpus lo más reutilizables posible, así es como contribuimos al desarrollo de la IA”.
Más allá de esto, son diversas las formas en que la IA también mejora la operativa de la BNE a través de diferentes proyectos. El que tienen más avanzado, comenta Expósito, es el sistema de gestión bibliotecaria y el proyecto para la catalogación automática, “el año que viene ya lo tendremos implantado”. Uno de los retos que tiene la BNE es catalogar todo lo que entra diariamente, que es “muchísimo”, por lo que es “muy difícil ir al día”. Aquí cuentan con un equipo de catalogación interno al que se suman refuerzos externos para apoyarlos; y aunque el proceso está automatizado con ciertas herramientas digitales, sigue siendo muy manual.
Juan José Márquez
En este sentido, tras ensayo y error, han desarrollado un piloto: “Cuando llega la versión digital de una obra, lo que llamamos pre-print, se lo facilitamos a una herramienta basada en IA. Así, dándole únicamente las dos o tres primeras páginas por motivos de protección de datos, hemos logrado que la tecnología catalogue adecuadamente en sintonía con los estándares internacionales”. Trabajan, dice en generar un flujo interno automatizado desde que se le pasa el pre-print a la IA hasta que se genera el registro definitivo en el software de gestión bibliotecaria”.
Pero ahí no queda todo. También cuentan con una iniciativa de transcripción de manuscritos antiguos o audio a texto. “Hay proyectos en los que la IA reconoce las letras antiguas. Además, se han desarrollado iniciativas en colaboración con las universidades para descubrir autorías de obras aparentemente anónimas. Entrenando a la IA en estilometría, tipos de lenguaje y palabras puedes obtener como resultado la identificación de un autor”. El año pasado, de hecho, lograron atribuir una obra a Lope de Vega. “Esto no afecta tanto a la operativa de la BNE, pero son proyectos bonitos en los que trabajar”.
Propósito de año nuevo: afrontar los retos del 2025
Aprovechando la recta final del año, Expósito hace balance: “A nivel de estrategia digital, lo más importante ha sido la migración del sistema de gestión bibliotecario”. El personal de la Biblioteca, asegura, “se ha volcado”, ya que afecta a absolutamente todos los departamentos. “Ha habido que migrar toda la base de datos que estaba en el sistema a este nuevo que tiene otra manera de funcionar y acceder. Dicha migración ha llevado muchísimo trabajo a lo largo de un año, desde septiembre del 2023 hasta los últimos trabajos que colean todavía en 2024. Ha sido el hito a nivel digital”.
De cara al próximo 2025, la directora de Procesos y Servicios Digitales de la BNE pone el foco en afianzar el sistema de gestión bibliotecaria para intentar trabajar con él de manera ágil y aprovechando al máximo todas las capacidades. Además, confiesa, “vamos a iniciar otra digitalización masiva a partir del mes de abril y tenemos en mente un proyecto para intentar digitalizar videojuegos antiguos”. Como propósito de año nuevo, Expósito apunta a la difusión de la labor de la BNE, “queremos que la gente participe de ello”.