Entradas anteriores

Repositorios institucionales y plataformas de inteligencia artificial ¿acceso abierto para todo?

Por Gustavo Archuby (11/02/2025)

El acceso abierto a la producción científica ha sido el objetivo principal en la creación y gestión de los repositorios institucionales en nuestro país y la región. Estos espacios digitales inicialmente surgieron como proyectos aislados, mantenidos en general por la iniciativa y el trabajo de los bibliotecarios, sobre todo en el ámbito universitario (De Volder, 2008). Pero desde 2013 se han convertido en una red de repositorios enmarcada en normativas que van desde un alcance local (facultades y universidades) hasta de alcance nacional como la Ley de Repositorios Digitales Institucionales de Acceso Abierto. Estas normativas implican que dispongan de metadatos estandarizados y protocolos de recolección de datos con un fin de colaboración académica pero a la vez facilitan el acceso a toda plataforma que quiera utilizar esos datos con otros fines.

El desarrollo de los modelos de lenguaje a gran escala (LLMs del inglés Large Language Models) y la expansión de las llamadas “plataformas de inteligencia artificial”, cuyo núcleo son estos modelos, introdujo desafíos significativos para los repositorios institucionales. Esto se debe a que las empresas tecnológicas extraen masivamente la información que publican los repositorios para entrenar sus modelos de lenguaje, y dar respuesta desde sus plataformas a los usuarios, utilizando esta información  sin referenciar a sus autores ni mencionar a los repositorios.

Este uso no consentido de los repositorios no solo desvía su propósito original, sino que también ocurre sin una propuesta económica!!!, algo mínimamente esperable de empresas/corporaciones salidas del seno del capitalismo. Como señala Zuckerfeld (2016), esta apropiación cognitiva es parte fundante del modelo capitalista, y esta forma de piratería de conocimiento / información, si no es norma, es una excepción que se repite con regularidad. Sus consecuencias son múltiples: se genera una contradicción con el principio de acceso abierto, ya que los recursos creados para el beneficio de la comunidad académica y la sociedad en su conjunto terminan siendo utilizados con fines comerciales por empresas privadas del exterior, violan la única restricción que dicta la declaración de la Iniciativa de Budapest para el Acceso Abierto, al no generar una referencia a los repositorios como fuente, ni citar a las y los autores al momento de generar las respuestas, por último, está extracción de datos implica una sobrecarga para las infraestructuras locales, los servidores y el ancho de banda, que se ven afectados y muchas veces saturados lo que termina generando un servicio de mala calidad para los usuarios legítimos de los repositorios. Es que estas empresas, además, suelen ignorar restricciones como el archivo robots.txt, diseñado para limitar el acceso automatizado a determinados contenidos, tal como se explica en un foro de la comunidad DSpace (2024), lo que evidencia una explotación indiscriminada de recursos académicos sin respetar los acuerdos establecidos.

Seguir leyendo