Acuerdo internacional sobre Datos Abiertos

Por Marcela Fushimi (14/10/2016)

 

La Facultad de Humanidades y Ciencias de la Educación y el Instituto de Investigaciones en Humanidades y Ciencias Sociales adhirieron recientemente al "Acuerdo internacional sobre Datos Abiertos". Pero, ¿qué es este acuerdo?

El acuerdo se presenta como el resultado de “Science International 2015”, la primera de una serie de reuniones anuales con cuatro representantes de la ciencia internacional (International Council for Science – ICSU; The InterAcademy Partnership – IAP; The World Academy of Sciences – TWAS; y International Social Science Council – ISSC), que tiene como objetivo lograr un impacto significativo en los desafíos clave de política científica. El acuerdo identifica las oportunidades y desafíos de la actual revolución de datos y lo señala como un tema fundamental para la política científica global, resaltando la importancia de que los datos científicos que se generan con financiamiento público estén disponibles en acceso abierto -en repositorios de datos, repositorios institucionales, repositorios temáticos- salvo legítimas excepciones, para no transformarse en un bien privado.

La versión completa del acuerdo sólo está disponible en inglés, tiene 17 páginas y puede consultarse en: http://www.science-international.org/sites/default/files/reports/open-data-in-big-data-world_long_en.pdf. Sin embargo, existe una versión resumida (4 páginas) y traducida al español que puede descargarse aquí: http://www.science-international.org/sites/default/files/reports/datos-abiertos-acuerdo_short_es.pdf.

El documento está organizado en las siguientes partes:

1. El mundo de los grandes datos (lo que se conoce como big data)

A partir del ejemplo del mapeo del genoma humano en 2003, que llevó más de 10 años y costó un billón de dólares, se pone en contexto la situación actual y los enormes avances alcanzados hasta hoy, donde los grandes volúmenes de datos y su amplitud permiten ser compartidos y vinculados para crear y explorar nuevos significados, lo cual ofrece nuevas oportunidades a todas las ciencias.

2. Las oportunidades

Un mundo rico en datos permitirá descubrir patrones, vincular y correlacionar mejor distintos aspectos de los sistemas, caracterizar la complejidad, realizar simulaciones, ampliar la comprensión de los fenómenos naturales y en definitiva, combinar conocimiento y datos de diferentes disciplinas.

3. Los desafíos

El rol fundamental de la investigación financiada con fondos públicos debe ser incrementar el acervo de conocimiento existente, y los datos abiertos permiten que las ideas fluyan de forma rápida y generalizada en la red, para lo cual es vital que se adopte, como una posición por defecto, la costumbre de publicar los datos de forma abierta, accesible y reutilizable, una vez que el proyecto que los generó ha concluido.

Los datos deben ser inteligiblemente abiertos, es decir: descubribles, accesibles, inteligibles, evaluables y reutilizables, para permitir examinar, corroborar y reproducir las observaciones o experimentos a fin de validar los resultados alcanzados.

El análisis computacional intensivo de datos y la capacidad de aprendizaje automático de las máquinas permiten análisis que superan la capacidad de los métodos estadísticos clásicos y requieren enfoques matemáticos más profundos, por lo que estas cuestiones tienen que considerarse al trabajar con grandes volúmenes de datos o datos amplios.

El principio de datos abiertos tiene implicancias éticas para los investigadores y los sujetos investigados: hay que proteger la privacidad de los sujetos y valorar mejor el trabajo de recolección de datos.

Los datos abiertos podrían beneficiar a los países con menos recursos, aunque también podrían aumentar la brecha, si esos países no pueden participar de los esfuerzos de investigación globales. Por eso es importante que las naciones desarrolladas ayuden a movilizar el potencial científico de los menos desarrollados.

Para aprovechar la oportunidad, los financiadores y las instituciones deben implementar procesos que aligeren la carga que significa para los investigadores la apertura inteligente de los datos. Las responsabilidades también comprenden a organismos internacionales como el Committee on Data for Science and Technology (CODATA) del International Council for Science (ICSU), su World Data System (WDS) y la Research Data Alliance (RDA) para promover y apoyar desarrollos que garanticen la interoperabilidad y sustentabilidad de los datos.

Se requiere de un compromiso firme de la comunidad científica global con los principios de los datos abiertos, la información abierta y el conocimiento abierto. Existen límites legítimos a la apertura, tales como la necesidad de proteger la seguridad, privacidad y propiedad mediante mecanismos juiciosos, pero que eviten la privatización del conocimiento público.

4. Los principios de los datos abiertos

Las responsabilidades son compartidas por:

  • Científicos: Aquellos financiados con fondos públicos deben poner a disposición de los demás sus datos de forma abierta e inteligente, tan pronto como sea posible, a fin de que puedan ser reutilizados y proporcionen evidencia para sus afirmaciones. En la medida de lo posible, deben depositarse en repositorios bien gestionados y confiables, con bajas barreras de acceso.
  • Instituciones de investigación y universidades: Deben crear un entorno de apoyo, dar capacitación en gestión, preservación y análisis de datos, soporte técnico pertinente y servicios de biblioteca y gestión de datos. Deben ofrecer incentivos y criterios de promoción para los involucrados en procesos de datos abiertos, así como colaborar para movilizar las capacidades de uso intensivo de los datos.
  • Editores: Deben disponer los datos para que los evaluadores puedan accederlos durante el proceso de revisión, requerir referencias y citas completas de esos datos.
  • Organismos de financiación: Deben considerar los costos involucrados en los procesos de datos abiertos en los proyectos, a fin de financiar su adecuada recolección y sostenibilidad a largo plazo en repositorios.
  • Asociaciones profesionales, sociedades científicas y academias: Deben desarrollar directrices y políticas de datos abiertos que reflejen las normas y prácticas de sus miembros.
  • Bibliotecas, archivos y repositorios: Tienen la responsabilidad del desarrollo y prestación de servicios para asegurar que los datos están disponibles y son accesibles a largo plazo.

Los límites de la apertura

Los datos abiertos deben ser la posición por defecto para la ciencia financiada con fondos públicos, mientras que las excepciones deberían limitarse a cuestiones de privacidad, seguridad y uso comercial en el interés público. Las excepciones deben justificarse caso por caso.

Las prácticas habilitantes abarcan:

  • Citación y procedencia: Cuando se usan datos creados por otros, éstos deben ser citados con referencia a su autor, a su procedencia y a un identificador digital permanente
  • Interoperabilidad: Tanto los datos en sí como los metadatos que los describen deben permitir la evaluación y reutilización, y ser interoperables.
  • Reutilización no restrictiva: Si los datos no están ya en el dominio público, deben etiquetarse como reutilizables por medio de una renuncia a los derechos o bien una licencia no restrictiva que deje en claro que los datos pueden reutilizarse sin más requisitos que el reconocimiento al productor.
  • Capacidad de vinculación: Los datos abiertos deben estar vinculados con otros basados en su contenido y contexto, a fin de maximizar su valor semántico.

El documento completo fue preparado por un grupo de trabajo de ICSU-IAP-ISSC-TWAS integrado por las siguientes personas:

  • Geoffrey Boulton, Universidad de Edimburgo, Presidente de CODATA, Preside el Grupo de Trabajo
  • Dominique Babini, CLACSO y Universidad de Buenos Aires (representante ISSC)
  • Simon Hodson, Director Ejecutivo de CODATA (representante ICSU)
  • Jianhui Li, Academia China de Ciencias-CNIC (representante IAP)
  • Tshilidzi Marwala, Universidad de Johannesburgo (representante TWAS)
  • Maria G. N. Musoke, Universidad de Makerere, Uganda (representante IAP)
  • Paul F. Uhlir, Académico, Academia Nacional de Ciencias de Estados Unidos (representante IAP); consultor independiente en política y gestión de datos.
  • Sally Wyatt, Universidad de Maastricht, eHumanities-KNAW (representante ISSC)

Desde el siguiente enlace es posible acceder al formulario para sumar adhesiones institucionales: http://www.science- international.org/

Tanto la FaHCE como el IdIHCS, en conjunto con la Biblioteca y la Prosecretaría de Gestión Editorial vienen desarrollando acciones concretas de promoción del acceso abierto en este ámbito: el repositorio Memoria Académica y los portales de revistas y libros digitales son una muestra de ello, a lo que se suma más recientemente ARCAS, el primer repositorio de fuentes de interés para la investigación. La adhesión al acuerdo de datos abiertos representa una continuidad y ratificación de las políticas de acceso abierto como vía principal para la difusión y distribución a toda la sociedad del conocimiento científico que se genera en los espacios públicos.