Datos de investigación

datos_investigacion

Definición

Plan de Gestión de Datos

Anonimización de los datos

Políticas de datos de investigación

Repositorios de datos de investigación

Directorios y buscadores de datos de investigación

Cómo citar los datos de investigación

Licencias

 Definición

Los datos de investigación son aquellos materiales generados o recogidos durante el transcurso de la realización de una investigación. En este tipo de datos se incluyen estadísticas, resultados de experimentos, cuadernos de campo, cuestionarios, etc.
Se denomina dataset al conjunto de datos reunidos durante la ejecución de un proyecto de investigación.
Todos los proyectos financiados con H2020 iniciados en 2017 deberán garantizar el acceso abierto a los datos de investigación, salvo excepciones justificadas (motivos de confidencialidad, explotación industrial, etc.)

MareData (Red Española sobre Datos de Investigación en Abierto) publicó esta guía en la que se facilitan un total de 17 recomendaciones para la gestión de los datos de investigación, precedidas de una introducción para contextualizar la importancia de compartir, de facilitar el acceso y la reutilización de los datos de investigación, y de su preservación: Recomendaciones para la gestión de datos de investigación dirigidas a investigadores.

FAIR data self-assessment tool es una herramienta que permite valorar si los datos son FAIR, es decir, encontrables, accesibles, interoperables y reutilizables.

Plan de gestión de datos

Los proyectos participantes en H2020 tendrán que entregar un Plan de Gestión de Datos (Data Management Plan-DMP) durante los 6 primeros meses de vida del proyecto. Se trata de un documento en el que se describe qué se va a hacer con los datos durante y después de finalizar la investigación.
Infografía: 10 pasos para elaborar un Plan de Gestión de Datos
Herramientas para elaborar el Plan de Gestión de Datos:

  • DMPonline: desarrollado por el Digital Curation Center, contiene numerosas plantillas según sea la agencia financiadora, incluyendo la de H2020.
  • PGDonline : adaptación y traducción al español por el Consorcio Madroño de la herramienta DMPonline. Sirve como plantilla para elaborar el Plan de Gestión de Datos siguiendo los requisitos de H2020.

Anonimización de los datos

Amnesia: herramienta de anonimización que permite borrar de los datos toda aquella información identificativa (nombres, código postal, fechas de nacimiento...). Su última versión fue financiada por el proyecto OpenAIRE2020  y por el proyecto  “My Health My Data”.

Políticas de datos de investigación

MareData (Red Española sobre Datos de Investigación en Abierto): red de investigación compuesta por grupos de investigación de siete instituciones (CSIC-IATA, CSIC-EINGENIO-UV, UA, UB, UC3M, UOC, UPV), con líneas de investigación relacionadas con la gestión de los datos científicos: interoperabilidad, publicación, acceso, localización, preservación y métricas de impacto. El objetivo de la red es coordinar la actuación de los grupos de investigación y contribuír a estructurar un marco de ciencia abierta en España.
OpenAIREplus: proyecto continuación de OpenAIRE dirigido a la publicación e incorporación de los conjuntos de datos (datasets) de investigación a los artículos científicos financiados por el programa Horizon 2020.
Open Research Data Pilot: parte del programa Horizon2020, que tiene como objetivo mejorar y maximizar el acceso y la reutilización de los datos de investigación generados por proyectos.

Repositorios de datos de investigación

Los datos de investigación se deben de depositar en un repositorio que garantice tanto la recuperación y el acceso a los datos, como la preservación a largo plazo. Entre ellos citamos:
CERN Open Data portal: punto de acceso a los datos de la investigación realizada en el CERN. Divulga los resultados preservados de diversas actividades de investigación, incluyendo software y documentación necesarios para comprender y analizar los datos que están siendo compartidos.
Dryad: repositorio que contiene datos referidos a publicaciones de ciencias y medicina.
Eudat B2Share: repositorio multidisciplinar de la EUDAT.
Figshare: repositorio internacional en el que se pueden recuperar datos por categorías temáticas.
Mendeley Data: repositorio multidisciplinar desarrollado por Elsevier.

Qualitative Data Repository (QDR): repositorio de datos de investigación generados a través de la investigación cualitativa y multimétodo de ciencias sociales.
The Dataverse Network: repositorio para datos de investigación que cuida la preservación a largo plazo y las buenas prácticas en su archivo, mientras que los investigadores pueden compartir, controlar y obtener reconocimiento de sus datos.
Zenodo: repositorio que ofrece una ventana única para los resultados de la investigación europea. Creado por OpenAire y CERN, con el apoyo de la Comisión Europea, ofrece su servicio a partir de la iniciativa europea OpenAire.

Directorios y buscadores de datos de investigación

DataCite Search: buscador general de datasets abiertos con DOI.
DataMED: buscador de datasets y repositorios en el ámbito biomédico.

DataONE: buscador de datasets en repositorios sobre datos de la tierra y medio ambiente.
DataSearch: buscador de Elsevier de datos de investigación de diferentes dominios y tipos.
Eudat B2FIND: buscador de datasets mantenido por la organización EUDAT (European Research Data Infrastructure).

FAIRsharing: buscador de estándares, repositorios de datos y políticas de acceso abierto en todas las disciplinas, con particular atención a las áreas de Biomedicina/Salud.
OAD Data Repositories: parte del Open Access Directory, ofrece un listado de repositorios temáticos para datos abiertos
Odisea: es un inventario de los depósitos que admiten conjuntos de datos de investigacion a escala mundial. Permite buscar y sugerir nuevos bancos de datos

OpenAire: buscador de la Unión Europea de publicaciones y datos científicos.
Re3data.org: registre of research data repositories: registro mundial de repositorios de datos de investigación de diferentes disciplinas académicas, con el objetivo de promover una cultura de intercambio, un mayor acceso y una mejor visibilidad de los datos de investigación. Gestionado y mantenido por DataCite. Posibilita realizar búsquedas por países, disciplinas o tipología de los datos.

Cómo citar los datos de investigación

De la misma forma que sucede con el resto de publicaciones, los datos resultantes de una investigación deben de citarse para su correcta identificación y localización, apareciendo con el resto de referencias bibliográficas. También hay diferentes formatos para citar dichos datos: APA, ISO 690, Chicago, etc.
DOI Citation Formatter es un servicio ofrecido por DataCite que construye automáticamente las citas conforme al estilo que se seleccione. Recomiendan el seguinte formato:
Creator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier (DOI)
Ejemplo de citación bibliográfica tomada del Digital.CSIC:
Mazarrasa, Inés; Marbá, Nuria; Hendriks, Iris E.; Losada, I.J.; Duarte, Carlos, M. 2013. Sediment accretion and soil elevation rates of vegetated coastal sediments [Dataset] https://digital.csic.es/handle/10261/77396
se encuentran muchos más ejemplos en la guía How to Cite Datasets and Link to Publications
Infografía: Cita tus datos de investigación

Licencias

Se recomienda que los autores asignen una licencia de uso a los datos. Las más utilizadas son Creative Commons, así como las específicas para datos Open Data Commons.
Entre las licencias de dominio público destacan:
Creative Commons Zero (CC0): ofrece los datos en dominio público. Bajo esta licencia los datos se pueden copiar, modificar, distribuir y hacer públicos, incluso para fines comerciales, sin solicitar autorización.
Public Domain Dedication and Licence (PDDL): permite compartir libremente, modificar y usar los datos para cualquier propósito y sin ningún tipo de restricción.
Todas las demás tipologías se pueden consultar en este litado de Licencias conforme a Open Definition.

Más información en la guía How to License Research Data, sobre cómo aplicar una licencia a los datos de investigación.