Datos de investigación

datos_investigacion

Definición

Plan de Xestión de Datos

Anonimización dos datos

Políticas de datos de investigación

Repositorios de datos de investigación

Directorios e buscadores de datos de investigación

Como citar os datos de investigación

Licenzas

Definición

Os datos de investigación son aqueles materiais xerados ou recollidos durante o transcurso da realización dunha investigación. Neste tipo de datos inclúense estatísticas, resultados de experimentos, cadernos de campo, cuestionarios, etc.
Denomínase dataset ao conxunto de datos reunidos durante a execución dun proxecto de investigación.
Tódolos proxectos financiados con H2020 iniciados en 2017 deberán garantir o acceso aberto aos datos de investigación, salvo excepcións xustificadas (motivos de confidencialidade, explotación industrial, etc.)

MareData (Red Española sobre Datos de Investigación en Abierto) publicou esta guía na que se facilitan un total de 17 recomendacións para a xestión dos datos de investigación, precedidas dunha introdución para contextualizar a importancia de compartir, de facilitar o acceso e a reutilización dos datos de investigación, e da súa preservación: Recomendaciones para la gestión de datos de investigación dirigidas a investigadores.

FAIR data self-assessment tool é unha ferramenta que permite valorar se os datos son FAIR, isto é, encontrables, accesibles, interoperables e reutilizables.

Plan de Xestión de Datos

Os proxectos participantes en H2020 terán que entregar un Plan de Xestión de Datos (Data Management Plan-DMP) durante os 6 primeiros meses de vida do proxecto. Trátase dun documento no que se describe que se vai facer cos datos durante e despois de finalizar a investigación.
Infografía: 10 pasos para elaborar un Plan de Xestión de Datos
Ferramentas para elaborar o Plan de Xestión de datos:

  • DMPonline : desenvolvido polo Digital Curation Center, contén numerosas plantillas segundo sexa a axencia financiadora, incluíndo a de H2020.
  • PGDonline : adaptación e traducción ao español polo Consorcio Madroño da ferramenta DMPonline. Serve como plantilla para elaborar o Plan de Xestión de Datos seguindo os requisitos de H2020.

Anonimización dos datos

Amnesia: ferramenta de anonimización  que permite borrar dos datos toda aquela información identificativa (nomes, código postal, datas de nacemento...). A súa última versión foi financiada polo proxecto OpenAIRE2020  e polo proxecto “My Health My Data”.

Políticas de datos de investigación

MareData (Red Española sobre Datos de Investigación en Abierto): rede de investigación composta por grupos de investigación de sete institucións (CSIC-IATA, CSIC-EINGENIO-UV, UA, UB, UC3M, UOC, UPV), con liñas de investigación relacionadas coa xestión dos datos científicos: interoperabilidade, publicación, acceso, localización, preservación e métricas de impacto. O obxectivo da rede é coordinar a actuación dos grupos de investigación e contribuír a estruturar un marco de ciencia aberta en España.
OpenAIREplus:proxecto continuación de OpenAIRE dirixido a publicación e incorporación dos conxuntos de datos (datasets) de investigación aos artigos científicos financiados polo programa Horizon 2020.
Open Research Data Pilot: parte do programa Horizon2020, que ten como obxectivo mellorar e maximizar o acceso e a reutilización dos datos de investigación xerados por proxectos.

 Repositorios de datos de investigación

Os datos de investigación débense depositar nun repositorio que garantice tanto a recuperación e acceso aos datos, como a preservación a longo prazo. Entre eles citamos:
CERN Open Data portal: punto de acceso aos datos da investigación realizada no CERN. Divulga os resultados preservados de diversas actividades de investigación, incluíndo software e documentación necesarios para comprender e analizar os datos que están sendo compartidos.
Dryad: repositorio que contén datos referidos a publicacións de ciencias e mediciña.
Eudat B2Share: repositorio multidisciplinar da EUDAT.
Figshare: repositorio internacional no que se poden recuperar datos por categorías temáticas.
Mendeley Data: repositorio multidisciplinar desenvolvido por Elsevier.

Qualitative Data Repository (QDR): repositorio de datos de investigación xerados a través da investigación cualitativa e multimétodo de ciencias sociais.
The Dataverse Network: repositorio para datos de investigación que coida a preservación a longo prazo e as boas prácticas no seu arquivo, mentres que os investigadores poden compartir, controlar e obter recoñecemento dos seus datos.
Zenodo: repositorio que ofrece unha ventá unica para os resultados da investigación europea. Creado por OpenAire e CERN, co apoio da Comisión Europea, ofrece o seu servizo a partir da iniciativa europea OpenAire.

 Directorios e buscadores de datos de investigación

DataCite Search: buscador xeral de datasets abertos con DOI.
DataMED: buscador de datasets e repositorios no ámbito biomédico.

DataONE: buscador de datasets en repositorios sobre datos da terra e medio ambiente.
DataSearch: buscador de Elsevier de datos de investigación de diferentes dominios e tipos.
Eudat B2FIND: buscador de datasets mantido pola organización EUDAT (European Research Data Infrastructure).

FAIRsharing: buscador de estándares, repositorios de datos e políticas de acceso aberto en tódalas disciplinas, con particular atención as áreas de Biomediciña/Saúde.
OAD Data Repositories: parte do Open Access Directory, ofrece unha listaxe de repositorios temáticos para datos abertos
Odisea: é un inventario dos depósitos que admiten conxuntos de datos de investigacion a escala mundial. Permite buscar e suxerir novos bancos de datos

OpenAire: buscador da Unión Europea de publicacións e datos científicos.
Re3data.org: registre of research data repositories: rexistro mundial de repositorios de datos de investigación de diferentes disciplinas académicas, co obxectivo de promover unha cultura de intercambio, un maior acceso e unha millor visibilidadedos datos de investigación. Xestionado e mantido por DataCite. Posibilita realizar buscas por países, disciplinas ou tipoloxía dos datos.

Como citar os datos de investigación

Do mesmo xeito que sucede co resto de publicacións, os datos resultantes dunha investigación deben de citarse para a súa correcta identificación e localización, aparecendo co resto de referencias bibliográficas. Tamén hai diferentes formatos para citar ditos datos: APA, ISO 690, Chicago, etc.
DOI Citation Formatter é un servizo ofrecido por DataCite que constrúe automáticamente as citas conforme ao estilo que se seleccione. Recomendan o seguinte formato:
Creator (PublicationYear): Title. Version. Publisher. ResourceType. Identifier (DOI)
Exemplo de citación bibliográfica tomada do Digital.CSIC:
Mazarrasa, Inés; Marbá, Nuria; Hendriks, Iris E.; Losada, I.J.; Duarte, Carlos, M. 2013. Sediment accretion and soil elevation rates of vegetated coastal sediments [Dataset] https://digital.csic.es/handle/10261/77396
Atópanse moitos máis exemplos na guía How to Cite Datasets and Link to Publications
Infografía: Cita tus datos de investigación

Licenzas

Recoméndase que os autores asignen unha licenza de uso aos datos. As máis utilizadas son Creative Commons, así como as específicas para datos Open Data Commons.
Entre as licenzas de dominio público destacan:

  • Creative Commons Zero (CC0): ofrece os datos en dominio público. Baixo esta licenza os datos pódense copiar, modificar, distribuir e facer públicos, incluso para fins comerciais, sen solicitar autorización.
  • Public Domain Dedication and Licence (PDDL): permite compartir libremente, modificar e usar os datos para calquera propósito e sen ningún tipo de restricción.

Tódalas demais tipoloxías pódense consultar nesta listaxe de Licenzas conforme a Open Definition.

Máis información na guía How to License Research Data, sobre como aplicar unha licenza aos datos de investigación.