Datos abiertos (open data)

Open Data

"Una obra o contenido son abiertos si cualquiera es libre de utilizarlos, reutilizarlos y redistribuirlos, con la única obligación, como máximo, de reconocimiento y/o compartir-igual."

Definición

Más información

Open Data: unlocking innovation and performance with liquid information. Informe del Mckinsey Global Institute sobre el desbloqueo de la innovación y rendimiento con información líquida.

Principios de Panton: conjunto de principios escritos en 2009 en el Panton Arms (Cambridge), más tarde perfeccionados con la ayuda de miembros del Open Knowledge Foundation Working Group on Open Data in Science y oficialmente publicados en febrero de 2010. Tienen como objetivo dar recomendaciones sobre el uso y destacar la importancia de los Open Data para el funcionamiento eficiaz de la ciencia.

Declaración de La Haya sobre descubrimiento de conocimiento en la era digital, elaborada por LIBER para promover la remoción de los obstaculos en la legislación de copyright y de otras barreras que impiden un acceso más amplio y equitativo a los datos; busca el establecimiento de una excepción de copyright en favor de la minería de datos (text and data mining)

The Right to Read is the Right to Mine (LERU, 2015) reclama que la reforma del copyright en la UE contemple dos excepciones obligatorias: una para fines de investigación y educación, y otra que permita a los usuarios la minería del texto y de los datos de todo el contenido al que tengan acceso legal; es decir, el derecho a leer es el derecho a minar.

Repositorios de datos abiertos

Abert@s: portal de datos abiertos (open data) de la Xunta de Galicia para impulsar la apertura de datos en todos los organismos del sector público regional y promover su reutilización.

Coruña Smart City Open Data: Portal de Datos Abiertos de A Coruña, iniciativa del Ayuntamiento en el marco del proyecto Coruña Smart City, para impulsar la apertura de datos en todos los ámbitos locales y comarcales y promover su reutilización.

Data.gov: conjunto de datos abiertos y disponibles gratuítamente para su descarga y uso. Muchos de los conjuntos de datos son visibles a través de mapas interactivos.

Datahub: plataforma de gestión de datos de la Open Knowledge Foundation.

Data Level Metrics Project: el grupo UC3 de la California Digital Library, PLOS y NCEAS de la federación DataONE están diseñando y desarrollando métricas para el seguimiento y medida del uso de los datos, “data-level metrics” (DLM).

DataNet Federation Consortium: proyecto financiado por la National Science Foundation que tiene los siguientes objetivos: implementar una rede nacional de datos, posibilitar la investigación colaborativa en colecciones de datos compartidos, permitir la reproducibilidad de las investigaciones; y encapsular el conocimiento necesario para llevar a cabo análisis de datos como workflows, y registrar y compartir workflows.

Datos.bne.es: portal de datos bibliográficos da Biblioteca Nacional de España, publicados como Linked Open Data segundo as tecnoloxías da Web Semántica; ofrece ao usuario un novo modo de achegarse ás coleccións da BNE.

Datos.gob.es: portal de carácter nacional que organiza y gestiona el catálogo de información pública del sector público.

Datos Públicos: wiki que recopila fuentes de datos públicos disponibles en España.

EPSIplatform, (sitio web eliminado, pero su contido se mantiene en el European Data Portal), Europe One-Stop shop on Public Sector Informatión (PSI) Re-use: iniciativa de la Comisión Europea con el objetivo de fomentar el mercado de la reutilización de la Información del Sector Publico (PSI) y de los Open Data en la Unión Europea. El portal contiene noticias de desarrollos en la PSI y los Open Data europeos, casuística legal sobre la reulitización de la PSI, buenas prácticas y ejemplos de nuevos productos e servicios creados mediante la reutilización de los Open Data; y webinars y eventos en Europa. ePSIplatform abarca campos muy diversos, como ciencia y tecnología, salud, transporte y medio ambiente, entre otros.

European Data Portal: portal europeo que recolecta metadatos de los portales del sector público de los países europeos. Consta de 70 catálogos, portales web que proveen de datos al European Data Portal. Adicionalmente, recolecta metadatos del European Union Open Data Portal.

European Union Open Data Portal (Portal de datos abiertos de la UE): punto de acceso único a gran variedad de datos elaborados por las instituciones y otros organismos de la Unión Europea. Los datos se pueden utilizar, reutilizar, enlazar y redistribuir gratuitamente con fines comerciales o no comerciales.

Ideals illinois Digital: reúne, divulga y suministra el acceso a la investigación  de la University of Illinoisat Urbana-Champaing, de un modo fiabe y continuo. Todas las tesis y conferencias depositadas desde el 2010 en adelante, están disponibles.

Infraestructura de Datos Espaciales de España (Consejo Superior Geográfico): el portal de acceso a la información geográfica de España

OpenAddresses: portal web open source para la gestión de direccioness postales georeferenciadas.

OpenDataSoft :Lista de más de 1600 portales de Open Data de todo el mundo

OpenGeoCode Catalog of Open Data Portals: lista elaborada mediante crowdsourcing de más de 1400 portales de datos abiertos.

Open Government Data, Catalogues: información de la Open Knowledge Foundation sobre catálogos de open government data de todo el mundo.

Open Syllabus Explorer: base de datos elaborada por el Open Syllabus Project que recoge los libros citados en más de un millón de programas de asignaturas. Incluye la métrica de monografías Teaching Score (TS) que cuantifica en una escala de 1 a 100 la presencia de una obra en las bibliografías recomendadas de una disciplina concreta.

PANGAEA (Data Publisher for Earth & Environmental Science): biblioteca y editora de datos digitales para la ciencia del sistema Tierra. Los datos pueden ser georreferenciados temporal (fecha/tiempo o períodos geocronológicos -eónes, eras, etc.-) o espacialmente (latitud, longitud, altura/profundidad).

PKP: Public Knowledge Project: es una iniciativa de varias universidades para desarrollar software de código abierto y la investigación para mejorar la calidad y el alcance de las publicaciones académicas.

Portal de datos abiertos de la UE: da acceso a los datos abiertos publicados por las instituciones y organismos de la UE. Se pueden buscar conjuntos de datos por palabra clave, materia, por editores destacados, los más vistos, los más nuevos, etc.

Scientific Data: revista en acceso abierto y con revisión por pares del Nature Publishing Group para las descripciones de conjuntos de datos (datasets) científicamente relevantes.

3TU.Datacentrum: ofrece el conocimiento, la experiencia y  las herramientas para archivar los datos de investigación de un modo estandarizado y seguro.

UK Data Archive: la colección más grande de datos digitales de investigación de ciencias sociales y humanidades, del Reino Unido.

UNdata: la División de Estadística de las Nacións Unidas (UNDS) del Departamento de Asuntos Económicos y Sociales (DAES) puso en marcha este servicio de datos para proporcionar libre acceso a las estadísticas mundiales.

USPTO Open Data Portal: portal de datos abiertos de la United States Patent and Trademark Office, creado en respuesta a la popularidad de su app PatentsView. Consta de cuatro secciones: conjuntos de datos de patentes y marcas, visualizaciones mediante el empleo de esos datasets, una comunidad of desarrolladores y una librería de APIs

World Bank Open Data: acceso abierto y gratuito a datos sobre el desarrollo en el mundo.

Herramientas de datos abiertos

BibExcel permite realizar análisis bibliográficos (de coautorías, de colaboración) o de cualquier tipo de dato con el mismo formato, generando ficheros de datos exportables a Excel u otro programa del estilo, para su posterior elaboración.

CartoDB permite hacer mapas para la Web; dispone de filtros dinámicos y facetas para realizar búsquedas visuales en una interfaz de usuario intuitiva, y para explorar, refinar y publicar grandes cantidades de datos.

CKAN (Comprehensive Knowledge Archive Network) es el principal sistema de código abierto (mantenido por la Open Knowledge Foundation) para la gestión y accesibilidad de datos.

Digital Curation Center, Data Management Plans: recursos y herramientas creadas por el DCC (organismo británico líder en materia de preservación digital) en relación con los Planes de Gestión de Datos; como DMPonline, herramenta online para ayudar en la creación de planes personalizados según el contexto o el financiador, traducida al español y adaptada en el marco del portal PAGODA; y múltiples guías, checklists y ejemplos para aconsejar en el desarrollo de los planes.

Datahub: plataforma libre de gestión de datos de la Open Knowledge Foundation, basada en el sistema de gestión de datos CKAN.

Data Wrangler es un servicio online para el reformateo, limpieza y organización de datasets.

GitHub es un servicio de alojamiento de repositorios basado en Git, el software de control de versiones diseñado por Linus Torvalds. GitHub dispone demás de interfaz gráfica para web y móvil, y ofrece control de acceso, wikis, gestión de tareas y sistema de seguimiento de errores para cada proyecto. Cientos de instituciones gubernamentales emplean GitHub para almacenar y difundir sus datos abiertos.

Google Fusion Tables: servicio web de Google para la gestión de datos; permite ordenarlos en tablas accesibles en internet y obtener visualizaciones.

OpenRefine (antes Google Refine): herramienta para los que quieran reutilizar datos abiertos (investigadores, bibliotecarios) que permite limpiar, reparar, cambiar el formato y reordenar los datos de los ficheros contenidos en repositorios de open data (de investigación o de Administraciones Públicas).

PAGODA. PlAn de GestiÓn de DAtos de las bibliotecas del Consorcio Madroño: portal de las bibliotecas de las universidades madrileñas que ofrece asesoramiento y la herramienta PGDonline para ayudar en el proceso de creación de los Planes de Gestión de Datos exigidos por el programa Horizonte2020 para los proyectos que formen parte del Piloto de Datos de Investigación en Abierto.

Pajek: programa freeware para el análisis y visualización de grandes redes; permite generar redes de coautorías.

QGIS: aplicación open source para crear, editar, visualizar, analizar y publicar información geoespacial.

Tableau Public: software gratuito que permite crear visualizaciones interactivas de datos a partir de una hoja de cálculo o de un fichero.

UK Data Archive Research Data Cycle: herramenta interactiva del ciclo de producción de los research data, con explicaciones de sus diferentes fases y subfases.

Teaching with data: sección del UK Data Service dedicada al uso en la enseñanza de conjuntos de datos, para aprender a investigar.

Enlaces de datos abiertos

Data Literature Interlinking Service(DLI): servicio que permite compartir vínculos entre la literatura publicada y sus conjuntos de datos, siendo así fundamental para alcanzar el pleno potencial de la publicación de datos de investigación. Los enlaces son recopilados a partir de una variedad de grandes centros de datos, editores y organizaciones de investigación.

Scholix: iniciativa que construye un marco de interoperabilidad que hace más fácil compartir, intercambiar y agregar datos, buscando mejores formas para conectar los datos de investigación con la literatura científica.

Datos de investigación

Página de datos de investigación, en la que se incluye información sobre su definición, el Plan de Gestión de Datos, políticas, repositorios y directorios de datos de investigación, así como información de cómo citar los datos y las licencias aplicables a los mismos.


Universidade da Coruña
Rúa da Maestranza, 9
15001 A Coruña
+34 981 167 000