Añadir nuevo comentario

Añadir nuevo comentario

Publicación de datos abiertos a partir de catálogos de información geográfica

INSPIRE, Metadatos, Open Data, 0 comentarios

 

En la actualidad, los diferentes gobiernos nacionales, regionales o locales están llevando a cabo importantes iniciativas para publicar su información a través de portales de datos abiertos. Dentro del mundo de la información geográfica, este esfuerzo de publicación de información tiene unas bases bien consolidadas gracias al impulso de las Infraestructuras de Datos Espaciales (IDE) y a la Directiva Europea INSPIRE (2007/2/CE). La unión entre ambos mundos, Open Data e IDE, es más que deseable y, de hecho, es posible gracias a soluciones como la que aquí comentamos.

Uno de los principales logros de la Ley 14/2010, de 5 de julio, sobre las Infraestructuras y Servicios de Información Geográfica en España (LISIGE), que transpone la Directiva Europea INSPIRE, ha sido que las distintas Administraciones Públicas han puesto disposición de los usuarios gran cantidad de información geográfica que hasta el momento quedaba limitada a sus propias funciones. Para ello, han implantado progresivamente diferentes tipos de servicios web que facilitan el acceso a sus recursos (servicios de visualización, servicios de descargas, etc). Especialmente importante ha sido el papel adquirido por los metadatos, dado que la citada Ley obliga a las Administraciones Públicas a crear metadatos de calidad que describan sus recursos geográficos y a hacerlos accesibles a través de servicios de localización.

Sería conveniente, por lo tanto, aprovechar el esfuerzo ya realizado por los diferentes gobiernos para publicar su información geográfica, definiendo estrategias que permitan hacer visible dicha información a través de sus portales de datos abiertos sin necesidad de tenerla duplicada ni incurrir en sobrecostes de mantenimiento. Éste es el objetivo de un par de extensiones que ha desarrollado la comunidad de usuarios de CKAN.

CKAN es una plataforma de código abierto que permite de manera sencilla, a una institución construir y personalizar un portal de datos abiertos. Incorpora herramientas que facilitan la publicación y mantenimiento de los datos, diferentes modalidades de búsqueda, gestión de usuarios, roles y permisos, así como una API para que otras aplicaciones y servicios puedan consultar y explotar la información. En su página web se puede consultar una descripción detallada de sus funcionalidades, así como ejemplos de lugares en los que se encuentra implantado (como el Portal de Datos Europeo o el Portal de Datos de Reino Unido, entre otros).

Una de las características más importantes de CKAN es la posibilidad de añadirle extensiones, lo que incrementa el potencial de esta herramienta. La extensión que nos interesa en este caso recibe el nombre de ckanext-harvest y permite añadir fuentes de datos externas a CKAN, de tal modo que periódicamente la plataforma se conectará a dichas fuentes de datos para extraer las descripciones de los recursos que contienen y almacenarlas en el propio CKAN. De este modo, la información base reside en la fuente de datos original y el portal de datos abiertos únicamente mantiene una copia automática de los recursos, evitando así duplicidades y costes de mantenimiento de la información.

La extensión ckanext-harvest incluye también un cliente web que facilita la configuración de los trabajos de recolección de datos, permitiendo la definición de las características básicas de cada trabajo, como pueden ser el título, la descripción, la URL de acceso, el tipo de fuente, la frecuencia de actualización o la organización a la que se va a asociar esta fuente de datos, así como una sección donde se pueden añadir parámetros de configuración adicionales (listado de campos adicionales para los metadatos de la fuente). Además, ofrece herramientas para controlar y administrar la ejecución de cada trabajo: volver a ejecutar la recolección (harvest), resumen de la última ejecución, consultar el listado de recursos recopilados, limpiar/eliminar los conjuntos de datos de ejecuciones anteriores, etc.

Para potenciar la funcionalidad de la anterior extensión dentro del mundo de las IDE, se requiere instalar otra extensión adicional, denominada ckanext-spatial. Esta extensión permite añadir como fuente de datos de la recolección un catálogo de metadatos con interfaz estándar CSW. La extensión es capaz de analizar los metadatos codificados según el esquema de ISO 19139 y extraer las propiedades adecuadas para su integración en el portal de datos abiertos de CKAN.

En conclusión, si un organismo desea poner en marcha su propio portal de datos abiertos y aprovechar toda la información geográfica que tiene ya catalogada, la utilización de CKAN con sus extensiones ckanext-harvest y ckanext-spatial es una opción más que recomendable que le permitirá ahorrar costes en la implantación y esfuerzos de mantenimiento en el futuro.