lunes, 26 de septiembre de 2016

Datos (enlazados) y estadística pública (después de las jornadas JECAS2016)


Los días 22 y 23 de septiembre de 2016 estuve en las Jornadas de Estadística de las Comunidades Autónomas (JECAS2016), que se celebraron en Madrid. Existen varias razones por las que quería estar presente en esas jornadas. Primero, llevo trabajando con institutos de estadística y con datos estadísticos ofrecidos por estos institutos durante varios años, desde nuestros primeros “pinitos” con nuestro portal http://geo.linkeddata.es/ hasta algunos de los trabajos que he hecho en el Grupo de Periodismo de Datos de Medialab-Prado, incluyendo también los trabajos en la API de Localidata. También hemos trabajado en el grupo en herramientas para visualizar y validar datos en RDF DataCube (https://github.com/oeg-upm/geostatistics-conformance-tests, https://github.com/oeg-upm/statistics-service). Y Finalmente, ahora mismo estoy trabajando como experto para Eurostat/DIGICOM, ayudando en la organización de un evento sobre el uso de datos enlazados estadísticos para uno de los roadmaps que se están desarrollando ahora mismo sobre la adopción de Linked Data en la estadística pública.

Hay dos sesiones que me han interesado especialmente dentro de las jornadas (teniendo en cuenta mi perfil informático, claro). La sesión C sobre métodos y procesos estadísticos, donde se habló bastante del uso de Big Data en la estadística pública, y la sesión H sobre difusión de la información, donde di una de las ponencias sobre el trabajo que hemos estado haciendo con el Instituto Aragonés de Estadística en la generación de Linked Data estadístico sobre sus datos de estadística local.

En la primera de las sesiones (la de métodos y procesos estadísticos, y Big Data) puedo destacar (de forma completamente subjetiva, por mis propios intereses), las presentaciones hechas desde Canarias (donde se presentó uno de los trabajos hechos por Localidata en la extracción y reconciliación de establecimientos comerciales a partir de APIs), Navarra (donde se presentaron algunos resultados del uso de datos de telefonía para caracterizar turistas y excursionistas) y Euskadi (donde se presentó una prueba de concepto relacionada con el uso de datos Web para determinar costes hoteleros). Lo más importante de todas estas ponencias fue la discusión sobre los límites y oportunidades que todas estas fuentes de datos ofrecen a la hora de integrarlos en la estadística pública. Supongo que Alberto González Yanes publicará algo en su blog en algún momento (y si no, ya aprovecho para decirle que lo haga ;-))

En la segunda de las sesiones (sobre difusión estadística) se habló mucho de datos sobre municipios (muy interesante y actual la tecnología y metodología utilizada por el ICANE para la generación de sus fichas municipales <https://www.icane.es/munreport>). También hubo dos presentaciones relacionadas con R. De mi presentación, simplemente dejo aquí el enlace a la presentación en slideshare (dejo que otros comenten sobre ella, y especialmente recomiendo las conclusiones). 


En definitiva, me alegro de haber asistido a las jornadas, y eso que me perdí la parte social (vamos, la cena y la after-cena), que como le digo siempre a mis alumnos de doctorado, es una de las partes que uno no se debe perder en cualquier conferencia o evento, porque es cuando uno puede hablar de mil cosas más en un entorno más distendido. Pero es lo que tiene “jugar en casa” ;-) 

No hay comentarios:

Publicar un comentario