lunes, 12 de noviembre de 2012

DataFest: Cómo lograr que los datos abiertos le sirvan verdaderamente al ciudadano común


El grueso de la población recién va a tomar conciencia cabal de la relevancia de los datos abiertos el día en que una elección presidencial se termine definiendo, principalmente, por el grado de transparencia que haya distinguido la gestión del candidato ganador... Es muy probable que hasta ese entonces el ciudadano común continúe estando poco familiarizado con todo lo relativo a la apertura de datos, el gobierno abierto y el acceso irrestricto a la información pública...

Palabras más, palabras menos, ése fue el espíritu de una charla informal que mantuvimos al comienzo de la segunda jornada del DataFest con Gastón Roitberg, Secretario de Redacción Multimedia de La Nación y uno de los pioneros en el ejercicio del Periodismo de Datos en la Argentina, después de que le preguntáramos si coincidía con nosotros en que el universo del open-data todavía resulta demasiado lejano e inaccesible para la gran mayoría de las personas...


Trabajo interdisciplinario colaborativo con datos abiertos

Precisamente como una manera atinada de contrarrestar tanta falta de información al respecto y de propiciar un espacio de experimentación, los días 2 y 3 de noviembre se llevó a cabo el primer DataFest en la Argentina, organizado por La Nación y la Universidad Austral, con el auspicio de la Knight Foundation, el ICFJ (International Center for Journalists), Telefónica y Google. Estudiantes, emprendedores sociales, programadores, data-miners, diseñadores y periodistas tuvimos la oportunidad de participar de este magnífico encuentro interdisciplinario enfocado en la apertura y minería de datos públicos.

Como en toda hackathon que se precie de tal, debimos trabajar en grupos para resolver empíricamente desafíos puntuales en el exiguo plazo de algunas horas, distribuidas en dos jornadas. Vale recordar que el hacker no es sólo aquel que comete delitos informáticos –que los hay, los hay...–, sino particularmente un experto “que sabe cómo desarmar y transformar las cosas para resolver alguna tarea compleja” (tomamos prestada esta certera definición de un post de Juan Arellano Valdivia). Ése es el leitmotiv que impulsa las hackathones, verdaderas maratones de conocimiento en las que personas habilidosas, provenientes de ámbitos dispares, se alían para encontrar soluciones innovadoras a problemas acuciantes en tiempo récord.


Momi Peralta Ramos, Gerente de Proyecto de Nación Data, y Ricardo Brom, Gerente de Tecnología y Seguridad Informática de La Nación, se encargaron de enmarcar los alcances del encuentro y de presentar las bases de datos que fueron puestas a disposición de los participantes para que se valieran de ellas en su abordaje de los diversos proyectos propuestos, que pueden ser consultados a través de este HackDash.

Ricardo Brom - Momi Peralta Ramos - Carlos Guyot - Sandra Crucianelli - Darío Wainer
Nos dividimos en nueve grupos: 1. Gasto Público; 2. Medio Ambiente; 3. Transporte; 4. Energía; 5. Pobreza; 6. Déficit Habitacional; 7. Monitoreo Presupuestario; 8. Actividad Legislativa; y 9. Justicia. El objetivo fue que cada equipo abordase de manera innovadora estos temas con los datos disponibles y luego compartiera hallazgos significativos –en la medida de lo posible, se entiende–. He aquí algunos ejemplos de las líneas de acción llevadas a cabo por los concurrentes:
  • Comparar estadísticas gubernamentales relativas al índice de pobreza con la cantidad de nuevos asentamientos precarios (a pesar de que oficialmente habría menos pobres, cada vez se verifica un mayor número de tierras tomadas...).
  • Descubrir posibles vínculos de legisladores en ejercicio de sus funciones con sociedades proveedoras del Estado.
  • Analizar la presencia de ciertas palabras clave –nubes de palabras– en los discursos presidenciales y su posible correlato con determinados cambios coyunturales.
  • Trazar perfiles de actuación parlamentaria individual y en bloque (votaciones a favor, en contra, abstenciones y ausentismo).
  • Rastrear los sorteos de asignación de salas a partir del vasto corpus de fallos judiciales disponible, exponiendo la cantidad de sentencias condenatorias y absolutorias en cada una de ellas.
  • Mapear el precio de combustibles por provincia, consumo de gas natural y subsidios al gasoil para el transporte público.
Los concurrentes se dividieron en nueve equipos temáticos
A decir verdad, el trabajo grupal de los equipos durante la primera jornada se presentó un tanto caótico, ¿pero acaso no es eso algo inherente a todas las hackathones? La necesaria cuota inicial de libertad y una cierta anarquía, de la mano de la creatividad, dieron paso luego al trabajo ordenado. En la segunda y última jornada las ideas fueron decantando, tomando forma, y los buenos resultados se hicieron visibles. El DataFest fue coronado con la exhibición de cada uno de los proyectos grupales, e incluso fueron premiadas las mejores iniciativas: Los proyectos que el Datafest nos dejó.

Romina Colman - Gonzalo Iglesias - Noel Alonso Murray - Andy Tow
Paralelamente al trabajo en grupos, el viernes distintos miembros del equipo de Nación Data ofrecieron tres disertaciones que sirvieron para complementar la faz experimental del DataFest:

Gastón Roitberg brindó interesantes precisiones acerca del proyecto @LNData, puesto en marcha hace poco más de un año: “En las redacciones vienen surgiendo nuevos perfiles profesionales híbridos como productores de datos, líderes de proyecto, analistas de datos, programadores, diseñadores interactivos y scrappers, que se están integrando a los roles tradicionales. Es importante que los medios reserven una parte del tiempo para explorar algunas alternativas de cómo contar historias a través de los datos, con un objetivo de laboratorio en tiempo real”.

Luego hizo hincapié en los dos pilares de Nación Data: 1. Abrir los datos y catalogarlos, para luego integrarlos en contenidos disponibles para el público. 2. Desarrollar proyectos concretos de periodismo de datos. Remarcó la importancia de ir generando un reservorio de visualizaciones atractivas, interactivas, descargables y embebibles, que permitan que la ciudadanía realmente acceda a información relevante.

Mariana Trigo Viera, integrante del equipo de Visualización y Diseño Interactivo de Nación Data, presentó las virtudes y potencialidades de Tableau Public, una herramienta gratuita que permite crear y compartir visualizaciones de datos abiertos en la web y generar tablas interactivas y fácilmente customizables.


La última disertación de la tarde de la primera jornada estuvo a cargo de Sandra Crucianelli, Knight Fellow del ICFJ, quien compartió con la audiencia diferentes estrategias y recursos que le han permitido profundizar su búsqueda de datos de interés periodístico en la web, con la solvencia y el apasionamiento que la caracterizan.

Sandra Crucianelli
A continuación transcribimos los tramos más representativos del artículo Data Fest en Argentina: promoviendo la transparencia y la colaboración, que Sandra posteó en el blog de IJNet:

“El equipo de datos del diario La Nación y la Universidad Austral fueron los anfitriones de esta iniciativa, durante la cual, a lo largo de dos días, más de 250 inscriptos tuvieron acceso al trabajo previamente llevado a cabo con el valor agregado de ofrecer algo así como un tesoro a quienes acudieron a la cita: algo tan simple como un enlace, pero a la vez, tan poderoso.

“No es para menos. Ese enlace contiene un caudal de información que sería muy difícil de recolectar por un reportero o un ciudadano, ya que ese link es como un faro que ilumina la ruta: nos lleva a decenas de repositorios con cientos de miles de datos que, definitivamente, nos cuestan bastante en el país en el que vivimos.

“Tuve el privilegio de ser testigo de este proceso, acaso pionero en América Latina, en el que desde el Data Team de La Nación, se trabajó durante muchos meses; de manera formal y de manera informal también, a través de diferentes reuniones y encuentros, como el que demandó dos jornadas completas de trabajo con el objetivo de crear el dataset de los Censos 2001 y 2012 [...]

“Un eje transversal unió a este abanico temático: la promoción de la transparencia y el control social, ejercicios llevados a cabo por diferentes actores de la sociedad civil interesados en el bien común”.


La  agenda del sábado incluyó un DataCamp, espacio destinado a compartir experiencias, análisis de casos y herramientas útiles para el trabajo con bases de datos. El equipo de Buenos Aires Data, de la Dirección de Gobierno Abierto, presentó su portal de datos abiertos, lanzado este año. Por otra parte, Ernesto Mislej disertó sobre técnicas de minería de textos para analizar opiniones.

Andy Tow compartió con los asistentes su reconocida experiencia en visualizaciones de mapeos electorales. Juan Ignacio Belbis habló sobre los procesos de open-data en gobiernos y estándares de datos públicos y dinámicos. Mariano Blejman y Marcos Vanetta, de Hacks/Hackers Buenos Aires, brindaron precisiones sobre el proyecto Analice.me, un recurso de datamining, análisis semántico y visualización de relaciones contenidas en documentos.

Romina Colman, responsable de Producción de Datos de Nación Data, ofreció una estupenda presentación sobre acceso a la información pública y periodismo (te recomendamos efusivamente que leas Chile: una decisión a favor del acceso a la información), y Gonzalo Iglesias, del equipo Data del Gobierno de la Ciudad de Buenos Aires, compartió sus experiencias en el uso de Google Refine y Fusion Tables para la publicación de datos en el portal de la Ciudad.


OpenGov: El “efecto Hawthorne” y la transparencia

A la hora de elegir uno de los nueve grupos, decidimos incorporarnos al equipo de Actividad Legislativa, junto con la gente de la Fundación Directorio Legislativo y de Gobierno Abierto, ya que en el InSTEDD iLab América Latina nos interesa muy especialmente explorar maneras innovadoras de fortalecer la participación ciudadana a través de plataformas que permitan monitorear la gestión de gobierno y la actividad parlamentaria, en la búsqueda de una mayor transparencia.

Para nosotros, un modelo a seguir en este sentido es el desarrollado por la Fundación Ciudadano Inteligente, en Chile. Su misión es fortalecer la democracia y reducir la desigualdad en América Latina, promoviendo la transparencia y la participación ciudadana a través del uso innovador de las tecnologías de la información. Para ello se vale de una plataforma integral de herramientas de empoderamiento ciudadano que permiten monitorear elecciones, detectar intereses personales de parlamentarios que se contrapongan a sus deberes como representantes, rastrear el destino de fondos públicos, cotejar el cumplimiento efectivo de promesas pre-electorales, abogar por el acceso irrestricto a datos públicos y mucho más...

El “efecto Hawthorne” es una forma de reactividad psicológica por la que los sujetos de un experimento muestran una modificación en algún aspecto de su conducta como consecuencia del hecho de saber que están siendo estudiados, y no en respuesta a ningún tipo de manipulación específica. En otros términos, se supone que si los legisladores saben que están siendo observados, van a hacer mejor letra, o al menos no se sentirán tan impunes en cuanto a su rendición de cuentas ante la ciudadanía...


Algunas reflexiones finales...

Indudablemente, el DataFest fue todo un éxito. Felicitaciones a los organizadores, a los sponsors y a la entusiasta concurrencia. Ahora bien, si se nos permite una pequeña crítica constructiva que pueda ser aprovechada para mejorar futuros encuentros, humildemente, consideramos que quizás habría sido saludable un mínimo debate previo, antes de habernos introducido de lleno en el maravilloso mundo de los datos abiertos...

¿Para qué estamos haciendo todo esto? ¿Quiénes serán los destinatarios finales de las múltiples prácticas de aprovechamiento de datos abiertos? Ciertamente, ni los periodistas, ni la comunidad científica ni los claustros universitarios... Los beneficiarios últimos de toda esta valiosa información deberían ser los ciudadanos comunes. Por favor, no perdamos esto de vista, ya que todo el enfoque operativo resultante dependerá de esta perspectiva. 

Resulta muy estimulante presenciar las disertaciones de los expertos, escucharlos y aprender de ellos, pero por momentos pareciera que cuesta mucho trabajo bajar a tierra tanta data, por más “abierta” que sea... Éste es sólo un  punto de partida, importantísimo, por cierto, pero si no logramos que esa información se vea reflejada en aplicaciones sencillas de usar, jamás vamos a alcanzar el impacto social que estamos procurando a través de todas estas técnicas que pretenden sacarle el jugo al open-data.

Creemos que el desafío que planteamos en el título tiene que ver con ingeniárnoslas para aprovechar todos esos datos y tornarlos útiles para cualquiera, en pos de un empoderamiento ciudadano tangible. Como suele decirse, dejemos que los datos “hablen por sí mismos”, sí, pero debemos estar capacitados como para entender lo que nos están contando. Y ese entrenamiento pendiente, esa ardua misión pedagógica, seguramente estará en manos de docentes, periodistas, comunicadores y todo tipo de articuladores sociales. Esto recién empieza...

El DataFest, haciendo honor a su nombre, terminó convirtiéndose en una fiesta multitudinaria. Agradecemos a los organizadores y a todos los concurrentes. Se vivió un clima de colaboración y entusiasmo contagioso. Con muchos de Uds. seguramente nos volveremos a encontrar en Desarrollando América Latina, la próxima gran hackathon regional, y entre todos seguiremos tratando de conseguir que los datos abiertos le sirvan verdaderamente al ciudadano común. Será hasta entonces.

1 comentario:

  1. Felicitaciones su trabajo un favor tomenos mas en cuenta el adulto contemporaneo, todavia tenemos algunas falencias en el conocimiento de este campo.Saludos...

    ResponderEliminar