Por: Marco Scalone
El término «Datos abiertos» refiere a una filosofía y práctica que establece que ciertos datos (información geográfica, científica, gubernamental, entre otros) deben estar disponibles en forma libre para que cualquier persona u organización pueda utilizarlos, reutilizarlos y distribuirlos libremente, sin que sobre los mismos pesen restricciones de copyright, patentes u otras limitaciones de uso.
Para que los datos puedan ser libremente utilizados deben cumplir con una serie de características. Si bien hay varias definiciones, las mismas coinciden en una serie de principios: que al ser aplicados al ámbito gubernamental (es decir, a los datos generados por los gobiernos), los mismos deben ser: 1. Completos, 2. Primarios, 3. Oportunos, 4. De procesamiento automático, 5. Accesibles, 6. No discriminatorios, 7. No propietarios y 8. Liberados bajo una Licencia Libre.
Sin entrar en detalle, en cada uno se puede notar que los 4 primeros son más que nada orientados a que esos datos sean realmente útiles y los últimos 4 tratan de garantizar la libertad y accesibilidad a los mismos.
Fuentes de datos
Los ámbitos más comunes donde se generan los datos abiertos son la academia, las empresas privadas, la comunidad y los gobiernos.
Academia: Probablemente la academia (universidades, centros de investigaciones, etc.) sean las instituciones más antiguas donde se han generado datos que luego se liberan a la comunidad para ser reutilizado y avanzar colectivamente. Es allí donde se acuñó el termino datos científicos (scientific data) el que de alguna manera es un ancestro del término datos abiertos (open data).
El sector privado: Hoy en día, uno de los activos más importantes de una empresa es la información que posee, ya sea de sus clientes, competidores o del propio contexto de mercado. Dos de las empresas más grandes del mundo basan su modelo de negocio en la información que poseen de sus usuarios (Google y Facebook por ejemplo). No obstante existen situaciones en las que puede ser ventajoso publicar datos abiertos para una empresa privada. Un ejemplo en el que las empresas privadas liberan sus datos puede verse en la aplicación “Donde retiro”. https://donderetiro.uy/. ¿A qué red de pagos no le interesaría estar en esa aplicación? Suena lógico que esté disponible la información de sus cajeros y demás en forma de datos abiertos.
La comunidad: Cada día toma más importancia y a medida que la brecha digital se achique va a ser la más importante. Hoy en día hay más de un celular por persona. Es decir, mucha gente anda todo el tiempo con un dispositivo generando y compartiendo datos, esto sumado al aumento del acceso a Internet y las redes sociales hacen que la expectativa de crecimiento sea enorme.
Existen muchísimos ejemplos de datos abiertos generados por la comunidad, quizás el caso más destacado es OpenStreetMap que ha llegado a ser un completo sistema de mapas callejeros y referenciados de alta calidad que puede ser utilizado por dispositivos fijos o móviles como GPS en forma libre. Este proyecto nació como reacción a la negativa del gobierno de Gran Bretaña de liberar los datos cartográficos. Fue así que la comunidad comenzó un proyecto al cual se fueron incorporando datos generados por cada persona. Esto terminó desembocando en la resolución del gobierno de Gran Bretaña de liberar sus datos.
De alguna manera la comunidad surge y toma relevancia donde los datos de gobierno o empresas no existen o no cumplen su objetivo. Con esto conceptos como Crowdsourcing cobran popularidad y tienen puntos de contacto con este tipo de fuente de DA.
El gobierno: Fuente de datos muy importante, no solo por la cantidad de los datos que recoge y la centralidad, sino también porque la mayoría de los datos del gobierno por ley son públicos. A esto se le suma la gran variedad de datos que el gobierno maneja debido al abanico enorme de frentes de acción en los que trabaja. Administra desde una policlínica barrial (y por ende gestiona información y datos de salud) hasta un casino municipal, pasando por datos de cultura y deporte. En fin, todo tipo de datos.
Un ejemplo de aplicación hecha con datos abiertos de gobierno es la utilizada para acceder a las ubicaciones de los contenedores para depositar material reciclable ver: https://www.montevideo.gub.uy/ciudadania/desarrollo-ambiental/limpieza/contenedores/material-reciclable . Dicha aplicación fue desarrollada por la IM., y al permitir a la ciudadanía acceder libremente a dichos datos posibilitó que al poco tiempo la comunidad desarrollara otra aplicación: https://www.dondereciclo.com.uy/, que tiene las mismas funcionalidades básicas pero con una estética más atractiva y sobre todo está desarrollada para dispositivos móviles.
En este tipo de situaciones se constata una consecuencia positiva de la liberación de los datos: la comunidad (o la industria) mejora servicios provistos por el gobierno y los ciudadanos reciben un mejor servicio (por ejemplo el acceso usando dispositivos móviles) sin que el gobierno gaste más dinero. Esto es sin lugar a dudas un aumento de la eficiencia gracias a la reutilización y valor agregado a los datos crudos publicados.
Desde un punto de vista hipotético se puede decir que cada conjunto de datos público que maneja el gobierno y no abre es una pérdida potencial en la eficiencia del estado. Pues todos los datos de organismos públicos (algunos más que otros) tienen un valor en relación al potencial reuso que podría hacerse, valor potencial que se está perdiendo por no estar accesible para su reutilización.
Beneficios
Aumenta la participación: Al abrirse los datos se genera una toma de conciencia de lo que sucede asociada a la apertura. Una toma de conocimiento que muchas veces es un punto de entrada a la participación de la gente y las organizaciones.
Apropiación y Auto-empoderamiento: Dicha toma de conciencia genera además una apropiación de la información. Genera un acercamiento y un conocimiento que da la posibilidad de actuar y de alguna manera genera un auto-empoderamiento del que la accede.
Productos y servicios nuevos: El libre acceso a los datos y la apropiación que mencionamos anteriormente da la posibilidad de que muchas más personas apliquen su conocimiento y su creatividad en temas relacionados con dichos datos lo que genera nuevas visiones y formas de encarar los problemas y nuevas oportunidades para crear nuevos productos y servicios. Esto repercute positivamente sobre la industria que se puede desarrollar en torno a los datos.
Cabe destacar que muchas veces el estado no tiene los recursos necesarios para extender un determinado servicio, quizás por no ser prioritario o no entrar claramente dentro de las competencias de dicho organismo. El liberar los datos brinda la posibilidad de generar servicios en esos casos o mejorar existentes en tiempos mucho más cortos.
Tan importante es el valor que se le puede dar a estos datos que en UE se creó la plataforma de información del sector público (https://epsiplatform.eu).
Innovación: Dos cabezas piensan más que una, pero tener miles de cabezas pensando seguramente pueden hacer cosas mucho más interesantes e innovadoras.
Transparencia y control democrático: Al abrir datos, de alguna manera se está abriendo la propia gestión de la organización ( y sobre todo en el estado ) promueve la transparencia, lo que da la posibilidad del control democrático.
Interoperabilidad, eficiencia.: Se gana interoperabilidad porque el abrir los datos generalmente normaliza mucha de la información necesaria para la interoperabilidad entre organismos. Por ejemplo, liberar la codificación de calles, barrios, departamentos, entre otros, facilita que distintos organismos los descarguen y usen, organismos que potencialmente puedan interactuar entre sí usando dichos datos.
También es interesante destacar el proceso que desencadena cuando se abren/comparten cosas en general (datos, software, conocimiento). La apertura conlleva a la toma de conciencia de las cosas, lo que genera y da la posibilidad de participar. La participación hace que se sume conocimiento y creatividad, lo cual genera nuevas maneras/visiones de encarar los problemas y ver otras oportunidades.
Posibles desventajas
Privacidad: La privacidad de datos es el tema más importante a tener en cuenta en los datos abiertos y una premisa fundamental. En Uruguay existen dos leyes fundamentales para todos: la ley de acceso a la información pública (Nº 18.381 ) y la ley de protección de datos personales (18.331). Entre estas dos fijan un marco normativo de qué es público y qué no lo es. Opino que desde el punto de vista de datos abiertos de gobierno todo lo que sea considerado público debe ser abierto.
En este sentido hay que tener especial cuidado de no publicar datos personales de forma indirecta. Con esto nos referimos a datos que puedan llegar a identificar a una persona por el contexto en el que se publican. Un ejemplo claro de esto son los datos estadísticos de la educación pública en donde se disponen de datos de desempeño de escolares que son considerados privados. A simple vista no habría problemas en publicar datos estadísticos agregados por zona u escuela, pero surge el problema de que existen escuelas rurales que pueden tener uno o dos alumnos, lo cual evidentemente relaciona esos datos con los mismos. Es así que hay que tener especial cuidado con publicar datos que puedan ser cruzados con otros datos para obtener datos privados.
Considerando esto como un potencial riesgo, las distintas iniciativas de datos abiertos del estado uruguayo deben tomar en cuenta este aspecto y generar las salvaguardas para proteger la privacidad de los ciudadanos, incluso en estos casos.
Acceso a datos por parte de privados: Hay quienes consideran que al liberar los datos para su aprovechamiento o reutilización, estos pueden ser tomados por empresas privadas o multinacionales. Estimo que esto no es un problema y está directamente relacionado a la libertad de dichos datos. Si se cumple la premisa anterior de que los datos sean pura y exclusivamente públicos no hay de que temer. Los datos quedan públicos para que los aproveche cualquiera con o sin fines comerciales, así como los puede aprovechar una persona en Uruguay, los puede aprovechar Google, las oportunidades son iguales para todos.
En este aspecto veo similitudes con otros movimientos como el Software Libre. Si una empresa uruguaya o el estado libera el código de un programa que genera una ventaja competitiva a otra empresa (nacional o multinacional) y esta última se apropia y lo utiliza estamos en el mismo caso pero no por eso dejamos de pensar que el Software Libre es bueno para todos. En datos abiertos también podría ser beneficioso que otros organismos extranjeros los exploten, periodismo de datos y turismo podrían ser algunos rubros a desarrollar.
Se podría discutir si es relevante (o una desventaja para el país) el hecho que una organización o persona tenga más o menos recursos para explotarlo (o para cruzarlo con datos privados que este tenga).
No trascender el discurso: Otro tema subyacente que pueda haber es que es un tema sumamente beneficioso desde el punto de vista de marketing para el gobierno, ya que trae aparejada la noción de transparencia, que no necesariamente se da al abrir datos. La iniciativa podría correr el riesgo de que se quedara en el nivel discursivo y solo se liberaran datos “simpáticos”. El concepto de datos “simpáticos” alude a esos datos que nadie dudaría en publicar porque no le pueden traer perjuicio alguno a la institución. Un ejemplo de datos simpáticos pueden ser las ubicaciones de los contenedores de reciclaje. Por el contrario, publicar los datos crudos del balance y la ejecución presupuestal expone mucho más la gestión de un organismo al mostrar exactamente en qué se gasta el dinero de forma granular.
Situación en Uruguay
En Uruguay existen distintos organismos públicos que han tomado resoluciones de liberación de los datos que van generando, destacándose la Intendencia de Montevideo y el Instituto Nacional de Estadística, aunque en términos generales dicha liberación no es la norma. Desde el punto de vista de infraestructura, a finales del 2012 se publicó el catálogo nacional de datos de gobierno (catalogodatos.gub.uy). Esto es muy importante porque centraliza y facilita la publicación de datos abiertos a organismos públicos que no tienen recursos para generar la infraestructura adecuada. Se está evaluando abrirlo a cualquier organización que quiera publicar datos abiertos, de forma que el mismo se convierta en un catálogo nacional de datos abiertos y no solo de datos abiertos de gobierno.
A nivel de apropiación y uso se ha notado un aumento en el movimiento de la comunidad en torno a los datos. En ese sentido han contribuido los concursos de ideas y hackatones desarrollados en 2011 y 2012 (Desarrollando América Latina y Date idea), en Date Idea 2012 entre todas sus categorías (prototipos, aplicaciones, ideas) en los cuales se presentaron más de 50 grupos.
La aparición de grupos de activistas como D.A.T.A también ayudó a mejorar la divulgación de este tema, al hacerse cargo de la organización de varios eventos de difusión, apropiación y uso. Considero que a medida que crezca la cantidad y calidad de datos y se vea una constancia en la publicación y actualización se va a ir generando la confianza necesaria para que aumente el uso, sobre todo a nivel comercial.
La liberación de datos abiertos es entendida por referentes históricos del movimiento de software libre como Marcelo Branco, como una condición indispensable para que la ciudadanía tenga conocimiento real de la gestión de su gobierno, posibilitando su control y participación y evolucionando a través de su práctica hacia el llamado “Gobierno abierto”.