Periodistas de a Pie

Nociones básicas para adentrarse en el periodismo de datos

Publicado: 07.09.2016

Taller de periodismo de datos

Impartido por Lilia Saúl
2 y 3 de septiembre, 2016
Ciudad de México

El periodismo de datos es el nuevo Punk, así lo describe Simon Rogers, el primer director y uno de los fundadores del Datablog del diario inglés The Guardian. Cualquiera puede hacerlo, las herramientas están ahí, sólo es cuestión de lanzarse a tomarlas.

Una de las máximas del Punk era que quien quisiera hacer música se conseguía una guitarra y empezaba a hacerla. Aunque no entendiera mucho de cuestiones musicales, en el camino las aprendería. Es igual con el periodismo de datos, las hojas de cálculo están ahí, nada más es cuestión de empezar a usarlas.

Puede que suene a una odisea matemática de eruditos, pero no; y para allanar un poco el camino, Lilia Saúl junto con Daniela Guazo, que conforman el equipo de datos de El Universal compartieron las bases mínimas para meterse hasta el cuello en hojas de cálculo y contar historias con ellas. Las dos periodistas impartieron un taller a una docena y media de periodistas en dos días. Si no pudiste asistir, aquí un pequeño resumen:

Qué es el periodismo de datos:

La idea es usar bases de datos para crear historias que la gente pueda entender, que sean atractivas y absorbentes. Para ello, se recopila información pública y publicada (incluso por otros medios), después se estandariza y se concentra en una base de datos. Gracias a la revolución de la era de la información esto se vuelve más sencillo.

El periodismo de datos se ha refinado y ha integrado otras disciplinas, con ello se ha vuelto una conjugación de tres mundos: el del periodista, el del analista y el de la programación. Pese a su alto grado de especialización (que es abrumador), no debe espantar al novato ni alejarlo del camino de los datos.
 
Los resplandecientes productos de dateros (como visualizaciones interactivas, conjuntos de datos abiertos o incluso apps) generados por redacciones adentradas en ello en varias partes del mundo pueden cegar al periodista y hacerlo pensar que el reporteo de calle es prescindible; nada más lejos de la verdad. Con el periodismo de datos, es necesario seguir saliendo a la calle a encontrar historias.

Antes de empezar a decir cómo hacerlo, mencionamos una serie de consideraciones generales que llamaremos:

Los mandamientos del periodismo de datos
  • Descargar y guardar las bases de datos originales. Por alguna u otra razón pueden llegar a desaparecer de internet, por lo que es bueno no confiarse de su existencia en línea.
  • Hacer copias y trabajar sobre ellas. A medida que se va trabajando sobre un archivo de datos, uno puede perder el camino y querer regresar a como empezó todo, por eso es mejor trabajar con copias de los archivos originales
  • Verificar el tipo de archivos que tenemos (sea: xlxs, dbf, csv, tsv, etc...); esto nos permite saber con qué programa lo abriremos y cómo lo importaremos.
  • Asegurarse de tener el diccionario de datos de las bases descargadas, hay veces que los encabezados de las columnas vienen en códigos que se especifican en este diccionario. Por ejemplo, el INEGI, en algunas ocasiones, en vez de usar los nombres de los estados o los municipios, los sustituye con números.
  • Una vez publicado el trabajo periodístico es importante que las bases de datos que se usaron se dispongan para su consulta y descarga.
Cómo escribir:

Uno de los cánones del periodismo se basa en las preguntas WH, el qué, quién, cómo, cuándo, dónde y por qué. Cuando se trabajan con datos éstas cobran un nuevo sentido:

Qué es lo que queremos comunicar
Quién me está dando los datos; la fuente
Cuándo se compilaron los datos que estoy usando (de preferencia, que no tengan más de dos años)
(de) Dónde los sacaron, cómo los recopilaron y los unieron
Por qué le interesarían al lector estos datos y lo que cuentan

 

Así como hay una pirámide invertida para escribir notas informativas, existe una pirámide invertida para empezar a trabajar con datos, sus pasos son los siguientes:

  • Compilar: Hacerse de todas las bases que se necesitan para hablar del tema que queremos, hay que cuidar no combinar datos que no se puedan relacionar
  • Limpiar: Darles un formato que sea amigable para nuestra computadora, que le ayude a analizarlos para que nosotros podamos buscar historias en ellos
  • Contextualizar: Decirle claramente al lector de qué van los datos, cómo se compilaron, quién lo hizo y ponerlos en un plano terrenal, que sean tangibles para la gente.
  • Combinar: Si sabemos que hay otras bases que nos pueden ayudar a hacer más interesante el juego de datos que tenemos, entonces usémosla
  • Comunicar: De qué manera quiero comunicar mis datos, pensar cómo puedo hacer para que mis datos se comuniquen. Si quiero usar un mapa, una gráfica de barras, etc…

Los datos en sí mismos no dicen mucho, lo importante es lo que el periodista hace con ellos, recordemos que una de las funciones sociales del periodista es procesar partes complejas de la realidad e interpretarlas de manera honesta a su público. Y que una de la mejor manera de transmitir datos es contando historias, eso le gusta a la gente, no los reportes numéricos.

Cómo empezar a trabajar:

Entonces, ya nos hicimos de un juego de datos decente (si no sabes de dónde sacarlos, al final de este texto hay una lista de fuentes). Es hora de empezar el proceso de limpieza de los datos, lo principal que tienes que saber es que trabajamos con hojas o bases de datos, no con tablas; las hojas o bases, no tienen colores, celdas combinadas, dibujos ni otras cosas coloridas; son solo celdas con texto (puede sonar aburrido, pero es una manera de facilitar las cosas).

  • Deshazte de las celdas combinadas
  • Fíjate que todas las celdas sean visibles (a veces hay unas que se esconden)
  • Procura tener siempre los mismos periodos para todos los datos (nada de tener años a medias, meses faltantes o de unos semanas y de otros diferentes unidades temporales)
  • Cuida que en una columna (una dimensión de los datos) no haya registros mezclados, que sean solo de un tipo. Por ejemplo que no haya estados de un país en la columna en la que están los años:

 

Después de varias horas, o incluso días de limpieza -eso tarda uno en dejar las bases utilizables-, empezamos a interrogar a nuestro archivo. Para obtener lo que queremos, necesitamos saber qué estamos buscando. De todas maneras, se recomienda que la primera entrevista que le hago a mis datos incluya los siguientes rubros:

  • Cuál es el más y el menos
  • Qué dicen del país o la región que tenemos
  • Buscar algún cambio importante en la secuencia, números que aumentan o disminuyen abruptamente
  • Qué tanto han cambiado en los periodos que tenemos, hacerlo con periodos largos
  • ¿Se pueden relacionar con otros datos?
  • Dónde puedo encontrar más datos que me ayuden a dar contexto a los que tengo
  • De ser posible, hablar con la persona que compiló los datos para saber cómo lo hizo

Advertencia: Los datos no son infalibles. Como cualquier fuente, pueden mentir, ser imprecisa o tendenciosa.

Para hacer este análisis primario de los datos, a veces es necesario calcular porcentajes y tasas, para las que se usan operaciones sencillas que explicamos a continuación:

Para comparar, por ejemplo, los homicidios cometidos en un estado con otro, es importante usar tasas. Si en un estado con 50 mil personas, hubo 3 asesinatos, no es tan grave como un estado con 20 mil personas que tuvo 3 asesinatos. A pesar de que en ambos la cantidad de asaltos es la misma, la tasa es muy diferente. Es importante comparar con tasas, no con valores totales.

En este caso, para sacar la tasa de asesinatos se divide la cantidad de casos entre la población de estudio. Normalmente se multiplica por 100 mil, para tener un número manejable respecto a la población.

Las tasas de crecimiento, o variación porcentual, determinan cuánto creció o disminuyó algo en determinado periodo. Para calcularlas se resta al valor más reciente, el antiguo y se divide entre el antiguo y se multiplica el resultado por cien. Otro ejemplo: en un estado se registraron 4 crímenes en agosto, y 3 en septiembre, para conocer la tasa de variación mensual hacemos lo siguiente: [(3-4)/4] x 100. Lo que resulta en -25%, es decir, una disminución.

Dónde encontrar datos:

 

Editorial

Editorial

Leer editorial

Directorio de OSC

Directorio de OSC

Consulta el Directorio

Global Investigative Journalism Network

Global Investigative Journalism Network

Visita el sitio

Pie de Página

Pie de Página

Visita el sitio

En el Camino

En el Camino

Visita el sitio

MéxicoLeaks

México Leaks

Visita el sitio

+ de 72

+ de 72

Visita el sitio

Periodistas en Riesgo

Mapa de registro de agresiones a periodistas

Visita el sitio

Editorial

Resiliente

Visita el sitio