10 reglas sencillas para tener una buena visualización de datos científicos

Autor Nicolás Medina Silva el 12/13/19 7:59 AM

10 reglas sencillas para tener una buena visualización de datos científicos

El aforismo “una imagen vale mil palabras” se atribuye comúnmente a la adaptación de un antiguo proverbio chino y a pesar de haber sido propuesto hace cientos de años, en la medida que nos introducimos en la era de la gestión basada en datos (También puede leer: La importancia de SISPRO en la era de la gestión basada en datos) y comenzamos a hacer uso de las herramientas de la ciencia de datos (También puede leer: Alcance de la inteligencia de negocios y ciencia de datos en salud) en la actividad científica o administrativa, esta pequeña regla toma cada vez más relevancia.

Una de las figuras modernas más influyentes en la visualización de datos es Edward Tufte. Desde su posición como profesor emérito de la Universidad de Yale, en la que dictó cursos sobre estadística, y diseño de interfaces, él ha defendido el minimalismo en la representación gráfica de datos y la eliminación de todo tipo de atributo que estorbe en su comprensión. Las recomendaciones de Tufte para el desarrollo de visualizaciones son ampliamente citadas y utilizadas en las actividades relacionadas con la visualización de datos. Igualmente, su libro “La representación visual de datos cuantitativos” es una referencia invaluable en este campo y es ampliamente recomendada para introducirse en este tema.

Otros autores, siguiendo la propuesta inicial de Tufte han desarrollado algunas reglas que se pueden usar al momento de diseñar una visualización. Uno de los esfuerzos más concisos fue publicado en el 2014 por Rouguier y colaboradores (disponible gratuitamente, doi:10.1371/journal.pcbi.1003833). Acá se desarrollan 10 reglas simples para elaborar mejores figuras y a pesar de que este documento está pensado figuras para artículos científicos, su contenido general es aplicable a las visualizaciones.

“10 reglas simples para elaborar mejores figuras”:

1. Conozca su audiencia: Una visualización puede ser entendida como la interfaz entre una persona y un conjunto de datos, de acuerdo a esto, los datos y la visualización son tan solo parte de los componentes que definen si el mensaje será entendido. En otras palabras, no es lo mismo diseñar una visualización sobre obesidad para el público general o para médicos (a pesar de que el mensaje sea el mismo).

2. Identifique su mensaje: Cada visualización debe tener un propósito, si el propósito de la gráfica no se identifica de forma temprana, es difícil orientarse al momento de diseñarla ya que no se puede establecer cuáles elementos son importantes y cuáles no.

3. Adapte la figura al medio: Una imagen impresa puede tener características diferentes a las de una imagen preparada para incluir en una presentación, incluso si está mostrando exactamente lo mismo. El tamaño del texto, la ubicación de las leyendas y el uso del color son tan solo algunos de los elementos que pueden variar al cambiar el medio.

4. Las leyendas no son opcionales: Todo lo que el lector necesita debe estar incluido al interior de la figura. Las leyendas orientan al lector sobre cómo debe leer la figura y si esta información está ausente es muy improbable que la figura sea bien interpretada. Los ejes y puntos de datos deben poder identificarse rápidamente, ya que las etiquetas bien colocadas ayudan al lector a obtener una idea general de lo que muestra el gráfico.

5. No confié en los parámetros usuales: La mayoría de las herramientas usadas para diseñar figuras y visualizar datos tienen librerías con parámetros “por defecto” (i.e., parámetros que son usados para construir la gráfica cuando el usuario no los define explícitamente). Estos parámetros no son necesariamente los mejores para la gráfica que se está construyendo, así que es conveniente aprender qué efecto tienen sobre cada gráfica y definirlos explícitamente en la medida que sea conveniente.

6. Use el color de forma efectiva: El color puede ser una gran herramienta para ayudar a trasmitir un mensaje; sin embargo, el uso abundante de color en algunas gráficas puede tener un efecto contrario al deseado. Hágase la pregunta ¿es realmente necesario añadir color a esta gráfica?

7. No despiste al lector: Asegúrese de que los datos se pueden ver, en otras palabras, deje que sus datos hablen. Use los gráficos para ayudar a interpretar los datos de la forma más simple y concisa ya que el mensaje debe estar sustentado en los datos. El ejercicio de presentar los datos de forma atractiva y objetiva no es trivial, por el contrario, requiere de atención a cada uno de los detalles.

8. Evite el ‘chartjunk’: Muchas veces se incluyen adornos innecesarios en las gráficas y esto no solo puede ser estéticamente pesado, sino que adicionalmente puede impedir que el lector interprete correctamente el gráfico. Incluya solo marcas y símbolos que asistan al lector en la interpretación de los datos. Cada gota de tinta usada debe ayudar a cumplir este propósito.

9. El mensaje es más importante que la apariencia: Algunas visualizaciones de datos son simplemente atractivas, no obstante, este no puede ser su objetivo principal. En una visualización y en particular, en una gráfica científica, la legibilidad es el componente más importante.

10. Use las herramientas correctas: Siempre se pueden exportar los datos y llevarlos a la herramienta de visualización más adecuada. De acuerdo con el tipo de gráfica que se esté diseñando, probablemente existe una herramienta o librería especifica que pueda ser usada. Aprender a usar diferentes herramientas puede ser muy valioso a largo plazo.

 

En CAIMED estamos comprometidos con el análisis de datos y su visualización, cuéntenos en los comentarios si usted o su compañía aplican estas 10 reglas.

 

Nicolás Medina Silva MD., MSc.

Gestor de Información | CAIMED

 

Ciclo de vida del análisis de datos - Infografía

 

 

Referencias

-Tufte, Edward R., 1942-. (2001). The visual display of quantitative information. Cheshire, Conn. :Graphics Press.

-Rougier NP, Droettboom M, Bourne PE (2014). Ten Simple Rules for Better Figures. PLoS Computational Biology, 10(9):1–7.

 

Etiquetas: Big Data, Inteligencia de negocios, Gestión de Información, Análisis de datos

Suscríbase al Blog

Lists by Topic

see all