De todas las visualizaciones de datos existentes, pocas resultan tan visualmente impactantes como el diagrama de Sankey. Sus bandas de flujo, que se ensanchan y estrechan para representar cantidades, tienen la capacidad de hacer visible lo invisible: cómo se mueve la energía, el dinero, los usuarios o cualquier recurso a través de un sistema.
Esta guía cubre todo lo necesario para entender, diseñar y crear un diagrama de Sankey efectivo: desde su origen histórico hasta las herramientas y técnicas más actuales.
Origen histórico: el capitán Sankey y la máquina de vapor
El diagrama lleva el nombre del capitán irlandés Matthew Henry Phineas Riall Sankey, quien en 1898 publicó un artículo en la revista Minutes of Proceedings of the Institution of Civil Engineers. En él incluyó un diagrama que mostraba la eficiencia energética de una máquina de vapor, representando cómo la energía del carbón se transformaba, se perdía en forma de calor y finalmente se convertía en trabajo útil.
Sin embargo, la idea de representar flujos con bandas proporcionales es anterior. Charles Joseph Minard ya había utilizado una técnica similar en 1869 para su célebre mapa de la campaña de Napoleón en Rusia, donde el grosor de la banda representaba el tamaño del ejército a medida que avanzaba y se reducía. Aun así, fue Sankey quien formalizó el formato que hoy conocemos y le dio su aplicación técnica más influyente.
El principio de conservación: lo que entra debe salir
El rasgo definitorio de un diagrama de Sankey es el principio de conservación de flujo. Esto significa que la suma de todas las entradas en un nodo debe ser igual a la suma de todas las salidas. Si un presupuesto de 100 millones se divide entre cinco departamentos, los flujos de salida deben sumar exactamente 100 millones.
Este principio es lo que distingue al Sankey de otros gráficos de flujo y movimiento. No se trata solo de mostrar conexiones entre elementos, como haría un diagrama de red, sino de cuantificar exactamente cuánto fluye por cada camino. El ancho de cada banda es proporcional a la magnitud del flujo, lo que permite al observador comparar visualmente la importancia relativa de cada ruta.
Esta propiedad lo hace especialmente honesto como instrumento de comunicación. Es difícil manipular o exagerar los datos cuando el principio de conservación obliga a que todo cuadre.
Casos de uso reales
La versatilidad del diagrama de Sankey se refleja en la diversidad de campos donde se utiliza. Estos son algunos de los más habituales.
Flujos de energía. Es el uso original y sigue siendo uno de los más comunes. La Agencia Internacional de Energía y numerosos organismos nacionales publican diagramas de Sankey que muestran cómo se produce, transforma y consume la energía en un país. Desde la extracción de petróleo hasta la electricidad que llega a los hogares, cada pérdida y cada transformación queda representada.
Presupuestos nacionales y corporativos. Mostrar de dónde viene el dinero y a dónde va es una aplicación natural. Organizaciones como la OCDE y múltiples portales de transparencia gubernamental utilizan Sankeys para representar ingresos fiscales y gasto público. En el ámbito corporativo, sirven para visualizar la distribución de presupuestos entre unidades de negocio.
Embudos de conversión y analítica web. Google Analytics popularizó una versión del diagrama de Sankey para mostrar el flujo de usuarios a través de un sitio web: de dónde llegan, por qué páginas navegan y dónde abandonan. Es una herramienta invaluable para equipos de producto y marketing digital que necesitan identificar puntos de fuga en sus embudos.
Cadenas de suministro y logística. Representar cómo se mueven materiales desde proveedores hasta clientes finales, pasando por centros de distribución y almacenes, es otro caso donde el Sankey brilla. Hace visible la complejidad logística y permite identificar cuellos de botella.
Migración y demografía. Los flujos migratorios entre países o regiones se visualizan con frecuencia mediante diagramas de Sankey, donde cada banda representa la cantidad de personas que se desplazan de un origen a un destino. Es un uso que complementa lo que se puede lograr con un mapa coroplético o un mapa de burbujas, añadiendo la dimensión del flujo direccional.
Herramientas para crear diagramas de Sankey
El abanico de herramientas disponibles cubre desde soluciones sin código hasta librerías de programación avanzadas.
D3.js (d3-sankey) es la opción más flexible. El plugin d3-sankey permite construir diagramas completamente personalizados, con control total sobre colores, posiciones de nodos, curvaturas de los flujos e interactividad. Es la elección correcta cuando se necesita un Sankey a medida para publicación web profesional, pero requiere conocimientos sólidos de JavaScript.
Flourish ofrece la mejor relación entre facilidad de uso y calidad del resultado. Su editor visual permite crear Sankeys interactivos arrastrando y soltando datos, con opciones de personalización razonables. Es ideal para periodistas, analistas y comunicadores que no programan.
SankeyMATIC es una herramienta web gratuita y especializada exclusivamente en este tipo de diagrama. Su interfaz es minimalista: se ingresan los flujos en formato texto simple (por ejemplo, “Petróleo [40] Transporte”) y la herramienta genera el diagrama al instante. Es perfecta para prototipos rápidos y exploración de datos.
Plotly (disponible para Python y R) permite crear Sankeys programáticamente con una sintaxis relativamente accesible. Su integración con notebooks de Jupyter lo convierte en una opción natural para científicos de datos que trabajan en entornos de análisis.
Consejos de diseño para Sankeys efectivos
Un diagrama de Sankey mal diseñado puede ser tan confuso como informativo es uno bien hecho. Estas son las prácticas que marcan la diferencia.
Limitar el número de nodos. Un Sankey con más de quince o veinte nodos se vuelve ilegible. Es preferible agrupar categorías menores en un nodo “Otros” y ofrecer el detalle en una visualización complementaria, como un treemap que permita explorar la jerarquía interna de esas categorías agrupadas.
Usar opacidad en los flujos. Las bandas del Sankey suelen cruzarse. Aplicar una opacidad del 40-60 % a los flujos permite que las intersecciones sean legibles sin ocultar información. Al pasar el cursor sobre un flujo (en versiones interactivas), se puede aumentar la opacidad para destacarlo.
Etiquetar los flujos principales. No es necesario etiquetar cada banda, pero los flujos más significativos deben llevar su valor numérico visible. Esto permite al lector cuantificar sin necesidad de consultar una tabla auxiliar.
Mantener un orden lógico. Los nodos deben disponerse en un orden que refleje la secuencia real del proceso: de izquierda a derecha para flujos temporales o de proceso, de arriba abajo para jerarquías. El ojo sigue naturalmente estas direcciones y un orden coherente reduce la carga cognitiva.
Elegir colores con propósito. Los colores pueden codificar el origen del flujo, su destino o su categoría. Lo importante es mantener la coherencia: si el nodo “Energía renovable” es verde, todos los flujos que partan de él deben conservar ese color a lo largo del diagrama.
Relación con otras visualizaciones de flujo
El diagrama de Sankey no es la única herramienta para visualizar flujos. Forma parte de una familia de gráficos que incluye el diagrama de flujo, más orientado a representar procesos lógicos y decisiones, y el gráfico de flujo aluvial, que enfatiza los cambios de estado a lo largo del tiempo. Conocer las diferencias permite elegir la representación más adecuada para cada caso.
El diagrama de Sankey es, en definitiva, una de las visualizaciones más elegantes y funcionales del catálogo de la visualización de datos. Su capacidad para hacer tangible lo abstracto, para convertir números en ríos de información visible, lo convierte en una herramienta que merece un lugar permanente en el repertorio de cualquier profesional de los datos.