Conjuntos paralelos
Parallel Sets
Flujos entre categorías: cómo los conjuntos paralelos revelan la estructura de datos cualitativos
Los conjuntos paralelos son una técnica de visualización diseñada para datos categóricos que funciona de manera análoga a las coordenadas paralelas, pero sustituyendo ejes numéricos por bloques de categorías. Cada eje vertical representa una variable cualitativa —como género, nivel educativo o región— y las observaciones se agrupan en cintas que fluyen de un bloque a otro, mostrando cómo se distribuye la población a través de las categorías.
El ancho de cada cinta es proporcional al número de observaciones que comparten esa combinación de categorías, lo que permite identificar de inmediato las trayectorias más frecuentes y las combinaciones raras. Visualmente, el diagrama se asemeja a un río que se bifurca y confluye en cada nivel de clasificación.
La lectura se realiza siguiendo las cintas de izquierda a derecha: una cinta gruesa que conecta, por ejemplo, la categoría 'universitario' con 'empleo formal' y 'ingreso alto' señala una asociación dominante en los datos, mientras que cintas finas indican combinaciones poco habituales.
Encuestas, censos y segmentación de mercado: el terreno natural de las cintas categóricas
Los conjuntos paralelos son especialmente útiles en el análisis de encuestas, donde las respuestas suelen ser categóricas. Un investigador puede visualizar simultáneamente grupo de edad, nivel de estudios, situación laboral y preferencia de voto para detectar perfiles electorales sin necesidad de tablas cruzadas complejas.
En demografía, este gráfico permite explorar datos censales conectando variables como tipo de vivienda, estado civil, número de hijos y rango de ingresos. Las cintas anchas revelan los perfiles poblacionales mayoritarios y los segmentos minoritarios que merecen atención especial en políticas públicas.
Equipos de marketing recurren a los conjuntos paralelos para segmentar clientes según canal de adquisición, categoría de producto comprado, frecuencia de compra y nivel de satisfacción. La visualización facilita la identificación de segmentos rentables y de aquellos que presentan tasas de abandono elevadas.
Cintas enredadas: cuándo simplificar y cuándo buscar otra visualización
La legibilidad del diagrama se deteriora rápidamente cuando una variable tiene demasiadas categorías. Si un eje contiene más de siete u ocho bloques, las cintas se fragmentan en hilos tan finos que resultan imposibles de seguir. Agrupar categorías minoritarias en una clase residual es una estrategia necesaria para mantener la claridad.
Un error común es interpretar la posición vertical de los bloques como un orden jerárquico cuando en realidad es arbitraria. Para evitar confusiones, conviene ordenar los bloques dentro de cada eje siguiendo un criterio lógico —alfabético, de mayor a menor frecuencia o según una secuencia natural— y comunicar ese criterio al lector.
Cuando se necesita comparar magnitudes exactas entre categorías, los conjuntos paralelos no son la mejor opción, ya que la percepción del ancho de las cintas es menos precisa que la lectura de barras rectas. En esos casos, complementar el diagrama con una tabla de contingencia o un gráfico de barras apiladas proporciona el rigor numérico que las cintas no ofrecen.