Análisis de redes en ciencias de la salud: fundamentos, métodos y aplicaciones

Author

Amaru Simón Agüero Jiménez

Published

May 12, 2026

1 Análisis de redes en salud

1.1 Introducción al análisis de redes en salud

En las últimas décadas, el análisis de redes se ha convertido en una herramienta fundamental en salud pública, epidemiología y biomedicina. Este enfoque permite representar sistemas complejos (como poblaciones, patógenos o entidades biológicas) mediante redes de nodos interconectados por relaciones, facilitando el estudio de patrones relacionales que impactan la salud. Por ejemplo, las redes sociales influyen en la difusión de comportamientos saludables o factores de riesgo, mientras que las redes de contacto entre personas condicionan la propagación de enfermedades infecciosas. A nivel biomédico, las interacciones moleculares (genes, proteínas) también pueden modelarse como redes para entender procesos fisiológicos o patológicos complejos. En esencia, el análisis de redes proporciona un marco matemático y visual para entender la estructura de las interacciones en sistemas de salud, superando las limitaciones de los enfoques que consideran solo individuos aislados. Este enfoque relacional complementa los métodos estadísticos tradicionales y ha demostrado su valor para identificar determinantes sociales de la salud, superpropagadores de infecciones, brechas en la prestación de servicios y posibles dianas terapéuticas en enfermedades complejas. Como han señalado Wasserman y Faust, el análisis de redes ofrece métodos formales para estudiar datos relacionales en múltiples contextos. En definitiva, la perspectiva de redes en salud nos ayuda a comprender mejor cómo las conexiones (entre personas, entidades biológicas o instituciones) afectan los resultados sanitarios1,2.

1.2 Concepto de red y tipos (sociales, biológicas, institucionales)

Una red (o grafo) se define matemáticamente como un conjunto de entidades denominadas nodos (o vértices) conectadas por aristas (o enlaces) que representan relaciones entre ellas3. En salud, los nodos pueden ser muy diversos: individuos (pacientes, profesionales de salud), organismos (personas, vectores, patógenos), entidades biológicas (genes, proteínas) o incluso instituciones sanitarias (hospitales, centros de atención). Las aristas denotan la existencia de una relación o interacción relevante entre dos nodos, cuyo significado depende del contexto: amistad o contacto físico entre personas, transmisión de información o de patógenos, interacciones proteína–proteína, flujo de pacientes entre hospitales, etc. Según el ámbito de aplicación, es común distinguir varios tipos de redes en salud:

  • Redes sociales: aquellas en que los nodos son personas u organizaciones unidas por relaciones sociales. Por ejemplo, redes de amistad, parentesco, colaboración profesional o intercambio de información. En salud pública, las redes sociales permiten estudiar cómo se diseminan comportamientos (ej. tabaquismo, uso de servicios médicos) o cómo el apoyo social influye en resultados de salud2.
  • Redes biológicas: representan sistemas biológicos complejos. Incluyen redes metabólicas (moléculas unidas por reacciones bioquímicas), redes de expresión génica (genes regulándose mutuamente), redes neuronales (neuronas conectadas por sinapsis) o redes de interacción fármaco–proteína. Estas redes ayudan a comprender mecanismos patogénicos y posibles intervenciones terapéuticas desde un enfoque sistémico.
  • Redes institucionales: modelan relaciones entre entidades del sistema sanitario. Por ejemplo, una red de instituciones de salud podría conectar hospitales, clínicas y laboratorios mediante vínculos que representen referencias de pacientes, flujos de información o convenios de cooperación. Esto permite identificar cuáles instituciones actúan como nodos centrales (p. ej., un hospital de referencia que recibe pacientes de muchos centros) y detectar comunidades regionales en la prestación de servicios.

En todos los casos, la idea central es que una red abstrae quién está conectado con quién, proporcionando una representación estructural clara. A diferencia de los análisis que tratan cada entidad de forma independiente, el enfoque de redes incorpora explícitamente las interacciones, reconociendo que en salud el todo es más que la suma de las partes. Por ejemplo, la probabilidad de contraer una enfermedad no solo depende de las características individuales sino también de la posición de la persona en la red de contactos.

1.3 Importancia del análisis de redes en salud pública y epidemiología

El análisis de redes ha demostrado gran importancia en salud pública y epidemiología debido a que muchos fenómenos sanitarios son inherentemente relacionales. Un caso emblemático es la propagación de enfermedades infecciosas: en lugar de suponer una mezcla homogénea de la población, el enfoque de redes modela quién interactúa con quién, identificando patrones de contacto que pueden amplificar o mitigar la transmisión. Esto permite, por ejemplo, detectar nodos superpropagadores (individuos con número de contactos inusualmente alto) cuya intervención preferencial podría frenar un brote desproporcionadamente2. Durante la pandemia de COVID-19, por ejemplo, el análisis de redes de contacto ayudó a entender cómo ciertos eventos masivos y cadenas de transmisión familiares contribuyeron a la dispersión geográfica de la enfermedad.

Asimismo, las redes sociales en comunidades influyen en la difusión de información y comportamientos relacionados con la salud. Estudios en redes sociales han mostrado que hábitos como la vacunación, la dieta o la actividad física no se distribuyen aleatoriamente, sino que tienden a agruparse en la red: las personas suelen asemejarse a sus contactos en términos de conductas de salud (por homofilia y influencia social)2. Esto implica que las intervenciones pueden apalancarse de la estructura social: por ejemplo, identificando líderes comunitarios bien conectados para promover una campaña sanitaria, o entendiendo cómo el apoyo social viaja por la red para asistir a poblaciones vulnerables.

En epidemiología, el uso de redes ha enriquecido los modelos clásicos de propagación. Los modelos compartimentales tradicionales (SIR, SEIR) suelen asumir contactos aleatorios; en cambio, los modelos basados en redes incorporan la heterogeneidad de contactos y pueden predecir umbrales epidémicos más realistas. Por ejemplo, en redes muy heterogéneas (con algunos individuos de grado muy alto), una enfermedad puede propagarse incluso si el número reproductivo básico promedio es bajo, concentrándose la transmisión en los hubs de la red. Esto ha llevado al desarrollo de estrategias de control más efectivas, como la inmunización enfocada en nodos altamente conectados.

En salud pública, el análisis de redes también ayuda a mapear sistemas de atención. Una red de derivación de pacientes entre centros de salud puede revelar cuellos de botella o áreas mal conectadas del sistema sanitario. Igualmente, las redes de colaboración entre investigadores o instituciones (por ejemplo, en publicaciones científicas o ensayos clínicos) evidencian cómo circula el conocimiento médico y qué grupos están aislados o integrados en la comunidad científica4. Tales análisis pueden guiar políticas para fortalecer conexiones (p. ej., fomentar colaboraciones interdisciplinarias) o para difundir innovaciones de manera más equitativa.

En resumen, la perspectiva de redes aporta valor al proporcionar indicadores estructurales que complementan las métricas individuales. Permite identificar patrones emergentes (como conglomerados de brotes o inequidades en redes de atención) y sugerir intervenciones informadas en la estructura social o del sistema de salud, y no solo en atributos individuales de las personas2,4.

1.4 Historia y fundamentos teóricos

El análisis de redes tiene raíces históricas que combinan desarrollos en sociología, matemáticas y ciencias naturales. Formalmente, la teoría de grafos nació con Leonhard Euler en el siglo XVIII (el famoso problema de los puentes de Königsberg), sentando bases matemáticas para estudiar nodos y aristas. Sin embargo, no fue sino hasta el siglo XX que estos conceptos se aplicaron a fenómenos sociales y de salud. En la década de 1930, Jacob Moreno introdujo los sociogramas, representaciones gráficas de relaciones sociales, pioneras en visualizar redes de amistades y colaboraciones. Este enfoque se extendió en antropología y sociología a lo largo de los años 50 y 60, sentando fundamentos de lo que se conocería como análisis de redes sociales (Social Network Analysis, SNA)1.

Hacia finales del siglo XX, los avances computacionales y teóricos impulsaron la ciencia de redes como campo interdisciplinario. Aparecieron modelos teóricos de formación de redes que explican propiedades observadas en múltiples contextos: por ejemplo, el modelo aleatorio de Erdős-Rényi (donde las aristas surgen al azar entre nodos), el modelo de mundo pequeño de Watts-Strogatz (que explica distancias cortas y alta agrupación mediante unos pocos enlaces “atajo”) y el modelo libre de escala de Barabási-Albert (donde la distribución de grado sigue una cola pesada debido a mecanismos de conexión preferencial). Estos modelos proporcionan marcos de referencia para comparar redes reales: una red de contactos sociales suele mostrar el fenómeno de mundo pequeño (corta distancia promedio pero comunidades locales bien definidas) y a veces distribuciones de grado muy heterogéneas con hubs, lo cual es crítico para entender la resiliencia o vulnerabilidad de la red ante perturbaciones (como campañas de vacunación focalizadas en hubs).

En epidemiología, los conceptos de red fueron ganando terreno durante los años 80 y 90 para estudiar redes de transmisión de VIH y otras ETS, reconociendo que la estructura de la red sexual (p.ej., presencia de parejas concurrentes, subgrupos puente entre poblaciones) afecta la dinámica epidémica. Paralelamente, en psicología y otras áreas biomédicas surgieron ideas de redes causales entre síntomas o factores (ej., el enfoque de psicometría de redes que modela síntomas de trastornos mentales como nodos interconectados en vez de efectos de una causa latente).

Un hito teórico importante fue el surgimiento del concepto de medicina de redes (network medicine) en la década de 2010, impulsado por investigadores como Barabási y colegas. Este enfoque integra principios de teoría de redes para comprender enfermedades, postulando que las dolencias no ocurren en el vacío sino dentro de un “espacio” interconectado de enfermedades, genes y proteínas. Por ejemplo, se propuso el diseasome o red humana de enfermedades, conectando enfermedades que comparten genes asociados. Asimismo, se introdujeron redes de comorbilidad (disease networks) para mapear cómo la presencia de una enfermedad se asocia a la de otras en la población5. Estos fundamentos teóricos sentaron las bases para aplicaciones modernas donde se combinan grandes bases de datos clínicos con análisis de redes, buscando identificar patrones emergentes de multimorbilidad y nuevas dianas terapéuticas.

En síntesis, el análisis de redes en salud se apoya en un rico trasfondo teórico: desde la teoría de grafos clásica, pasando por la sociometría de mediados de siglo XX, hasta la ciencia de redes contemporánea y sus extensiones en network science y network medicine. Conocer estos fundamentos teóricos permite interpretar los hallazgos de redes de salud en un contexto más amplio y entender por qué ciertas estructuras (como la distribución de contactos o la modularidad) son relevantes para fenómenos epidemiológicos1,3.

1.5 Componentes fundamentales de una red: nodos, aristas, atributos

Una red se compone de elementos básicos bien definidos:

  • Nodos (vértices): representan las entidades individuales del sistema de interés. En salud pública, un nodo podría ser una persona, un paciente, un profesional sanitario, un vector (como un mosquito) o incluso una localidad o institución. Cada nodo puede tener atributos propios (por ejemplo, un paciente tiene edad, sexo, condición socioeconómica; un hospital tiene número de camas, nivel de complejidad, etc.). Estos atributos de nodo no afectan directamente la estructura de la red pero pueden ayudar a interpretar patrones (por ejemplo, colorear nodos según un atributo al visualizar la red para detectar correlaciones espaciotemporales o demográficas).

  • Aristas (enlaces): conectan pares de nodos indicando una relación o interacción entre ellos. En una red de contactos de enfermedad infecciosa, una arista puede significar “estas dos personas han tenido contacto físico cercano por el cual podría transmitirse una infección”. En una red de colaboración científica, una arista puede indicar “dos investigadores escribieron un artículo juntos”. Las aristas pueden ser no dirigidas (si la relación es simétrica o no tiene orientación, e.g. coautoría, amistad) o dirigidas (si la relación tiene un sentido, e.g. A infectó a B, o el hospital X refiere pacientes al hospital Y). Las aristas también pueden tener atributos o pesos: por ejemplo, un peso que indique la fuerza o frecuencia de la relación (número de contactos en un periodo, número de pacientes compartidos, intensidad de una interacción biológica, etc.). Otros atributos de arista pueden ser el tipo de relación (amistad vs. parentesco), el tiempo de ocurrencia (en redes dinámicas) o una capacidad (p. ej., volumen de pacientes transferidos por mes).

  • Red y contexto: Más allá de nodos y aristas individuales, las redes suelen estudiarse considerando subconjuntos o capas. Por ejemplo, a veces diferenciamos nodos por tipos (personas vs. virus, hospitales vs. clínicas), o analizamos la red completa vs. subredes (una subred podría ser la red de contactos solo dentro de una ciudad). También es útil el concepto de componente: un grupo de nodos interconectados entre sí pero sin conexión (o conexión muy débil) con otros grupos. En redes de salud, componentes desconectados podrían indicar subpoblaciones aisladas (por ejemplo, un brote en una comunidad remota no conectado al resto del país).

En suma, los componentes fundamentales –nodos y aristas con sus atributos– conforman el “alfabeto” del análisis de redes1. A partir de ellos se construyen todas las métricas y conceptos avanzados. Es importante definir claramente qué representan en cada estudio: por ejemplo, decidir si los nodos serán pacientes individuales o comunidades, o si una arista representará cohabitación, contacto reportado o transmisión confirmada, ya que estas definiciones determinan la interpretación de los resultados.

1.6 Tipos de redes: dirigidas, no dirigidas, ponderadas, bipartitas

Existen diferentes tipos de redes que se clasifican según la naturaleza de sus nodos y aristas:

  • Redes dirigidas: en ellas las aristas tienen una orientación definida, por lo que se representan con flechas. Un ejemplo es una red de transmisión de enfermedad, donde una flecha de A hacia B indica que A contagió a B (la dirección muestra el sentido de la transmisión). Otro ejemplo son las redes de referencia de pacientes, donde una arista dirigida desde un centro de salud X a un hospital Y indica que X derivó pacientes a Y. Las redes dirigidas permiten distinguir roles de emisor y receptor en la relación. Esto es útil para estudiar flujos (de información, de patógenos, de recursos) y calcular medidas como indegree (entradas) y outdegree (salidas) de un nodo por separado.

  • Redes no dirigidas: sus aristas no tienen dirección, de modo que la relación es mutua o indiferenciada. Son apropiadas cuando el vínculo es inherentemente bidireccional o cuando no interesa la causalidad direccional. Por ejemplo, una red de amistad típicamente se modela no dirigida (se asume que si A es amigo de B, B también lo es de A). En epidemiología, las redes de contacto físico (ej. “estas dos personas estuvieron en contacto estrecho en algún momento”) suelen considerarse no dirigidas, puesto que el contacto es mutuo aunque la transmisión de enfermedad pueda ser direccional. Muchas herramientas analíticas son más sencillas en redes no dirigidas (por ejemplo, el cálculo de comunidades suele asumirse sobre grafos no dirigidos).

  • Redes ponderadas: en lugar de simplemente presencia/ausencia de arista, aquí a cada arista se le asigna un peso numérico que cuantifica la intensidad, frecuencia o capacidad de la relación. Por ejemplo, en una red de colaboración científica, una arista entre dos investigadores podría ponderarse por el número de artículos conjuntos que han publicado (cuantos más, mayor peso). En una red hospitalaria, el peso podría ser la cantidad de pacientes transferidos de un hospital a otro en un año. Las redes ponderadas proporcionan más información que las binarias, permitiendo métricas más refinadas (como el grado ponderado de un nodo, que suma los pesos de sus aristas). Sin embargo, requieren interpretar con cuidado los análisis: a veces se utiliza una versión umbralizada (convirtiendo pesos altos en aristas fuertes) o se trabaja con algoritmos que integran los pesos adecuadamente.

  • Redes bipartitas (o de dos modos): son redes cuyos nodos se dividen en dos conjuntos de naturalezas distintas, y solo existen aristas entre nodos de conjuntos diferentes, nunca dentro del mismo conjunto. Un ejemplo clásico en salud es la red bipartita paciente-enfermedad: un conjunto de nodos representa a pacientes y otro a enfermedades, y se conecta un paciente con aquellas enfermedades que padece. Otro ejemplo son las redes hospital-médico, conectando médicos con los hospitales donde ejercen. Las redes bipartitas son útiles para representar datos rectangulares (p. ej., una matriz de pacientes vs. diagnósticos donde 1 indica que al paciente se le diagnosticó esa condición). Aunque se pueden analizar directamente (por ejemplo, encontrando comunidades biclúster), frecuentemente se proyectan a redes unipartitas. Por ejemplo, de la red bipartita paciente-enfermedad se puede proyectar a una red de enfermedades donde dos enfermedades están conectadas si comparten pacientes (es decir, si coocurren en al menos un paciente). Esta proyección produce una red unipartita de enfermedades (posiblemente ponderada por el número de pacientes compartidos), que es precisamente una forma de representar comorbilidades (ver Sección 14). Un aspecto importante en redes bipartitas es que las propiedades de la red proyectada pueden depender mucho de la frecuencia de los nodos: enfermedades muy comunes tenderán a conectarse con muchas otras a través de pacientes compartidos, por lo que a veces se aplican correcciones o métricas de asociación (como el coeficiente Jaccard, chi-cuadrado u odds ratio) en lugar de simplemente el conteo bruto de coocurrencias.

En resumen, seleccionar el tipo adecuado de red depende del fenómeno estudiado. Podemos incluso tener combinaciones (por ejemplo, una red bipartita ponderada paciente–enfermedad si cuantificamos cuántos episodios de esa enfermedad tuvo cada paciente, o una red no dirigida y ponderada de contactos con peso proporcional al tiempo de exposición). Elegir correctamente la representación (dirigida/no dirigida, ponderada/no ponderada, unipartita/bipartita) es crucial para que la red modele fielmente la realidad que queremos estudiar y para aplicar las medidas apropiadas en el análisis3.

1.7 Representación matricial: matrices \(A_{ij}\), \(D_{ij}\), ejemplos

Toda red puede describirse matemáticamente mediante matrices. La principal es la matriz de adyacencia \(A\), de tamaño \(N \times N\) (donde \(N\) es el número de nodos). Cada entrada \(A_{ij}\) refleja la relación entre el nodo \(i\) y el nodo \(j\). Convencionalmente, se define:

  • \(A_{ij} = 1\) si existe una arista (relación) entre \(i\) y \(j\), y \(A_{ij} = 0\) si no existe tal arista. En redes ponderadas, \(A_{ij}\) puede tomar otros valores (por ejemplo, \(A_{ij} = 5\) podría indicar que hay 5 contactos registrados entre \(i\) y \(j\) en cierto periodo).
  • En redes no dirigidas, la matriz \(A\) es simétrica (\(A_{ij} = A_{ji}\)) porque si \(i\) está conectado con \(j\), automáticamente \(j\) lo está con \(i\). En redes dirigidas, \(A\) no tiene por qué ser simétrica; por ejemplo, si \(i\) envía una relación a \(j\) pero no viceversa, entonces \(A_{ij}=1\) y \(A_{ji}=0\).
  • Habitualmente se excluyen los lazos a sí mismo (no se consideran aristas de un nodo consigo mismo), por lo que la diagonal de \(A\) es cero (\(A_{ii}=0\)).

La representación matricial es muy útil porque permite utilizar álgebra lineal para calcular propiedades de la red. Por ejemplo, el producto de matrices o las potencias de \(A\) pueden revelar caminos de varios pasos (el teorema estándar indica que \((A^k)_{ij}\) cuenta el número de caminos diferentes de longitud \(k\) entre \(i\) y \(j\) en una red no ponderada).

Otra matriz de interés es la matriz de distancias \(D\), donde cada elemento \(D_{ij}\) representa la longitud de la ruta más corta (geodésica) entre \(i\) y \(j\) en la red. Si no existe ningún camino que conecte a \(i\) con \(j\) (es decir, están en diferentes componentes desconectados), se suele definir \(D_{ij} = \infty\) o dejarlo indefinido. La matriz \(D\) es por definición simétrica (en grafos no dirigidos) y tiene ceros en la diagonal (\(D_{ii}=0\)). A partir de \(D\) se pueden derivar métricas como la distancia promedio o el diámetro de la red (ver sección siguiente).

Ejemplo: Supongamos una red simple de 4 nodos \(\{1,2,3,4\}\), donde las aristas (no dirigidas) son: 1–2, 2–3 y 3–4. Es decir, forman una cadena lineal 1–2–3–4. La matriz de adyacencia \(A\) de esta red será:

\[ A = \begin{pmatrix} 0 & 1 & 0 & 0\\ 1 & 0 & 1 & 0\\ 0 & 1 & 0 & 1\\ 0 & 0 & 1 & 0 \end{pmatrix}, \]

donde, por ejemplo, \(A_{12}=1\) indica la arista entre el nodo 1 y 2, \(A_{23}=1\) la arista entre 2 y 3, etc. Las demás entradas son 0 porque no hay conexiones directas entre esos nodos (por ejemplo, \(A_{13}=0\) ya que 1 y 3 no tienen arista directa).

La matriz de distancias \(D\) correspondiente a esta red sería:

\[ D = \begin{pmatrix} 0 & 1 & 2 & 3\\ 1 & 0 & 1 & 2\\ 2 & 1 & 0 & 1\\ 3 & 2 & 1 & 0 \end{pmatrix}. \]

Aquí vemos que \(D_{14}=3\), reflejando que el camino más corto de 1 a 4 pasa por 3 aristas (1–2–3–4). Igualmente, \(D_{13}=2\) (camino 1–2–3), \(D_{24}=2\) (2–3–4), etc. Esta representación matricial nos permite verificar visualmente las distancias: por ejemplo, el nodo 2 está a distancia 1 de 1 y 3, y a distancia 2 de 4, etc.

Estas matrices \(A\) y \(D\) proveen una forma precisa de manejar la información de la red y son la base para definir formalmente muchas medidas. Además, pueden almacenarse en computadora y manipularse con software estadístico o matemático para calcular propiedades globales de la red fácilmente3.

1.8 Medidas estructurales: grado (\(k_i\)), densidad (\(\rho\)), distancia media, diámetro

Una vez definida la red, se pueden calcular diversas medidas estructurales que resumen sus características globales o de nodos específicos:

  • Grado (\(k_i\)): es la medida más simple de centralidad local. Para un nodo \(i\), su grado \(k_i\) es el número de aristas que lo conectan con otros nodos. En términos de la matriz de adyacencia \(A\), para una red no dirigida \(k_i = \sum_{j} A_{ij}\) (la suma de la fila \(i\) de la matriz)3. En redes dirigidas, distinguimos el grado de entrada (indegree) \(k_i^{in} = \sum_j A_{ji}\) (cantidad de aristas que llegan a \(i\) desde otros) y el grado de salida (outdegree) \(k_i^{out} = \sum_j A_{ij}\) (cantidad de aristas que salen de \(i\) hacia otros). El grado indica cuántos vecinos directos tiene un nodo en la red. Por ejemplo, en una red de contactos, el grado es el número de personas con las que un individuo ha tenido contacto; en una red hospitalaria, el grado de un hospital podría ser el número de otros hospitales con los que intercambia pacientes. El grado promedio de la red es \(\bar{k} = \frac{1}{N}\sum_i k_i\), que está relacionado con la densidad.

  • Densidad (\(\rho\)): es una medida global de qué tan conectada está la red en relación a la máxima conectividad posible. Se define como la proporción de aristas existentes sobre el total de aristas potenciales. En una red no dirigida con \(N\) nodos, el número máximo de aristas posibles (si todos estuvieran conectados con todos) es \(N(N-1)/2\). Denotando por \(E\) el número real de aristas en la red, la densidad \(\rho\) es:

\[ \rho = \frac{E}{N(N-1)/2} = \frac{2E}{N(N-1)}. \]

En una red dirigida, el máximo de aristas posibles (sin lazos) es \(N(N-1)\) (porque se distinguen las direcciones), y la densidad sería \(\rho = \frac{E}{N(N-1)}\). Una densidad \(\rho\) cercana a 1 indicaría una red casi completamente conectada (muy densa), mientras que densidades bajas (cercanas a 0) indican una red dispersa con pocos enlaces en comparación a lo posible. Las redes sociales reales suelen ser dispersas (baja densidad), especialmente a gran escala, lo cual tiene implicaciones importantes: por ejemplo, la existencia de comunidades o clusters locales. En epidemiología, una baja densidad de contactos podría significar que un patógeno necesita un número reproductivo más alto para causar una epidemia generalizada, mientras que en redes densas la transmisión encuentra muchos caminos alternativos.

  • Distancia media (caminos geodésicos promedio): es una medida de la eficiencia de conexión global en la red. Se calcula primero la distancia geodésica \(D_{ij}\) para cada par de nodos \(i,j\) (como vimos, la longitud del camino más corto). Luego se promedia sobre todos los pares de nodos alcanzables. En una red conectada (un solo componente), la distancia media \(\bar{d}\) suele definirse como:

\[ \bar{d} = \frac{1}{N(N-1)} \sum_{i\neq j} D_{ij}, \]

es decir, el promedio de todas las distancias \(D_{ij}\) para \(i \neq j\). (Si la red tiene múltiples componentes, a veces se toma el promedio dentro del componente gigante, o se define \(\bar{d}\) ignorando las parejas no conectadas). La distancia media indica, en promedio, cuántos pasos se requieren para ir de un nodo a otro en la red. Redes con \(\bar{d}\) pequeño presentan el fenómeno de “mundo pequeño” –por ejemplo, la famosa noción de “seis grados de separación” en la red social humana sugiere que \(\bar{d}\) es bastante baja incluso con millones de personas. En redes de salud, una distancia media baja implica que cualquier nodo es alcanzable desde otro a través de pocas intermediarios: por ejemplo, en una red de colaboración científica global, cualquier par de investigadores puede estar conectados por una cadena corta de coautorías; en una red de aeropuertos (relevante para propagación de pandemias) la distancia media baja señala que un virus puede saltar entre ciudades con pocos vuelos de por medio.

  • Diámetro: es la distancia geodésica máxima entre cualquier par de nodos en la red. Formalmente, el diámetro \(D_{max} = \max_{i,j \in V} D_{ij}\) (considerando solo pares que están en la misma componente, pues si la red no es totalmente conectada el diámetro sería infinito). El diámetro identifica los dos nodos más alejados de la red. Si la distancia media indica la compacidad global, el diámetro da idea de la extensión máxima. En redes pequeñas y altamente conectadas, el diámetro será bajo. En redes muy dispersas o con cola de caminos lineales, el diámetro puede ser alto. Por ejemplo, en nuestro ejemplo anterior de 4 nodos en línea, la distancia media era ~1.67, pero el diámetro es 3 (los nodos 1 y 4 distan 3 pasos, que es la mayor distancia en esa red). En aplicaciones de salud, el diámetro podría indicar el “tamaño” de la red en cierto sentido: por ejemplo, en una red de contagios de tuberculosis en una región, un diámetro de 10 podría sugerir que hay cadenas de transmisión de hasta 10 pasos de longitud entre casos más extremos.

Estas medidas estructurales aportan información complementaria. El grado y la densidad están relacionados con la conectividad local e inmediata, mientras que la distancia media y el diámetro reflejan propiedades de alcance global de la red. Por ejemplo, una red puede tener densidad baja (pocas conexiones) pero aun así tener distancia media baja si esas pocas conexiones están estratégicamente distribuidas (como en un mundo pequeño, donde unos pocos enlaces “largos” reducen drásticamente las distancias globales). Para un epidemiólogo o gestor de salud, estas métricas permiten cuantificar conceptos como “qué tan interconectada está una comunidad” o “qué tan grande podría ser el peor brote (en términos de propagación máxima)”. En general, las redes sociales humanas tienden a mostrar alta agrupación local combinada con baja distancia global, lo que facilita la rápida difusión de información o enfermedades a pesar de que cada individuo solo se relaciona directamente con un grupo limitado3.

1.9 Centralidades: grado, cercanía, intermediación, eigenvector

Además de caracterizar la red en su conjunto, es crucial identificar qué nodos son más importantes o centrales en la red. Para ello se definen medidas de centralidad, que asignan a cada nodo un puntaje según distintos criterios de importancia estructural3. Aquí describimos cuatro de las centralidades más utilizadas —grado, cercanía, intermediación y eigenvector— junto con sus definiciones formales y su interpretación en contextos de salud:

  • Centralidad de grado: Es simplemente el grado del nodo, posiblemente normalizado. Formalmente, \(C_{grado}(i) = k_i\). Si se desea normalizar (para comparar entre redes de diferente tamaño), en una red no dirigida se puede usar \(C_{grado}(i) = \frac{k_i}{N-1}\) (proporción de nodos conectados con \(i\)). Un nodo con centralidad de grado alta es aquel conectado directamente con muchos otros nodos. Interpretación en salud: estos nodos pueden actuar como hubs locales. En una red de contactos epidemiológicos, un individuo con grado alto tiene muchas interacciones y podría, por tanto, infectar o exponerse a enfermedad con mayor facilidad que otros (ejemplo: un vendedor con trato diario a numerosos clientes, o una persona muy sociable)2. En una red hospitalaria, un hospital con grado alto colabora o intercambia pacientes con muchos otros centros, quizás indicativo de ser un centro de referencia. La centralidad de grado suele correlacionarse con influencia inmediata: un nodo de alto grado puede difundir información (o patógenos) a varios otros en una sola etapa. Sin embargo, no captura impactos más globales más allá de los vecinos directos.

  • Centralidad de cercanía (closeness): Mide qué tan cercano, en promedio, está un nodo del resto de la red. Se define como el inverso de la suma de distancias del nodo hacia todos los demás. Formalmente, para un nodo \(i\):

\[ C_{cercanía}(i) = \frac{N-1}{\sum_{j \neq i} D_{ij}}, \]

donde \(D_{ij}\) es la distancia geodésica de \(i\) a \(j\) (en una sola componente conectada). En esencia, \(C_{cercanía}(i)\) será mayor cuando \(\sum_j D_{ij}\) (la lejanía de \(i\)) sea menor, es decir, cuando \(i\) esté a pocos pasos de cualquier otro nodo. Interpretación en salud: un nodo con alta cercanía puede difundir algo (información, un virus, una innovación) de manera muy eficiente, ya que llegará rápidamente a todos. Por ejemplo, en una red social de una comunidad, una persona con alta cercanía significa que, aunque quizá no tenga tantísimos contactos directos, típicamente está a pocos grados de cualquiera (tal vez conoce a alguien que conoce a otro, etc. para llegar a cualquier individuo). Esto podría ser una persona que actúa como “puente” entre varios grupos, logrando acceso rápido a diferentes círculos sociales. En términos de difusión, un brote iniciado en un individuo de alta cercanía se esparcirá con menos “saltos” intermedios que si iniciara en alguien periférico. En salud pública, identificar nodos de alta cercanía puede ayudar a seleccionar difusores eficaces para campañas (p. ej., promotores de salud que en pocas conexiones alcanzan a la población general) o, a la inversa, reforzar la protección de individuos muy cercanos a todos los demás, porque su contagio significaría alcance amplio en poco tiempo.

  • Centralidad de intermediación (betweenness): Captura cuántos de los caminos cortos entre pares de nodos pasan por el nodo en cuestión. Intuitivamente, mide el rol de “puente” o intermediario de un nodo en la red. Se define como:

\[ C_{intermediación}(i) = \sum_{s \neq t \neq i} \frac{\sigma_{st}(i)}{\sigma_{st}}, \]

donde \(\sigma_{st}\) es el número de caminos geodésicos (más cortos) entre \(s\) y \(t\), y \(\sigma_{st}(i)\) es la cantidad de esos caminos que pasan por \(i\)3. Si no hay caminos o \(i\) no está en ellos, el cociente es 0; si hay múltiples caminos igualmente cortos, cada uno contribuye proporcionalmente. La suma normaliza la contribución en todos los pares \(s,t\). Esta medida varía de 0 (un nodo que no está en ninguna ruta mínima de otros) hasta un máximo cuando el nodo actúa como cuasi único puente entre muchos otros. Interpretación en salud: Un nodo con alta intermediación es crítico para la conectividad: actúa como enlace entre distintas partes de la red. En redes sociales o de contactos, estos nodos “puente” conectan comunidades que de otro modo estarían separadas. Por ejemplo, en la propagación del VIH se observaron casos de individuos que conectaban subredes (por ejemplo, una persona bisexual uniendo la red heterosexual con la red homosexual, o un camionero viajero conectando redes geográficamente distantes); estos individuos tienen alta intermediación y su estado puede influir fuertemente en la extensión de la epidemia más allá de su grupo inmediato. En redes institucionales, un hospital con alta intermediación podría ser aquel por el que pasan referidos de muchas regiones, de forma que sirve de puente entre la periferia y un centro especializado. Desde la perspectiva de control, nodos de alta intermediación son vulnerables en tanto su eliminación (o aislamiento) puede fragmentar la red en componentes, deteniendo la difusión entre ciertas comunidades. Por ello, a veces estrategias de prevención se enfocan no solo en los más conectados, sino en quienes ocupan posiciones intermedias clave en las rutas de contagio o comunicación.

  • Centralidad de eigenvector (vector propio): A diferencia de las anteriores que consideran conteo de caminos o distancias, esta centralidad valora a un nodo en función de la centralidad de sus vecinos. La idea es que un nodo es importante si está conectado a otros nodos importantes. Formalmente, es proporcional a la suma de las centralidades (de eigenvector) de sus vecinos:

\[ C_{eigen}(i) = \frac{1}{\lambda}\sum_{j} A_{ij}\,C_{eigen}(j). \]

En notación vectorial, \(\mathbf{C}_{eigen} = \frac{1}{\lambda}A\,\mathbf{C}_{eigen}\), lo cual significa que \(\mathbf{C}_{eigen}\) es un vector propio de la matriz de adyacencia \(A\). Se toma el vector propio asociado al mayor eigenvalor \(\lambda\) (por cuestiones de maximización y positividad, según el Teorema de Perron-Frobenius) y se normaliza apropiadamente3. En pocas palabras, \(C_{eigen}(i)\) es alta si \(i\) se conecta con nodos que a su vez tienen alta \(C_{eigen}\). Interpretación en salud: Esta medida identifica nodos que pertenecen al núcleo más conectado de la red. Por ejemplo, en una red social, alguien con grado moderado podría tener eigenvector centrality alta si sus pocos contactos son personas muy influyentes o bien conectadas. En una red de colaboración científica, un investigador que colabora con un grupo de científicos que entre sí también son prolíficos y muy conectados tendrá una centralidad de eigenvector mayor que alguien que colabora con muchos colegas aislados. Llevado a salud pública, podríamos interpretar que un individuo con alta centralidad de eigenvector está inmerso en el “corazón” de la red social de la comunidad; quizás no es el más extrovertido a simple vista (no necesariamente el de mayor grado), pero está conectado con varios líderes de opinión o personas clave. Para la difusión de información o comportamientos, estos individuos pueden ser importantes multiplicadores, ya que conectan con nodos que a su vez diseminan ampliamente la influencia. En redes de enfermedades (comorbilidades), la centralidad de eigenvector de un nodo-enfermedad indica si esa enfermedad se asocia a otras que también son muy comórbidas. Una enfermedad con eigenvector alto (por ejemplo, hipertensión) suele estar conectada con otras condiciones prevalentes (diabetes, cardiopatías, obesidad), situándola en el núcleo de multimorbilidad.

Cada centralidad captura un aspecto distinto de la importancia estructural, y a menudo se complementan en el análisis4. Por ejemplo, grado es local y sencillo (¿cuántos contactos directos?), cercanía es global (¿qué tan rápido alcanzo a todos?), intermediación es de puente (¿cuánto medito conexiones de otros?), eigenvector es de contexto (¿estoy dentro del grupo de los bien conectados?). En aplicaciones de salud, la elección de la centralidad relevante depende de la pregunta: para frenar una epidemia rápidamente podría ser útil inmunizar a nodos de alto grado (reduciendo conexiones de golpe) o de alta intermediación (cortando puentes críticos); para difundir una campaña de información quizá convenga reclutar a individuos con alta cercanía (llegarán a todos rápidamente) o con alto eigenvector (inmersos en la élite conectada). Por eso, los estudios en redes de salud suelen reportar múltiples centralidades para identificar distintos actores clave2.

1.10 Ejemplos aplicados: redes de transmisión de enfermedades y colaboración científica

Para ilustrar conceptos, describimos dos ejemplos de redes aplicadas a contextos de salud:

  • Red de transmisión de enfermedades infecciosas: Imaginemos un brote epidémico (por ejemplo, tuberculosis en una región o COVID-19 en una ciudad). Podemos construir una red donde los nodos sean individuos y trazamos aristas que representen posibles eventos de contagio (contactos cercanos, relaciones sexuales, etc.). Al investigar un brote, esta red de transmisión (idealmente dirigida, indicando quién contagió a quién si se puede determinar) nos permite visualizar la estructura del brote: ¿Hubo uno o varios casos índice? ¿Existen “superspreaders” que infectaron a muchos otros? ¿La red de contagios forma un solo gran cluster o varios aislados? Por ejemplo, en un estudio de transmisión de ETS en una ciudad, una red reveló que la mayoría de casos formaban pequeños clústeres, excepto uno grande conectado a través de algunos individuos con múltiples parejas sexuales simultáneas. Esos individuos funcionaban como puentes entre subgrupos (alta intermediación) y hubs (alto grado), siendo focos críticos para intervenciones2. Otro ejemplo reciente son los estudios de rastreo de contactos de COVID-19: al representar quién estuvo en contacto con quién, se encontraron eventos de superdispersión (p. ej., una persona infectó a decenas en una fiesta) y cadenas de transmisión familiares. Este enfoque de red permitió comprender por qué ciertas restricciones (evitar reuniones masivas) tenían mucho impacto: esas reuniones creaban aristas múltiples desde un mismo nodo hacia muchos, formando estrellas que aceleraban la difusión.

  • Red de colaboración científica en salud: Aquí los nodos son investigadores (o instituciones) y las aristas indican colaboración (por ejemplo, coautoría de publicaciones científicas en epidemiología o co-participación en un proyecto). Estas redes ayudan a mapear cómo fluye el conocimiento y quiénes son los líderes o puentes en la producción de evidencia científica. Por ejemplo, una red de coautoría en epidemiología global podría mostrar un gran componente conectando a la mayoría de investigadores, pero también subcomunidades temáticas (p. ej., un cluster de investigadores enfocados en enfermedades infecciosas, otro en epidemiología ambiental, etc.). En dicha red, la centralidad de grado identificaría a autores muy prolíficos o colaboradores (que tienen muchos coautores), la centralidad de intermediación podría resaltar a investigadores que conectan disciplinas (quizá alguien que publica tanto en salud pública como en genética, enlazando dos comunidades científicas distintas), y una alta centralidad de eigenvector indicaría pertenencia al núcleo de científicos más influyentes (quizá aquellos en instituciones de prestigio con amplia red de colaboración). Un hallazgo típico es el fenómeno de “los seis grados entre científicos”: por ejemplo, el número de Erdős en matemáticas o su análogo en medicina muestra que la distancia media entre dos investigadores a través de coautorías suele ser baja (quizá 4 pasos en redes académicas). Estas redes de colaboración también pueden revelar desigualdades: a veces ciertos países o regiones quedan periféricos (gran distancia o baja conexión con el resto), indicando la necesidad de integrarlos más en redes de investigación internacionales. Desde la salud pública, fortalecer las redes de colaboración científica puede acelerar la difusión de innovaciones médicas y mejorar la respuesta global ante problemas de salud (como se vio con redes de ensayos clínicos y datos abiertos durante COVID-19).

Ambos ejemplos muestran cómo el análisis de redes ofrece perspectivas visuales y cuantitativas valiosas: en transmisión de enfermedades, para guiar intervenciones epidemiológicas (vacunar, educar, aislar a quienes ocupan posiciones clave) y en colaboración científica, para informar políticas de ciencia (fomentar enlaces entre grupos aislados, reconocer a conectores interdisciplinarios). Son solo dos de muchos campos donde la lente de redes enriquece nuestra comprensión en salud.

1.11 Detección de comunidades: algoritmos (Louvain, Girvan-Newman, Leiden), modularidad, ejemplos de clústeres epidémicos y hospitalarios

Las comunidades o clústeres dentro de una red son subconjuntos de nodos más densamente conectados entre sí que con el resto de la red. En términos simples, una comunidad es un grupo de nodos que forma una subred relativamente aislada o autónoma dentro de la red mayor. Detectar estas comunidades es fundamental en análisis de redes de salud porque a menudo corresponden a agrupaciones significativas: por ejemplo, grupos etarios o geográficos en una red de contactos, especialidades médicas en una red de coautorías, o conjuntos de hospitales que refieren pacientes principalmente entre ellos (posiblemente por proximidad regional).

Existen varios algoritmos para la detección de comunidades, entre los cuales destacan:

  • Girvan-Newman (GN): Es un algoritmo clásico (2002) que emplea un enfoque divisivo. Calcula la intermediación de todas las aristas del grafo (no de los nodos, sino de aristas) y elimina la arista de mayor intermediación iterativamente. La idea es que las aristas con alta intermediación son “puentes” entre comunidades; al removerlas, la red comienza a separarse en componentes. El proceso continúa hasta descomponer la red o hasta un criterio deseado. El algoritmo GN produce una jerarquía de particiones (un dendrograma) desde la red completa hasta nodos aislados. Aunque conceptualmente claro y efectivo en redes pequeñas, su complejidad computacional es alta para redes muy grandes, por lo que ha sido reemplazado por métodos más eficientes en big data.

  • Louvain: Es un algoritmo heurístico goloso (2008) ampliamente usado por su eficiencia incluso en redes con millones de nodos. Funciona mediante optimización de la modularidad (ver más abajo) en dos fases repetidas: primero asigna nodos a comunidades de manera que mejore la modularidad local (cada nodo inicialmente es su propia comunidad y luego se agrupa con vecinos si mejora la puntuación), y luego construye una red reducida de comunidades y repite el proceso. El resultado es una partición de nodos en comunidades que suele (aunque no garantiza globalmente) tener alta modularidad. Louvain es rápido y suele dar buenos resultados en muchas redes reales.

  • Leiden: Es una mejora del algoritmo de Louvain (2019) que garantiza ciertas propiedades como la conectividad interna de las comunidades y tiende a hallar particiones de modularidad igual o mayor al Louvain estándar, evitando algunos atascos en óptimos locales. Para la mayoría de usuarios, Leiden es simplemente “un Louvain mejorado” y se ha vuelto un nuevo estándar debido a que sigue siendo muy eficiente computacionalmente.

La modularidad (\(Q\)) es la función objetivo común en muchos algoritmos de detección de comunidades. Es una medida de la calidad de una partición de la red en comunidades, comparando la densidad de aristas dentro de comunidades vs. la esperada al azar. Una definición formal de modularidad para una partición dada es:

\[ Q = \frac{1}{2m} \sum_{i,j} \big( A_{ij} - \frac{k_i k_j}{2m} \big) \delta(c_i, c_j), \]

donde \(m\) es el número total de aristas, \(k_i\) es el grado del nodo \(i\), \(c_i\) es la comunidad a la que pertenece \(i\), y \(\delta(c_i,c_j)\) es 1 si \(i\) y \(j\) están en la misma comunidad (y 0 en caso contrario)3. En esencia, \(A_{ij}\) indica si hay conexión real entre \(i\) y \(j\), mientras \(\frac{k_i k_j}{2m}\) es la probabilidad esperada de conexión entre \(i\) y \(j\) si las aristas se distribuyeran aleatoriamente preservando los grados (modelo nulo). La modularidad suma, para cada par interno a una comunidad, el excedente de aristas reales sobre las esperadas. Un \(Q\) alto (máximo teórico cercano a 1) indica muchas más aristas dentro de comunidades de las que cabría esperar por azar, lo que sugiere que la partición captura bien una estructura comunitaria fuerte. Un \(Q\) cercano a 0 indica que la división en comunidades no es mejor que el azar, y valores negativos implican que hay menos aristas dentro de esas comunidades que lo esperado (lo que sería una mala partición). Los algoritmos como Louvain tratan de maximizar \(Q\) encontrando la mejor asignación de nodos a comunidades.

Ejemplos de comunidades en redes de salud:

  • Clústeres epidémicos: En una red de transmisión de enfermedad, las comunidades pueden corresponder a brotes locales o grupos de casos con vínculos intragrupo densos. Por ejemplo, en una red de contactos de COVID-19 de un país, la detección de comunidades podría separar clusters asociados a distintos eventos (una comunidad de casos ligados a un matrimonio multitudinario, otra comunidad centrada en un asilo de ancianos, otra en un barrio específico). Cada clúster epidémico indicaría que dentro de ese grupo hubo mucha transmisión (muchas aristas internamente), mientras que las conexiones entre clústeres son más escasas (quizás un caso viajero que llevó el virus de un cluster a otro). Identificar estas comunidades ayuda a entender la dinámica de propagación: un cluster puede requerir una intervención focalizada (ej. cuarentena estricta en ese grupo), mientras que los pocos puentes entre clusters (nodos o aristas intercomunitarias) son críticos a vigilar para evitar propagación extensa. En enfermedades como el VIH, la detección de comunidades en redes de contactos sexuales ha revelado agrupaciones por comportamiento o geografía (p. ej., usuarios de drogas intravenosas formando un cluster separado de hombres que tienen sexo con hombres, etc.), lo que orienta estrategias de prevención específicas para cada subred comunitaria.

  • Comunidades en redes hospitalarias: Supongamos una red donde nodos son hospitales y existe arista cuando comparten pacientes (un paciente es transferido o atendido en ambos hospitales). Aplicando detección de comunidades, es frecuente encontrar agrupamientos regionales: hospitales que intercambian muchos pacientes entre sí, típicamente porque están en la misma zona geográfica o pertenecen a un mismo sistema sanitario. Por ejemplo, hospitales de una misma ciudad o provincia formarán una comunidad, mientras otra comunidad agrupa hospitales de otra región, con menos traslados entre regiones (solo tal vez los hospitales nacionales de referencia conectan comunidades distintas). Esto coincide con la intuición de que los pacientes suelen atenderse localmente. Desde el punto de vista de infecciones asociadas a la atención de salud (IAAS), estas comunidades implican que un patógeno multirresistente podría circular principalmente dentro de cierto cluster de hospitales; para controlar su propagación se podría focalizar en ese grupo. Otra aplicación: en redes de colaboración entre hospitales (por proyectos o intercambio de personal), las comunidades podrían reflejar alianzas o consorcios, información útil para gestores.

  • Otras: En redes de interacción genética, las comunidades a veces corresponden a módulos funcionales (grupos de genes que participan en la misma vía metabólica). En redes de síntomas (psicología de redes), pueden emerger comunidades de síntomas que sugieren sindicatos sintomáticos (por ejemplo, en trastornos psiquiátricos, un cluster de síntomas ansiosos vs. un cluster de síntomas depresivos, explicando comorbilidades entre trastornos).

La detección de comunidades es, en resumen, una forma de descubrir meso-estructuras en la red: ni detalles de cada nodo ni solo panorama global, sino grupos intermedios cohesivos. Gran parte de la estructura social y biológica es modular, y en salud esto se refleja en subpoblaciones, subsistemas o clusters epidemiológicos que es valioso identificar para intervenciones dirigidas. Los algoritmos como Louvain o Leiden proporcionan soluciones prácticas para descubrir estos patrones en grandes conjuntos de datos de redes de salud, optimizando medidas como la modularidad para lograr particiones significativas sin supervisión previa3.

1.12 Visualización e interpretación: layouts (fuerza dirigida, circular, jerárquico), principios éticos

La visualización de redes es una herramienta potente para interpretar patrones que, de otra forma, serían solo números o matrices. Un buen diagrama de la red puede revelar comunidades, nodos centrales y estructuras particulares de un vistazo. Sin embargo, lograr una visualización informativa requiere elegir un esquema de disposición (layout) adecuado y respetar ciertos principios, incluyendo consideraciones éticas cuando los nodos representan personas u organizaciones sensibles.

Layouts comunes de visualización:

  • Layout de fuerza dirigida (force-directed): Es probablemente el más utilizado para redes generales. Modelo la red como un sistema físico: los nodos se repelen entre sí como si fueran cargas eléctricas, mientras las aristas actúan como resortes que tiran de los nodos conectados acercándolos. Tras simular iterativamente estas fuerzas, se llega a un equilibrio donde los nodos conectados quedan cerca y los no conectados se alejan. Algoritmos como Fruchterman-Reingold o ForceAtlas (en Gephi) implementan este principio. El resultado suele ser una distribución orgánica donde las comunidades emergen como cúmulos de nodos y los hubs ocupan posiciones centrales rodeados de sus vecinos. Este layout es útil para redes sin estructura geométrica intrínseca, ya que deja que la topología dicte la forma. En salud pública, por ejemplo, un grafo de contactos epidémicos dibujado con fuerzas dirigidas puede mostrar naturalmente quién está en el centro del brote y cómo se agrupan los casos.

  • Layout circular: Aquí los nodos se disponen sobre un círculo (o varios círculos concéntricos), típicamente ordenados por alguna regla (por ejemplo, todos los miembros de una comunidad detectada uno junto a otro, o en orden alfabético si son pocos nodos). Las aristas se dibujan como curvas o cuerdas dentro del círculo. Este layout es útil para destacar conexiones cruzadas entre grupos predefinidos o para comparar estructuras. En redes de menor tamaño, un layout circular puede ser claro y simétrico. Por ejemplo, podríamos colocar hospitales en un círculo agrupados por región, y dibujar líneas para traslados de pacientes: se observaría fácilmente si la mayoría de conexiones son dentro de la misma región (líneas cortas locales) y cuántas son líneas largas que saltan a otras regiones.

  • Layout jerárquico (o tipo sugraph): Se utiliza cuando la red tiene una direccionalidad o niveles claros, por ejemplo, una red de derivaciones con hospitales de primer, segundo y tercer nivel. En este layout, los nodos se colocan por niveles (de arriba abajo o izquierda a derecha). Es ideal para visualizar flujos direccionales o árboles (redes acíclicas). Un caso en salud sería un diagrama de flujo de pacientes: centros de atención primaria en un nivel superior conectados hacia hospitales secundarios en un nivel medio, y estos a su vez hacia hospitales terciarios en el nivel inferior. Aunque la red real puede tener ciclos, el layout jerárquico intenta respetar al máximo una estructura de niveles para facilitar la lectura de caminos causales o de flujo.

  • Layouts basados en atributos o geográficos: A veces conviene posicionar los nodos de acuerdo a alguna variable externa. Por ejemplo, en una red epidemiológica global, colocar cada nodo (ciudad o país) según sus coordenadas reales en el mapa (layout geográfico) y luego dibujar conexiones (rutas de propagación, viajes) puede revelar patrones espaciales (focos regionales, rutas internacionales de contagio). Otro ejemplo: ordenar nodos en una línea temporal según la fecha de un evento (p. ej., infección) para ver conexiones temporales causales.

Cualquiera sea el layout, es importante enfatizar que la posición de los nodos en el dibujo no es parte de los datos originales, sino una decisión analítica. Por ello, se deben evitar interpretaciones equivocadas: por ejemplo, en un layout de fuerza dirigida, la proximidad física en el dibujo sugiere fuerte conexión, pero distancias grandes en el dibujo no siempre significan ausencia de relación (podría ser un artefacto del algoritmo). Además, los layouts pueden distorsionar percepciones: un nodo central en la figura puede que no sea el más central según las métricas, simplemente quedó ahí por la simulación.

Principios éticos en la visualización e interpretación de redes de salud:

Cuando las redes involucran datos sensibles (personas, pacientes, instituciones), el analista tiene la responsabilidad de respetar la privacidad y evitar daños:

  • Anonimización: Al visualizar redes de individuos (p. ej., red de contactos de VIH), debe hacerse un esfuerzo para anonimizar identidades. En publicaciones o presentaciones, lo usual es quitar nombres y cualquier identificador personal de los nodos, reemplazándolos por códigos irreconocibles. Incluso con anonimización, si la red es muy específica, existe riesgo de reidentificación (por ejemplo, un nodo con muchas conexiones podría ser identificable por la persona misma o su entorno). Por eso, a veces se evita publicar la red completa y se opta por métricas agregadas o subredes ilustrativas genéricas.

  • Estigmatización y sesgos: Mostrar ciertas personas o grupos como “superpropagadores” o “nodo central” puede acarrear estigma o culpabilización. En epidemiología, se aprendió esto desde casos históricos: por ejemplo, en redes de transmisión del VIH, identificar públicamente a un individuo como nodo central podría culparlo de la epidemia, sin considerar factores de red fuera de su control. Los analistas deben enmarcar los hallazgos con sensibilidad, enfatizando que la estructura de la red es un fenómeno poblacional. Por principio ético, se debe evitar señalar a individuos o comunidades específicas en formas que puedan interpretarse peyorativamente; en cambio, comunicar hallazgos de modo constructivo (p. ej., “las interconexiones en ciertos ambientes laborales contribuyen a la difusión, así que enfoquemos allí pruebas y educación”, en vez de “estos trabajadores son los propagadores”).

  • Consentimiento y confidencialidad: Si los datos de la red provienen de personas (por ejemplo, un estudio de redes sociales y obesidad), es probable que se requiera consentimiento informado de los participantes y aprobación ética. Aunque el análisis sea agregadamente beneficioso, los individuos deben saber que sus conexiones serán estudiadas. En la divulgación de resultados, mantener la confidencialidad es clave: nunca publicar información que permita derivar datos personales (por ejemplo, la red de amistad de una comunidad pequeña podría delatar relaciones privadas).

  • Interpretación responsable: Desde un punto de vista técnico, es importante no sobrerreificar la red. Una arista en una red de comorbilidades, por ejemplo, indica coocurrencia estadística de dos enfermedades, pero no necesariamente causalidad directa. Los profesionales deben evitar conclusiones simplistas como “X causa Y porque están conectadas” sin más análisis. La red es un punto de partida para generar hipótesis, que podrían requerir estudios adicionales. Asimismo, en redes dinámicas (como contagios en el tiempo), un snapshot puede no contar la historia completa; hay que interpretarlo considerando la evolución temporal y las limitaciones en la captación de datos (p. ej., contactos no reportados).

Siguiendo estos lineamientos, la visualización de redes en salud se convierte en una poderosa herramienta pedagógica y analítica: revela patrones de un modo accesible (muchas personas entienden mejor un gráfico de nodos y líneas que una tabla de incidencia) y puede guiar intervenciones. Pero siempre debe realizarse con rigor (usando layouts apropiados, chequeando la veracidad de lo que “parece” verse en el gráfico con datos cuantitativos) y con respeto a los individuos y organizaciones representados en la red.

1.13 Aplicaciones en salud: redes de transmisión, redes hospitalarias, redes de síntomas

El enfoque de redes se ha aplicado a numerosos problemas en salud. A continuación, destacamos tres aplicaciones particulares, mostrando cómo se modelan y qué insights ofrecen:

  • Redes de transmisión de enfermedades infecciosas: Ya mencionadas anteriormente, este es uno de los usos más directos en epidemiología. Representar quién contagia a quién (idealmente con aristas dirigidas) ha sido clave para entender brotes de infecciones de transmisión sexual, tuberculosis, gripe, ébola, COVID-19, entre otras. Estas redes pueden construirse a partir de datos de rastreo de contactos, análisis genómicos filogenéticos (que sugieren vínculos probables de transmisión) o combinaciones de ambos. Un hallazgo típico en redes de transmisión es la presencia de casos índice que inician clústeres, y eventos de “superdifusión” donde un solo nodo infecta a muchos otros. También se observan cuellos de botella: por ejemplo, si ciertas comunidades están aisladas, la enfermedad puede no llegar allí a menos que un puente (viajero infectado) la conecte. Las autoridades de salud utilizan estas redes para control dirigido: por ejemplo, si se identifica un nodo de alta intermediación conectando regiones (quizá un mercado que atrae vendedores de muchas localidades), se puede focalizar vigilancia y prevención extra allí. En infecciones de transmisión sexual, mapear las redes ayudó a diseñar intervenciones como “tratamiento de parejas” (tratar no solo al paciente sino a sus contactos directos) y a entender la importancia de concurrency (parejas simultáneas) en la dinámica del VIH. En enfermedades emergentes como ébola, los gráficos de cadenas de contagio permitieron aprender sobre prácticas culturales (funerales, cuidados domiciliarios) que actuaban como aristas críticas para la propagación, informando respuestas de salud pública culturalmente adecuadas.

  • Redes hospitalarias: Los sistemas de salud pueden analizarse como redes en varios sentidos. Uno de ellos es la red de derivación de pacientes o red de atención: nodos son hospitales/centros y una arista indica que pacientes suelen fluir de uno a otro (por derivaciones oficiales, o porque un mismo paciente fue admitido en ambos en cierto periodo). Este tipo de red revela la estructura del sistema sanitario en la práctica. Por ejemplo, un sistema regional puede mostrar un patrón “hub-and-spoke”: hospitales pequeños (nodos periféricos) conectan con un hospital central de referencia (hub) pero no mucho entre ellos. Otra región podría mostrar una red más descentralizada con múltiples conexiones laterales. Conocer esta topología es valioso para planificar: si un hospital central cierra o se satura, ¿qué tan fácil encuentran rutas alternativas los pacientes? Para control de infecciones nosocomiales, como mencionamos, la red hospitalaria indica posibles vías de dispersión de bacterias resistentes: si el hospital A tiene un brote de Klebsiella resistente, los hospitales conectados a A (que reciben o envían pacientes) están en mayor riesgo de importación. Intervenciones de salud pública como alertas inter-hospitalarias o precauciones de aislamiento se pueden priorizar según la conectividad en esta red2. Otra visión es la red de colaboración entre instituciones sanitarias (por ejemplo, compartir personal, o participar en un mismo sistema de información). Fortalecer esta red puede mejorar la interoperabilidad y cohesión del sistema, pero también implica que problemas en un nodo (como un ciberataque o desabasto) pueden propagarse rápidamente a otros conectados.

  • Redes de síntomas: En la investigación en salud mental y otras áreas de medicina se ha introducido el enfoque de redes de síntomas o de características clínicas. Tradicionalmente, un diagnóstico se conceptualizaba como una causa latente de los síntomas (modelo top-down); el enfoque de redes propone que los síntomas interactúan entre sí directamente y dan lugar a estados patológicos como propiedades emergentes (bottom-up). Por ejemplo, en depresión, la pérdida de sueño puede incrementar la fatiga, que a su vez eleva la desesperanza, la cual retroalimenta el insomnio – formando un circuito interconectado que mantiene el trastorno. En una red de síntomas cada síntoma es un nodo y dibujamos aristas si los síntomas tienden a presentarse conjuntamente o si hay evidencia de que uno influye en el otro. Estas redes suelen ser ponderadas con valores que representan correlaciones o probabilidades condicionales entre síntomas. Un caso práctico es la red de síntomas de trastornos de ansiedad y depresión: se ha encontrado que “insomnio” puede ser un nodo central conectando clusters de síntomas ansiosos y depresivos, sugiriendo que abordando el insomnio quizá se reduzca todo el entramado sintomático. Este enfoque ha abierto nuevas vías terapéuticas, como intervenir el nodo más central de la red de síntomas de un paciente para desencadenar mejoras en cascada. También explica por qué pacientes con el mismo diagnóstico pueden tener perfiles sintomáticos muy diferentes: puede haber múltiples comunidades de síntomas dentro de un mismo trastorno. Por ejemplo, un subgrupo de pacientes con depresión tiene principalmente síntomas somáticos (cansancio, alteraciones del apetito, dolores) mientras otro presenta síntomas afectivos (tristeza profunda, ideación suicida). En la red global, esos clusters de síntomas se reflejan como comunidades, alineadas con posibles subtipos de la enfermedad. Esto tiene implicancias en medicina personalizada: en vez de tratar “la depresión” igual para todos, podríamos adaptar el tratamiento según el perfil de red de síntomas del individuo.

Estos tres ejemplos –transmisión, hospitales, síntomas– ilustran la versatilidad del análisis de redes en salud. En cada caso, identificar la estructura relacional aporta una capa de conocimiento adicional a la que se obtendría mirando solo distribuciones individuales de variables. No obstante, cada aplicación requiere cuidados específicos: por ejemplo, las redes de síntomas se construyen típicamente a partir de matrices de correlación y requieren muestras grandes y métodos estadísticos robustos (p. ej., gráficos Gaussianos parciales) para inferir conexiones fiables; las redes hospitalarias pueden estar sesgadas por diferencias en registros o políticas de derivación; las redes de transmisión a menudo están incompletas (no todos los contactos se identifican) y requieren supuestos para su análisis. Aun así, el valor añadido de pensar en términos de redes es innegable: provee intuiciones gráficas (como ver un mapa vivo del sistema sanitario), métricas cuantitativas (que priorizan elementos clave como “este síntoma es el más central” o “aquella clínica es puente entre dos provincias”) y un lenguaje común para colaborar entre disciplinas (epidemiólogos, sociólogos, analistas de datos) en torno a problemas complejos de salud pública.

1.14 Análisis de redes de comorbilidades

Una aplicación especializada del análisis de redes en biomedicina es el estudio de las redes de comorbilidades, que exploran cómo distintas enfermedades o condiciones de salud se interrelacionan al presentarse conjuntamente en pacientes. La comorbilidad se define como la presencia de dos o más enfermedades (crónicas o agudas) en la misma persona, ya sea simultáneamente o a lo largo de su vida. Las multimorbilidades son la norma más que la excepción en poblaciones envejecidas, por lo que comprender los patrones de coocurrencia de enfermedades es fundamental para planificar la atención sanitaria y descubrir interacciones patológicas.

Concepto y estructura típica:

Existen dos maneras complementarias de representar redes de comorbilidad:

  • Como red bipartita paciente-enfermedad: Un conjunto de nodos representa a los pacientes y otro conjunto las enfermedades; se conecta un paciente con una enfermedad si la padece. Esta es la representación directa de los datos clínicos (por ejemplo, historias clínicas o bases de datos hospitalarias codificadas en CIE-10). Dicha red bipartita recoge toda la información, pero es de dos modos, lo que dificulta extraer patrones de relaciones entre enfermedades directamente.

  • Como red unipartita de enfermedades (disease network): Aquí los nodos son enfermedades, y se conecta dos enfermedades si tienden a aparecer conjuntamente en los pacientes. Esta red se construye usualmente como la proyección de la bipartita mencionada: dos enfermedades A y B estarán conectadas si hay al menos un paciente que tiene ambas. Más rigurosamente, se suele asignar un peso a la arista A–B que cuantifique la fuerza de asociación entre A y B en la población de pacientes. Ese peso puede ser simplemente el número de pacientes comórbidos (que presentan A y B), pero para interpretaciones más robustas se usan medidas como el odds ratio, el coeficiente phi, la Jaccard o información mutua, que tienen en cuenta prevalencias esperadas. Por ejemplo, si \(N_{AB}\) es el número de pacientes con ambas enfermedades A y B, \(N_A\) y \(N_B\) son los números con cada enfermedad por separado, y \(N\) el total de pacientes analizados, se puede calcular una medida como el riesgo relativo (RR) o el \(\chi^2\) de asociación. Esto diferencia entre meras coocurrencias por azar (ej. dos enfermedades muy comunes coincidirán en algunos pacientes aunque no haya relación) de coocurrencias estadísticamente significativas (más frecuentes de lo esperado bajo independencia).

La red de comorbilidades así obtenida suele ser ponderada: cada arista tiene un peso que indica cuán fuerte es la coocurrencia o asociación entre las dos enfermedades conectadas. Algunas aristas pueden incluso ser descartadas si la asociación no es significativa estadísticamente, produciendo una red más esparsa que resalte solo las conexiones relevantes.

Usos de las redes de comorbilidad:

  • Planificación clínica integrada: Al identificar qué enfermedades suelen venir juntas, los sistemas de salud pueden organizar mejor la atención. Por ejemplo, si la red muestra un cluster fuerte de diabetes, hipertensión, dislipidemia y obesidad (enfermedades metabólicas interconectadas), es lógico establecer clínicas integrales de síndrome metabólico en vez de atender cada condición por separado. Saber que ciertos pacientes típicamente acumulan esas comorbilidades permite diseñar paquetes de prevención (dieta, ejercicio, control glicémico) que ataquen el conjunto, y asegurarse de que el manejo clínico es coordinado (p. ej., los endocrinólogos y cardiólogos trabajando en equipo).

  • Predicción de multimorbilidad: Una característica poderosa de las redes de comorbilidad es su potencial predictivo. Dado un paciente con una enfermedad A, las conexiones de A en la red sugieren qué otras enfermedades B podría desarrollar con mayor probabilidad en el futuro (especialmente si existe un camino corto que las conecta). De hecho, estudios dentro del marco de la medicina de redes han encontrado que la distancia en la red de enfermedades correlaciona con riesgo: enfermedades próximas en el grafo tienden a ocurrir sucesivamente en individuos conforme envejecen. Por ejemplo, la red de comorbilidad puede mostrar que la enfermedad renal crónica está a pocos pasos de la diabetes y la hipertensión (muy conectadas), indicando que un diabético de larga data tiene riesgo considerable de patología renal. Con modelos apropiados, se puede usar la estructura de la red y atributos del paciente (edad, sexo, etc.) para predecir su trayectoria de comorbilidades, priorizando exámenes o intervenciones preventivas personalizadas.

  • Identificación de fenotipos y subgrupos de pacientes: Similar a la detección de comunidades, las redes de comorbilidad pueden presentar clusters de enfermedades que definen síndromes o fenotipos multimórbidos. Por ejemplo, un cluster puede agrupar enfermedades psiquiátricas y de adicción, otro cluster las metabólico-cardiovasculares, otro las autoinmunes, etc. Al mapear los pacientes en este espacio, se pueden encontrar subgrupos de pacientes que comparten un perfil de comorbilidades (fenotipo clínico similar). Esto es valioso para investigación y gestión: un subgrupo de pacientes con comorbilidades mentales + dolor crónico puede requerir un abordaje distinto al subgrupo de pacientes con comorbilidades cardiovasculares + metabólicas. En el ámbito de investigación, tales patrones sugieren mecanismos fisiopatológicos comunes o factores de riesgo compartidos. Por ejemplo, la frecuente coocurrencia de depresión con enfermedades inflamatorias podría implicar vías inflamatorias comunes, alentando estudios sobre el eje inflamación-estado de ánimo.

Ejemplos de redes de comorbilidad:

  • Enfermedades crónicas prevalentes: Como se insinuó, hay un conocido cluster de enfermedades cardiometabólicas. Diabetes tipo 2, obesidad, hipertensión, dislipidemia y enfermedad coronaria están fuertemente interconectadas en prácticamente todas las poblaciones estudiadas. Otra enfermedad que aparece como hub es la enfermedad renal crónica, que suele coexistir con las anteriores (de hecho es en parte consecuencia de ellas). Esta subred cardiometabólica también se conecta con la insuficiencia cardíaca, accidentes cerebrovasculares, y a veces con síndrome de apnea del sueño y osteoartritis (vía obesidad). Ver estos enlaces en la red reafirma la noción de síndrome metabólico y su impacto multisistémico.

  • Enfermedades mentales: Trastornos como depresión, trastornos de ansiedad, trastorno bipolar y esquizofrenia a menudo aparecen conectados en redes de comorbilidad (muchos pacientes tienen diagnósticos psiquiátricos concurrentes). Además, existe enlace con abuso de sustancias (drogas, alcohol) formando un cluster psicosocial. Interesantemente, este cluster mental a veces se conecta, a través de la depresión y la ansiedad, con el cluster de enfermedades crónicas físicas. Por ejemplo, depresión está asociada a enfermedad coronaria, diabetes y dolor crónico. Esto puede reflejar mecanismos bidireccionales: enfermedades crónicas generan carga psicológica y a su vez la depresión empeora el autocuidado físico.

  • Enfermedades autoinmunes/inflamatorias: Red de comorbilidades ha mostrado agrupaciones de enfermedades autoinmunes (ej. artritis reumatoide, lupus, psoriasis, enfermedad inflamatoria intestinal), indicando predisposiciones compartidas. Algunas condiciones puentean grupos: por ejemplo, la obesidad tiene un papel proinflamatorio, conectando enfermedades metabólicas con el cluster autoinmune (pacientes obesos tienen mayor riesgo de artritis, psoriasis, etc.).

  • Enfermedades infecciosas: En poblaciones con enfermedades infecciosas crónicas, las redes capturan asociaciones como la coinfección TB-VIH, o hepatitis C con VIH (por exposición común). Incluso tras controlar por factores conocidos, estas coocurrencias destacan poblaciones de alto riesgo que requieren atención integral (p. ej., programas conjuntos de TB y VIH).

Medidas útiles en redes de comorbilidad:

Una vez construida la red de enfermedades (unipartita):

  • El peso de coocurrencia o asociación en una arista A–B, como ya mencionamos, es crucial. Un peso alto (y significativo) indica un lazo fuerte de comorbilidad. A veces se define el “grado ponderado” de un nodo como la suma de pesos de sus conexiones – esto refleja la carga de comorbilidad asociada a esa enfermedad. Por ejemplo, una enfermedad con muchas conexiones de peso alto podríamos considerarla una “condición central” en la multimorbilidad.

  • Centralidades en la red de enfermedades: Podemos calcular las mismas centralidades (grado, intermediación, etc.) ahora para nodos que son enfermedades. Su interpretación sería:

    • Grado: número de otras enfermedades con las que una enfermedad coaparece significativamente. Por ejemplo, la hipertensión suele tener grado altísimo, conectada a multitud de condiciones (es un hub de comorbilidad).
    • Intermediación: una enfermedad con betweenness alta conecta clusters de enfermedades. Por ejemplo, la obesidad puede conectar enfermedades psiquiátricas (a través de ciertos medicamentos o estilos de vida) con enfermedades osteoarticulares y metabólicas, actuando como puente conceptual y clínico. Otra enfermedad puente podría ser la insuficiencia renal: muchos pacientes con diabetes/hipertensión desarrollan renal y luego esta se asocia a otras complicaciones (anemia, etc.), sirviendo de escalón intermedio.
    • Closeness: indicaría qué tan cerca (promedio) está una enfermedad de todas las demás en la red. Una closeness alta podría interpretarse como que la enfermedad se sitúa en el núcleo del espacio de multimorbilidad – no es rara ni aislada, sino que cualquier otra dolencia está a pocos pasos de ella. Enfermedades muy prevalentes como hipertensión o depresión suelen tener closeness alta, lo que concuerda con que afectan transversalmente a muchas personas que además tienen otras condiciones.
    • Eigenvector: identifica enfermedades que no solo son comunes, sino que coaparecen con otras que a su vez son altamente comórbidas. Por ejemplo, diabetes podría tener eigenvector alto porque se asocia a hipertensión, obesidad, cardiopatía – todas ellas a su vez muy conectadas. Así, la diabetes pertenece al “núcleo central” de la red de enfermedades. Enfermedades con eigenvector bajo serían más periféricas o especializadas, limitadas a un cluster.

Estas medidas ayudan a priorizar en salud pública: condiciones con centralidades altas tal vez ameritan especial atención. Por ejemplo, abordar clínicamente la obesidad (hub) podría prevenir muchas otras dolencias en cascada. O detectar y manejar la depresión en pacientes crónicos podría mejorar múltiples desenlaces (ya que la depresión influye en adherencia al tratamiento de otras enfermedades). Desde la investigación, estas centralidades orientan esfuerzos para entender patogénesis compartida: ¿por qué la enfermedad X es hub? ¿Comparte factor de riesgo con todas, o altera una vía fisiológica común?

Problemas comunes en el análisis de redes de comorbilidades:

  • Sesgo de codificación: Las redes de comorbilidad dependen en gran medida de los diagnósticos registrados. Si un médico tiende a sobre-codificar ciertas comorbilidades (ej. siempre anota obesidad si ve que el paciente tiene sobrepeso, mientras otro médico solo codifica la enfermedad principal), la red puede ver conexiones espurias o sobrestimadas. De igual modo, cambios en los criterios diagnósticos con el tiempo (ej. aparición de nuevos códigos o modas diagnósticas) pueden alterar artificialmente la red. Es importante limpiar y estandarizar los datos, o al menos conocer estas limitaciones al interpretar: algunas aristas pueden reflejar práctica clínica más que realidad epidemiológica.

  • Dependencia de la fuente de datos: No es lo mismo construir la red de comorbilidad a partir de registros de atención primaria, altas hospitalarias, encuestas de salud o reclamaciones de seguros. Cada fuente capta un fragmento del panorama. Por ejemplo, datos hospitalarios enfatizan comorbilidades severas (porque solo los casos graves se hospitalizan), y pueden sobre-representar ciertas asociaciones (como insuficiencia renal con muchas cosas, ya que los pacientes renales acaban hospitalizados con frecuencia). Datos de atención primaria tal vez muestren más asociaciones con enfermedades leves que raramente llevan a hospital (por ejemplo, rinitis alérgica con asma). Además, el sistema de codificación importa: la CIE-10 (Clasificación Internacional de Enfermedades) tiene muchos códigos muy granulares; a veces se agrupan en categorías superiores para tener nodos más generales, pero eso puede esconder asociaciones específicas. Encontrar un balance es complejo: muy agregadas las categorías (ej. “cáncer” como un solo nodo) perderá detalle de qué cánceres coocurren con qué; muy específicas (códigos CIE-10 de 4 dígitos) generará una red enorme y dispersa, difícil de interpretar, y donde coocurrencias fuertes se diluyen en códigos separados (ej. el mismo proceso patológico codificado ligeramente distinto puede aparecer desconectado). Un enfoque es analizar distintos niveles (red a nivel de capítulos CIE vs. red a nivel de diagnósticos concretos) comparativamente.

  • Causalidad vs correlación: Una arista en la red de comorbilidad no implica que una enfermedad cause la otra. Puede haber causa común (factores genéticos o ambientales compartidos), sesgo de selección (un paciente que vive más tiempo acumula más enfermedades, generando correlaciones de comorbilidad simplemente por edad avanzada), o causalidad indirecta (A causa C y C causa B, entonces A y B aparecen asociadas sin relación directa). Un ejemplo: la edad avanzada causa tanto osteoporosis como Alzheimer; la red osteoporosis–Alzheimer mostraría asociación, pero tratar una no afecta la otra directamente, salvo via fragilidad general. Hay esfuerzos por refinar las redes para aproximar causalidad, usando ajustes por variables confundentes o métodos de gráficos probabilísticos. Pero en general, las redes de comorbilidad deben interpretarse como mapas fenomenológicos de asociaciones, útiles para hipótesis y para planificación, pero no para asumir mecanismo a priori.

  • Dinamismo temporal: Las redes de comorbilidad a menudo se construyen aglomerando datos históricos (¿alguna vez tuvo estas enfermedades?). Esto produce una red estática que no refleja la secuencia temporal de aparición. En realidad, el orden importa: algunas enfermedades tienden a preceder a otras (diabetes → complicaciones renales, no al revés típicamente). Recientemente se trabajan redes multilayer o temporales donde se modelan etapas de la vida o se construyen redes dirigidas de transición (enfermedad A lleva a B con X probabilidad). Esto enriquece el análisis pero también lo complejiza notablemente. En cualquier caso, si se usa la red estática, es bueno complementarla con análisis de secuencias o cohortes longitudinales para verificar las rutas de progresión sugeridas en la red.

A pesar de estos desafíos, el análisis de redes de comorbilidades ha arrojado resultados valiosos. Ha permitido cuantificar la carga de multimorbilidad en poblaciones, identificar combinaciones de enfermedades que multiplican costos y mortalidad, y evidenciar la necesidad de movernos de un paradigma de salud enfocado en enfermedades aisladas a uno holístico y centrado en el paciente multimórbido. En el futuro, integrar este enfoque con inteligencia artificial (por ejemplo, alimentando graph neural networks con estas redes para predicción clínica) podría mejorar sustancialmente la capacidad de los sistemas de salud para anticiparse a las trayectorias de enfermedad de las personas y personalizar intervenciones5.

1.15 Conclusiones y desafíos futuros: ética, integración con IA, predicción, interoperabilidad

El análisis de redes ha demostrado ser un enfoque potente y versátil para abordar problemas complejos en salud pública, epidemiología y biomedicina. A modo de cierre, recapitulamos los beneficios observados y esbozamos algunos desafíos futuros y consideraciones éticas de relevancia:

Beneficios resumidos: Las redes permiten visualizar y cuantificar las interdependencias en sistemas de salud. Hemos visto que a través de métricas de centralidad, por ejemplo, se identifican “actores” clave (individuos, hospitales, síntomas, enfermedades) que merecen atención prioritaria ya sea para controlar epidemias, difundir intervenciones o coordinar cuidados. La detección de comunidades destapa subestructuras ocultas, como subpoblaciones vulnerables o clústeres nosocomiales, informando políticas focalizadas. En general, la perspectiva de redes fomenta un entendimiento sistémico: entiende a la salud no solo como propiedades de unidades aisladas, sino como resultado de una red de determinantes en interacción. Esto está muy alineado con paradigmas actuales como la salud única, la epidemiología social y la medicina de sistemas.

Desafíos éticos y de privacidad: Conforme las redes de salud incorporan datos más personales (historial médico detallado, contactos digitales, genomas, etc.), surge el reto de proteger la privacidad de los individuos. Los análisis de redes deben adherir a estrictos protocolos de anonimización y a normativas (como GDPR en Europa o leyes locales de protección de datos). Un dilema ético interesante es que las redes pueden inferir información sensible: por ejemplo, sabiendo que alguien está conectado a muchos pacientes de VIH, se podría sospechar su estado serológico aunque no se haya divulgado. Por ende, incluso la publicación de estructura de la red puede conllevar riesgos. Los investigadores tendrán que desarrollar técnicas de privacidad diferencial u otras metodologías para publicar resultados útiles (como métricas agregadas o modelos generalizados) sin exponer a poblaciones pequeñas o individuos identificables. Asimismo, se deben manejar con cuidado las implicaciones de señalar “nodos problemáticos”: etiquetar un vecindario como el cluster central de obesidad, por ejemplo, podría estigmatizarlo. La ética nos pide usar los hallazgos de redes para empoderar comunidades (dirigiendo recursos) y no para culparlas.

Integración con Inteligencia Artificial (IA): El futuro verá una convergencia creciente entre análisis de redes e IA. Ya se están utilizando Graph Neural Networks (GNNs) –redes neuronales profundas que operan sobre grafos– para tareas como predecir comorbilidades futuras, resultados de pacientes, o propagación de brotes. Estas técnicas pueden aprender patrones complejos en los datos de red que van más allá de las métricas clásicas. Integrar IA plantea oportunidades y retos: los modelos podrían volverse opacos (caja negra), por lo que mantener interpretabilidad será clave para confiar decisiones clínicas a ellos. No obstante, la IA sobre redes puede descubrir combinaciones de factores de riesgo, o simular escenarios de intervención (p. ej., qué pasa en la red de transmisión si vacunamos a cierto % de individuos seleccionados por un algoritmo óptimo). Un desafío técnico es la escala de los datos: las redes de salud a nivel nacional pueden tener miles de nodos (p. ej., enfermedades) y millones de pacientes vinculados; los algoritmos de IA y de detección de comunidades deben seguir mejorando en eficiencia para manejar Big Data de salud en grafos.

Capacidad predictiva y vigilancia en tiempo real: Con la digitalización masiva (historias clínicas electrónicas, dispositivos móviles, redes sociales, sensores portátiles), existe la posibilidad de construir y actualizar redes de salud en tiempo casi real. Por ejemplo, durante una epidemia, las redes de contacto podrían generarse a partir de datos de Bluetooth de celulares para identificar rápidamente la estructura de contactos y actuar en consecuencia. Para enfermedades crónicas, los sistemas podrían monitorear bases de datos clínicas continuamente y alertar cuando emergen nuevas asociaciones inusuales de comorbilidades (potencialmente señalando efectos adversos de medicamentos o nuevas enfermedades emergentes). Esto convierte el análisis de redes en parte de los sistemas de vigilancia epidemiológica y clínica. El reto es integrar múltiples fuentes heterogéneas (movilidad, genética, clínica, ambiental) en redes multilayer robustas. Además, se necesitará infraestructura de interoperabilidad: que distintos sistemas de información se comuniquen para formar estas redes globales. Iniciativas de estándares (HL7 FHIR para datos clínicos, por ejemplo) y políticas de datos abiertos serán cruciales. La interoperabilidad no es solo técnica sino institucional: que hospitales, laboratorios, aseguradoras y autoridades colaboren compartiendo datos de forma segura para el bien común.

Interoperabilidad y colaboración interdisciplinaria: Analizar redes de salud requiere un enfoque verdaderamente interdisciplinario. Deben colaborar especialistas en salud pública, epidemiólogos, sociólogos, científicos de datos, informáticos, entre otros. La interoperabilidad se extiende a lenguajes y metodologías: hay que traducir hallazgos de graph theory a acciones de política sanitaria. Afortunadamente, la metáfora de “red” es comprensible intuitivamente, lo que ayuda a comunicar resultados a tomadores de decisión y al público. Un desafío es evitar malinterpretaciones o sobre-simplificaciones (por ejemplo, la tentación de pensar que eliminando al “súper-nodo” se resuelve el problema, sin considerar consecuencias sistémicas). La formación de profesionales de salud con nociones de análisis de redes, y viceversa, de analistas de datos con comprensión de problemas sanitarios, será importante para una verdadera integración.

Desafíos técnicos emergentes: Además de los ya mencionados (escala, temporalidad, multilayer, IA), vale citar el tema de causalidad. La ciencia de redes está empezando a integrar frameworks causales (como gráficos dirigidos acíclicos, do-calculus de Pearl) para, más que describir, inferir efectos de intervenciones en la red. En salud, esto es esencial: queremos saber, por ejemplo, si rompemos cierta arista (intervenimos una relación de transmisión) cómo cambiará el curso de la epidemia; o si fortalecemos conexiones (p. ej., referir más pacientes a atención primaria) qué pasa con la red de servicios. Unir análisis de redes con experimentación (ensayos controlados en redes, simulaciones tipo digital twins de poblaciones) será un terreno fértil en los próximos años.

En conclusión, el análisis de redes en salud nos brinda una lente poderosa para entender y abordar problemas sanitarios complejos en la era de la información y la interconexión. Nos ha enseñado que las relaciones importan tanto como los elementos individuales – “ningún paciente es una isla”, podríamos decir adaptando la cita. Mirando hacia el futuro, la tarea es aprovechar este enfoque manteniendo rigor y ética: extraer del big data relacional ideas accionables, predecir con anticipación riesgos emergentes, y hacerlo todo respetando a las personas detrás de los nodos. Integrado con inteligencia artificial y sostenido por sistemas interoperables, el análisis de redes promete ser un pilar de la salud pública del siglo XXI, facilitando intervenciones más inteligentes, colaborativas y centradas en los sistemas complejos que realmente determinan la salud de nuestras comunidades4,5.

1.16 Referencias

1. Wasserman, S., & Faust, K. (1994). Social network analysis: Methods and applications. Cambridge University Press.
2. Valente, T. W. (2010). Social networks and health: Models, methods, and applications. Oxford University Press.
3. Newman, M. (2010). Networks: An introduction. Oxford University Press.
4. Borgatti, S. P., Mehra, A., Brass, D. J., & Labianca, G. (2009). Network analysis in the social sciences. Science, 323(5916), 892–895. https://doi.org/10.1126/science.1165821
5. Hidalgo, C. A., Blumm, N., Barabási, A.-L., & Christakis, N. A. (2009). A dynamic network approach for the study of human phenotypes. PLoS Computational Biology, 5(4), e1000353. https://doi.org/10.1371/journal.pcbi.1000353