Ray G. Butler
- 4 min read

Cómo Interpretar los Resultados Exploratorios de AutoDiscovery

Mapa de descubrimientos mostrando relaciones potenciales entre biomarcadores, mitosis y estadificación del tumor

El resultado principal del proceso de análisis exhaustivo e inteligente de AutoDiscovery es el listado de las potenciales relaciones entre variables más relevantes, identificadas a partir de los datos de nuestro estudio clínico o de nuestro proyecto de investigación biomédica en general.

Pero, ¿cómo debemos interpretar esas relaciones? ¿qué conocimiento nos proporcionan?

Si quieres conocer la respuesta a estas preguntas, sigue leyendo.

# Estadística exploratoria de AutoDiscovery

Como ya explicamos hace un tiempo, AutoDiscovery es una herramienta de análisis exploratorio automatizado. Este tipo de análisis estadístico es diferente y complementario al clásico testeo de hipótesis.

Cómo se complementan el análisis exploratorio y el confirmatorio

Esta diferenciación es importante para entender que AutoDiscovery no pretende sustituir a las herramientas de análisis estadístico confirmatorio sino ayudar en las primeras etapas del estudio a identificar las mejores líneas de trabajo futuras para nuestro equipo de investigación.

# Significancia, fuerza y exclusividad

Con el objetivo de minimizar los errores de tipo II (beta o falsos negativos), el proceso estadístico exploratorio de AutoDiscovery no incluye corrección de significancia. Por ese motivo, el potencial de las relaciones identificadas por AutoDiscovery debe ser evaluado por el propio investigador ya sea en base a su experiencia en el campo o a través de un estudio confirmatorio posterior.

AutoDiscovery complementa el criterio de significancia mínima (p<0,05) con otros elementos informativos específicos del ámbito exploratorio:

Fuerza

Es una medida cuantitativa de la intensidad de la relación entre dos variables. La fuerza de una relación es mayor cuanto más evidente es el potencial efecto de una variable sobre la otra. En esta imagen se ve como la relación de la derecha tiene más fuerza (175%) que la de la izquierda (10%).

Exclusividad

La exclusividad de una relación es una medida cualitativa de su potencial interés científico. La exclusividad determina en qué subconjuntos de nuestros datos se ha identificado una misma relación entre variables.

Así, por ejemplo, una potencial relación entre la expresión de un gen X y la supervivencia global identificada exclusivamente en el conjunto de pacientes a los que se le aplicó un tratamiento específico (y no en el resto de pacientes) es considerada por AutoDiscovery como más “interesante” que otra relación identificada en toda la población y, por consiguiente, posiblemente ya conocida por el investigador.

Ambas medidas, fuerza y exclusividad, son muy útiles para priorizar y focalizar nuestros (escasos) recursos en aquellas relaciones que presentan un mayor potencial científico.

# Tipos de asociaciones estadísticas en AutoDiscovery

AutoDiscovery es capaz de analizar la potencial relación entre cada par de variables de nuestros datos utilizando, en cada caso particular, técnicas estadísticas exploratorias apropiadas.

Esta selección automática la realiza a partir de un detallado estudio de la tipología de los datos de cada variable de la relación, su distribución estadística y otros aspectos metodológicos, de forma similar a cómo lo hace un experto bioestadístico humano.

En términos generales, AutoDiscovery es capaz de identificar tres tipos de asociaciones estadísticas.

Relaciones monótonas (correlaciones)

A través de la técnica de Spearman, un método no paramétrico que puede ser utilizado incluso en distribuciones no normales de los datos, AutoDiscovery obtiene una medida de la dependencia o interrelación entre ambas variables, es decir, hasta qué punto los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra.

Se utiliza cuando ambas variables son cuantitativas.

Ejemplo de correlación negativa entre dos variables del estudio

Una correlación positiva entre las variables A y B puede interpretarse como ...

“a medida que A aumenta, B también lo hace, lo cual sugiere una potencial asociación directa entre ambas variables.”

mientras que una correlación negativa se debe interpretar como ...

“a medida que A aumenta, B disminuye, lo cual sugiere una potencial asociación inversa entre ambas variables.”

La fuerza de una correlación viene dada directamente por el valor del coeficiente de Spearman calculado, expresado en %.

Diferencias entre tratamientos (análisis de varianzas)

AutoDiscovery utiliza diferentes cálculos de la familia del análisis de varianzas (ANOVA) para determinar si diferentes tratamientos (variables “factor”) muestran diferencias significativas en otras variables (“respuesta”) o, dicho de otra forma, qué respuestas son significativamente diferentes en promedio en función de qué factores.

Se utiliza cuando una de las variables es categórica (factor) y la otra es cuantitativa (respuesta).

Ejemplo de respuesta significativamente diferente identificada con un análisis de varianzas

Una asociación de este tipo debe interpretarse como que ...

“la variable respuesta es significativamente diferente en promedio en los diferentes grupos formados por la variable factor, lo cual sugiere una potencial asociación entre ambas variables.”

La fuerza de un análisis de varianzas viene dado por el efecto promedio del factor sobre la respuesta, expresado en %.

Distribuciones heterogéneas (contingencias)

A través del coeficiente de Cramér, AutoDiscovery compara las frecuencias efectivamente calculadas de las dos variables con las frecuencias que se hubiesen esperado si hubiesen sido independientes.

Una tabla de contingencia está formada, como digo, por dos variables y está basada en el cálculo de porcentajes. El objetivo de esta técnica estadística es averiguar si las dos variables están relacionadas y la manera de averiguarlo es mediante la distribución de porcentajes.

Se utiliza cuando ambas variables son categóricas.

Ejemplo de distribución heterogénea identificada con un análisis de contigencias

Habitualmente, la heterogeneidad viene dada por una cantidad de muestras excesiva en alguna combinación (X, Y) de las dos variables (A, B) por lo que una asociación de este tipo debe interpretarse, en general, como que ...

“la cantidad de muestras de nuestro estudio con las características X e Y en las variables A y B es significativamente superior/inferior a lo esperado, lo cual sugiere una potencial asociación entre ambas características.”

La fuerza de una contingencia viene dada directamente por el valor del coeficiente V de Cramér calculado, expresado en %.

# Prueba con tus propios datos (es gratis)

Si quieres probar qué relaciones relevantes pueden estar ocultas en los datos de tu propio estudio, no dudes en contactarnos y pedirnos una evaluación igualmente gratuita para que puedas valorar hasta qué punto AutoDiscovery puede ayudar en tus proyectos de investigación.