26 C
Aguascalientes
jueves, octubre 10, 2024

El aprendizaje automático estadístico puede encontrar factores desconocidos que causan enfermedades

El aprendizaje automático estadístico puede encontrar factores desconocidos que causan enfermedades
SLIDE: un novedoso método de aprendizaje automático interpretable para el descubrimiento y la exploración de interacciones de factores latentes significativos. a, Esquema que ilustra la amplia gama de conjuntos de datos en los que se puede aplicar SLIDE y los avances clave sobre los marcos analíticos existentes para el análisis de estos conjuntos de datos. b, Descripción general conceptual del algoritmo SLIDE. c, Esquema que resume la implementación y los diferentes pasos en SLIDE. d, Innovaciones conceptuales clave de SLIDE. e, Comparación del rendimiento predictivo de ER, LASSO, PCR, PLSR y SLIDE en conjuntos de datos simulados en una variedad de características sin (izquierda) y con (derecha) términos de interacción. MSE, error cuadrático medio. f, Comparación del rendimiento predictivo de ER, LASSO, PCR, PLSR y SLIDE en conjuntos de datos simulados en una variedad de tamaños de muestra sin (izquierda) y con (derecha) términos de interacción. Crédito: Métodos de la naturaleza (2024). DOI: 10.1038/s41592-024-02175-z

Un nuevo método ahora puede encontrar factores previamente desconocidos que subyacen a la enfermedad mediante el uso de aprendizaje automático estadístico para clasificar montañas de datos biológicos complejos.

Este método emblemático, llamado SLIDE, integra con éxito múltiples conjuntos de datos biológicos complejos y extrae factores únicos (en inglés, lo que hace que los resultados sean fáciles de entender) que explican directa o indirectamente los datos.

Puede transformar nuestra forma de pensar sobre los datos multiómicos: conjuntos de datos grandes y variados que pueden incluir información detallada sobre la genética, el metabolismo y las funciones de una célula, tejido o individuo, según investigadores de Cornell y un doctorado de Cornell. ahora en la Universidad de Pittsburgh.

Su estudio, «SLIDE: Descubrimiento y exploración de interacción de factores latentes significativos en dominios biológicos», aparece en Métodos de la naturaleza.

«Me encanta porque es interpretable», dijo la coautora Florentina Bunea, profesora de estadística y ciencia de datos en la Facultad de Computación y Ciencias de la Información de Cornell Ann S. Bowers. «Esencialmente, podemos encontrar mecanismos ocultos interpretables a partir de datos biológicos mensurables».

El estudio se basa en una base de trabajo teórico realizado por coautores, entre ellos Bunea; Marten Wegkamp, ​​profesor de estadística y en Cornell Bowers CIS, y de matemáticas en la Facultad de Artes y Ciencias; y Xin Bing, Ph.D., ex estudiante de doctorado de Cornell en el campo de estadística que ahora se encuentra en la Universidad de Toronto.

SLIDE ofrece tanto confirmación como descubrimiento, dijo Bunea, porque puede corroborar hallazgos anteriores y señalar mecanismos desconocidos.

Para desarrollar esta aplicación, los teóricos de Cornell se asociaron con Jishnu Das, Ph.D., profesor asistente de inmunología en la Universidad de Pittsburgh, un inmunólogo de sistemas que estudió en Cornell, donde tomó una clase de estadística con Bunea.

SLIDE representa un avance con respecto a los métodos anteriores, que solo pueden tomar perfiles de datos multiómicos de muestras y predecir si las muestras provienen de organismos sanos o enfermos.

«Eso es simplemente una predicción», dijo Das. «Ese es el ‘qué’; no llega al ‘cómo’ ni al ‘por qué’. Como bióloga, me preocupo profundamente por el cómo y el por qué».

Los investigadores demostraron la eficacia de SLIDE utilizando datos de 24 pacientes con esclerodermia sistémica, un trastorno autoinmune que causa engrosamiento de la piel y también puede dañar los órganos internos. Usando datos de biopsias de piel que mostraron qué genes estaban activados en los investigadores pudieron predecir la gravedad de la enfermedad para cada paciente tan bien o mejor que los métodos más modernos.

También identificaron nueve factores ocultos que subyacen a la gravedad de la afección. Algunos de estos factores están bien establecidos, mientras que otros son nuevos, como el papel previamente desconocido de los queratinocitos, la célula primaria de la capa más externa de la piel. Ya se están realizando experimentos de laboratorio adicionales para confirmar que los factores identificados por SLIDE realmente están causando los síntomas de la enfermedad.

Y el artículo describe cómo el laboratorio de Das también utilizó SLIDE para reproducir las ubicaciones de diferentes tipos de células inmunitarias en el ganglio linfático en un modelo de asma en ratones. De manera similar, en un modelo de ratón con diabetes tipo 1, SLIDE identificó con éxito factores que impulsan la proliferación de CD4+ Células T, que atacan a las células del páncreas que producen insulina, lo que provoca la enfermedad.

«Realmente creemos que será una tecnología transformadora en todos los contextos de enfermedades, desde observar la gravedad de la enfermedad hasta las características celulares y los mecanismos de patogénesis a tipos de células específicas involucradas en impulsar estos procesos», dijo Das.

Bunea describe esta colaboración entre teóricos e investigadores aplicados como «una sinergia que dio sus frutos», señalando que las garantías estadísticas de que los factores ocultos son únicos e identificables son lo que le da al método su poder.

«Cuanto más se involucre la gente de la teoría en aplicaciones reales», dijo, «mejor será para todos nosotros».

Otros contribuyentes al artículo incluyen a los coautores Javad Rahimikollu y Hanxi Xiao de la Universidad de Pittsburgh.

Más información: Javad Rahimikollu et al, DIAPOSITIVA: Descubrimiento y exploración de interacciones significativas de factores latentes en dominios biológicos, Métodos de la naturaleza (2024). DOI: 10.1038/s41592-024-02175-z

Citación: El aprendizaje automático estadístico puede encontrar factores desconocidos que causan enfermedades (2024, 27 de marzo) recuperado el 27 de marzo de 2024 de https://medicalxpress.com/news/2024-03-statistical-machine-unknown-factors-disease.html

Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.

Leer mas

Leer más

Mas noticias

Verificado por MonsterInsights