¿Cuáles son algunos buenos ejemplos / instrucciones de investigación / documentos sobre la aplicación del aprendizaje automático a datos biomédicos?

Daré una nota al periódico de mi colega recientemente publicado en PNAS. Schwartz y sus colegas establecieron previamente que el cultivo de células progenitoras neurales derivadas de células madre pluripotentes inducidas en biomateriales sintéticos promueve el desarrollo de redes neuronales que retienen la sensibilidad de una supuesta neurotoxina (toxina botulínica), y en un artículo de seguimiento, Schwartz et al. Estableció un complejo sistema de co-cultivo para aplicaciones de evaluación de toxicidad. Los autores desarrollaron un ensayo novedoso que utiliza biomateriales con células progenitoras neurales sembradas el día 0, células endoteliales y células madre mesenquimáticas sembradas el día 9, y precursores de microglía sembrados el día 13. Después de 16 o 21 días de cultivo, los autores realizaron una inmunofluorescencia extensa tinción y observó que los progenitores neurales se organizaron en redes neuronales que expresaban genes asociados con la neurogénesis, el desarrollo del cerebro posterior y la transmisión sináptica, y la formación de redes vasculares a través de RNAseq. Las construcciones neurales se asociaron en la periferia con redes de células endoteliales que también estaban íntimamente asociadas con las células mesenquimales ( es decir , pericitos, como se esperaba en base a la estructura de los capilares in vivo ) y microglia orientada radialmente (consistente con la conexión íntima entre microglia y Redes neurovasculares in vivo).

Figura 1: Redes neuronales formadas después de 21 días en cultivo. CD31 denota células endoteliales, GFAP denota células gliales, DAPI es una tinción nuclear no específica.

Los autores utilizaron un conjunto de entrenamiento de 60 químicos neurotóxicos y de control y evaluaron el resultado de la exposición de las redes neuronales utilizando RNAseq y el aprendizaje automático, y utilizando este conjunto de entrenamiento, los autores pudieron predecir con un 91% de confianza si un compuesto era o no Tóxico basado en máquinas de vectores de soporte lineales. Con este conjunto de capacitación establecido, los autores utilizaron las redes neuronales para predecir la toxicidad de 10 compuestos que se examinaron de forma ciega. Usando los datos de RNAseq, los autores pudieron identificar correctamente 9/10 de los compuestos como neurotóxicos o de control, y el único compuesto incorrectamente identificado fue un falso positivo (error de tipo I, que es aceptable para un análisis biológico, cuando el objetivo es identificar los tóxicos).

Figura 2: Se utilizaron máquinas de vectores de soporte lineal para establecer una diferencia entre compuestos tóxicos y de control en el conjunto de entrenamiento a través de RNAseq.

Te animo a que leas el papel tú mismo. La información complementaria contiene una gran cantidad de información relacionada con las máquinas de vectores de soporte utilizadas en el análisis de los datos de RNAseq.

Construcciones neurales derivadas de células madre pluripotentes humanas para predecir la toxicidad neural