Investigadores utilizan algoritmos de procesamiento de lenguaje natural (PLN) para predecir las mutaciones del virus SARS-CoV-2
|
Por el equipo editorial de HospiMedica en español Actualizado el 19 Jan 2021 |

Imagen: Los investigadores utilizan algoritmos de PLN para predecir las mutaciones del virus SARS-CoV-2 (Fotografía cortesía de Baidu)
Los algoritmos de procesamiento de lenguaje natural (PLN) ahora pueden generar secuencias de proteínas y predecir mutaciones de virus, incluidos cambios clave que ayudan al virus SARS-CoV-2 a evadir el sistema inmunológico.
La idea clave que hace que esto sea posible es que muchas propiedades de los sistemas biológicos se pueden interpretar en términos de palabras y oraciones. En los últimos años, un puñado de investigadores ha demostrado que las secuencias de proteínas y los códigos genéticos pueden modelarse utilizando técnicas de PLN. Ahora, los biólogos computacionales del Instituto Tecnológico de Massachusetts (MIT; Cambridge, MA, EUA) reunieron varias de estas cadenas y utilizan la PLN para predecir mutaciones que permiten que los virus eviten ser detectados por anticuerpos en el sistema inmunológico humano, un proceso conocido como escape inmunológico viral. La idea básica es que la interpretación de un virus por un sistema inmunológico es análoga a la interpretación de una oración por un humano.
El equipo utiliza dos conceptos lingüísticos diferentes: gramática y semántica (o significado). La aptitud genética o evolutiva de un virus, características tales como lo bueno que es para infectar a un huésped, se puede interpretar en términos de corrección gramatical. Un virus infeccioso exitoso es gramaticalmente correcto; uno que no tiene éxito no lo es. Del mismo modo, las mutaciones de un virus se pueden interpretar en términos de semántica. Las mutaciones que hacen que un virus parezca diferente a las cosas en su entorno, como cambios en las proteínas de su superficie que lo hacen invisible para ciertos anticuerpos, han alterado su significado. Los virus con diferentes mutaciones pueden tener diferentes significados, y un virus con un significado diferente puede necesitar diferentes anticuerpos para leerlo.
Para modelar estas propiedades, los investigadores utilizaron una LSTM, un tipo de red neuronal que es anterior a las basadas en transformadores utilizadas por modelos de lenguaje grandes como GPT-3. Estas redes más antiguas se pueden entrenar con muchos menos datos que los transformadores y aún funcionan bien para muchas aplicaciones. En lugar de millones de frases, entrenaron el modelo de PLN en miles de secuencias genéticas tomadas de tres virus diferentes: 45.000 secuencias únicas para una cepa de influenza, 60.000 para una cepa de VIH y entre 3.000 y 4.000 para una cepa del virus SARS-CoV-2.
Los modelos de PLN funcionan codificando palabras en un espacio matemático de tal manera que las palabras con significados similares están más juntas que las palabras con significados diferentes. Esto se conoce como incrustación. En el caso de los virus, la incrustación de las secuencias genéticas agrupaba los virus según la similitud de sus mutaciones. El objetivo general del método es identificar mutaciones que podrían permitir que un virus escape de un sistema inmunológico sin hacerlo menos infeccioso, es decir, mutaciones que cambian el significado de un virus sin hacerlo gramaticalmente incorrecto.
Para probar su método, el equipo utilizó una métrica común para evaluar las predicciones realizadas por modelos de aprendizaje automático que puntúan la exactitud en una escala entre 0,5 (nada mejor que la casualidad) y 1 (perfecto). En este caso, tomaron las principales mutaciones identificadas por la herramienta y, utilizando virus reales en un laboratorio, comprobaron cuántas de ellas eran mutaciones de escape reales. Sus resultados variaron de 0,69 para el VIH a 0,85 para una cepa de coronavirus. Esto es mejor que los resultados de otros modelos de última generación, según los investigadores.
El equipo ha procesado modelos con nuevas variantes del coronavirus, incluida la llamada mutación del Reino Unido, la mutación del visón de Dinamarca y variantes tomadas de Sudáfrica, Singapur y Malasia. El uso de PLN acelera un proceso lento. Anteriormente, el genoma del virus tomado de un paciente con COVID-19 en el hospital podía secuenciarse y sus mutaciones recreadas y estudiadas en un laboratorio. Sin embargo, eso se puede demorar semanas, mientras que el modelo PLN predice mutaciones potenciales de inmediato, lo que enfoca el trabajo de laboratorio y lo acelera.
“Hemos aprendido el lenguaje de la evolución”, dijo Bonnie Berger, bióloga computacional del Instituto Tecnológico de Massachusetts. “La biología tiene su propio lenguaje”.
Enlace relacionado:
Instituto Tecnológico de Massachusetts (MIT)
La idea clave que hace que esto sea posible es que muchas propiedades de los sistemas biológicos se pueden interpretar en términos de palabras y oraciones. En los últimos años, un puñado de investigadores ha demostrado que las secuencias de proteínas y los códigos genéticos pueden modelarse utilizando técnicas de PLN. Ahora, los biólogos computacionales del Instituto Tecnológico de Massachusetts (MIT; Cambridge, MA, EUA) reunieron varias de estas cadenas y utilizan la PLN para predecir mutaciones que permiten que los virus eviten ser detectados por anticuerpos en el sistema inmunológico humano, un proceso conocido como escape inmunológico viral. La idea básica es que la interpretación de un virus por un sistema inmunológico es análoga a la interpretación de una oración por un humano.
El equipo utiliza dos conceptos lingüísticos diferentes: gramática y semántica (o significado). La aptitud genética o evolutiva de un virus, características tales como lo bueno que es para infectar a un huésped, se puede interpretar en términos de corrección gramatical. Un virus infeccioso exitoso es gramaticalmente correcto; uno que no tiene éxito no lo es. Del mismo modo, las mutaciones de un virus se pueden interpretar en términos de semántica. Las mutaciones que hacen que un virus parezca diferente a las cosas en su entorno, como cambios en las proteínas de su superficie que lo hacen invisible para ciertos anticuerpos, han alterado su significado. Los virus con diferentes mutaciones pueden tener diferentes significados, y un virus con un significado diferente puede necesitar diferentes anticuerpos para leerlo.
Para modelar estas propiedades, los investigadores utilizaron una LSTM, un tipo de red neuronal que es anterior a las basadas en transformadores utilizadas por modelos de lenguaje grandes como GPT-3. Estas redes más antiguas se pueden entrenar con muchos menos datos que los transformadores y aún funcionan bien para muchas aplicaciones. En lugar de millones de frases, entrenaron el modelo de PLN en miles de secuencias genéticas tomadas de tres virus diferentes: 45.000 secuencias únicas para una cepa de influenza, 60.000 para una cepa de VIH y entre 3.000 y 4.000 para una cepa del virus SARS-CoV-2.
Los modelos de PLN funcionan codificando palabras en un espacio matemático de tal manera que las palabras con significados similares están más juntas que las palabras con significados diferentes. Esto se conoce como incrustación. En el caso de los virus, la incrustación de las secuencias genéticas agrupaba los virus según la similitud de sus mutaciones. El objetivo general del método es identificar mutaciones que podrían permitir que un virus escape de un sistema inmunológico sin hacerlo menos infeccioso, es decir, mutaciones que cambian el significado de un virus sin hacerlo gramaticalmente incorrecto.
Para probar su método, el equipo utilizó una métrica común para evaluar las predicciones realizadas por modelos de aprendizaje automático que puntúan la exactitud en una escala entre 0,5 (nada mejor que la casualidad) y 1 (perfecto). En este caso, tomaron las principales mutaciones identificadas por la herramienta y, utilizando virus reales en un laboratorio, comprobaron cuántas de ellas eran mutaciones de escape reales. Sus resultados variaron de 0,69 para el VIH a 0,85 para una cepa de coronavirus. Esto es mejor que los resultados de otros modelos de última generación, según los investigadores.
El equipo ha procesado modelos con nuevas variantes del coronavirus, incluida la llamada mutación del Reino Unido, la mutación del visón de Dinamarca y variantes tomadas de Sudáfrica, Singapur y Malasia. El uso de PLN acelera un proceso lento. Anteriormente, el genoma del virus tomado de un paciente con COVID-19 en el hospital podía secuenciarse y sus mutaciones recreadas y estudiadas en un laboratorio. Sin embargo, eso se puede demorar semanas, mientras que el modelo PLN predice mutaciones potenciales de inmediato, lo que enfoca el trabajo de laboratorio y lo acelera.
“Hemos aprendido el lenguaje de la evolución”, dijo Bonnie Berger, bióloga computacional del Instituto Tecnológico de Massachusetts. “La biología tiene su propio lenguaje”.
Enlace relacionado:
Instituto Tecnológico de Massachusetts (MIT)
Últimas COVID-19 noticias
- Sistema de bajo costo detecta el virus SARS-CoV-2 en el aire del hospital mediante burbujas de alta tecnología
- China aprueba la primera vacuna inhalable contra la COVID-19 del mundo
- Vacuna en parche contra la COVID-19 combate variantes del SARS-CoV-2 mejor que las agujas
- Pruebas de viscosidad sanguínea predicen riesgo de muerte en pacientes hospitalizados con COVID-19
- ‘Computadora Covid’ usa IA para detectar COVID-19 en exámenes de TC de tórax
- Técnica de resonancia magnética muestra la causa de los síntomas de COVID prolongada
- TC del tórax de los pacientes con COVID-19 podrían ayudar a diferenciar entre las variantes del SARS-CoV-2
- Resonancia magnética especializada detecta anormalidades pulmonares en pacientes no hospitalizados con COVID prolongada
- Algoritmo de IA identifica a los pacientes hospitalizados con mayor riesgo de morir por COVID-19
- Estudio evalúa el impacto de la COVID-19 sobre la gammagrafía de ventilación/perfusión
- Sensor de sudor detecta biomarcadores claves que suministran una alarma precoz de la COVID-19 y la influenza
- Modelo de IA para seguimiento de COVID-19 predice mortalidad durante los primeros 30 días del ingreso
- ECG puede señalar pacientes hospitalizados con COVID-19 con riesgo más alto de muerte
- IA predice pronóstico de COVID a un nivel casi experto con base en tomografías computarizadas
- Examen de TC muestra evidencia de daño pulmonar persistente mucho tiempo después de neumonía por COVID-19
- Plataforma órgano-en-un-chip ayuda a diseñar estrategia para tratar complicaciones severas de la COVID-19
Canales
Cuidados Criticos
ver canal
Microrrobots guiados magnéticamente permiten la administración dirigida de fármacos
El ictus afecta a 12 millones de personas en todo el mundo cada año, y a menudo provoca la muerte o discapacidad permanente. El tratamiento actual se basa en la administración sistémica... Más
Nanomateriales inteligentes detectan y tratan lesiones cerebrales traumáticas simultáneamente
La lesión cerebral traumática (LCT) continúa dejando a millones de personas con discapacidades a largo plazo cada año. Tras un impacto repentino por una caída, una colisión... Más
Transfusión de sangre más temprana podría reducir la insuficiencia cardíaca y arritmia después de la cirugía
La pérdida de sangre durante o después de una cirugía puede generar un estrés significativo en personas con enfermedad cardíaca, aumentando el riesgo de complicaciones peligrosas. Las transfusiones suelen... MásTécnicas Quirúrgicas
ver canal
Dispositivo quirúrgico revolucionario redefine la artroscopia de cadera
La artroscopia de cadera ha aumentado significativamente en popularidad, pero los cirujanos aún enfrentan importantes limitaciones mecánicas al navegar en espacios articulares profundos mediante cánulas... Más
Sistema automatizado permite la "patología molecular" en tiempo real durante la cirugía oncológica
Identificar con precisión los límites tumorales durante la prostatectomía radical sigue siendo uno de los desafíos más persistentes en el tratamiento del cáncer... MásCuidados de Pacientes
ver canal
Dispositivo automático de lavado de vías intravenosas mejora la atención en infusiones
Más del 80% de los pacientes hospitalizados reciben terapia intravenosa (IV). Cada dosis de medicamento IV administrada en una bolsa de infusión de pequeño volumen (<250 mL) debe... Más
Herramienta de capacitación en realidad virtual combate la contaminación de equipos médicos portátiles
Las infecciones asociadas a la atención médica (IAAS) afectan a uno de cada 31 pacientes, causan casi 100.000 muertes al año y generan un costo de 28.4 mil millones de dólares... Más
Plataforma de biosensores portátiles reducirá infecciones adquiridas en el hospital
En la Unión Europea, aproximadamente 4 millones de pacientes adquieren infecciones asociadas a la atención de la salud (IAAS), o infecciones nosocomiales, cada año, lo que provoca alrededor de 37.... MásTecnología portátil de luz germicida, única en su tipo, desinfecta superficies clínicas de alto contacto en segundos
La reducción de las infecciones adquiridas en la atención sanitaria (IAAS) sigue siendo una cuestión apremiante dentro de los sistemas sanitarios mundiales. Sólo en Estados Unidos, 1,7 millones de pacientes... MásTI
ver canal
Nanopartículas imprimibles permiten la producción masiva de biosensores portátiles
Es probable que el futuro de la medicina se centre en la personalización de la atención médica, comprendiendo exactamente lo que cada individuo necesita y proporcionando la combinación... Más
Los relojes inteligentes podrían detectar la insuficiencia cardíaca congestiva
El diagnóstico de la insuficiencia cardíaca congestiva (ICC) suele requerir técnicas de diagnóstico por imagen costosas y que consumen mucho tiempo, como la ecocardiografía,... MásPruebas POC
ver canal
Lector de inmunoensayo de pruebas POC proporciona análisis cuantitativo de kits de prueba para diagnóstico más preciso
Un lector de inmunoensayos cuantitativos pequeño y liviano que proporciona un análisis cuantitativo de cualquier tipo de kits o tiras de prueba rápida, y se puede conectar a una PC... Más
Sistema de hemostasia de sangre total POC de última generación reconoce necesidades específicas de servicios de emergencia y quirófanos
Las pruebas hemostáticas actuales proporcionan solo un subconjunto de la información necesaria, o tardan demasiado en ser útiles en situaciones críticas de hemorragia, lo que... Más
Laboratorio portátil permitirá identificación de infecciones bacterianas más rápida y económica en el punto de necesidad
La resistencia a los antimicrobianos (RAM) es la falta de respuesta de las bacterias a un determinado antibiótico debido a mutaciones o genes de resistencia que la especie ha adquirido.... MásNegocios
ver canal
Philips y Masimo se asocian para impulsar las tecnologías de monitorización de pacientes
Royal Philips (Ámsterdam, Países Bajos) y Masimo (Irvine, CA, EUA) han renovado su colaboración estratégica plurianual, combinando la experiencia de Philips en monitorización... Más








