Computación en nube para estudiar datos de secuenciación de datos de ADN

Por el equipo editorial de HospiMedica en español
Actualizado el 26 Dec 2011
Una plataforma de código abierto para la investigación biomédica y genética de datos, ya está disponible en la web como un recurso de computación en nube.

Un equipo de investigadores, entre ellos el Dr. Anton Nekrutenko, profesor asociado de bioquímica y biología molecular en la Universidad Estatal de Pensilvania (Penn State, University Park, EUA), la Dra. Kateryna Makova, profesora asociada de biología en Penn State, y James Taylor de la Universidad de Emory (Atlanta, GA, EUA; www.emory.edu), diseñaron las nuevas tecnologías, que ayudarán a los científicos e investigadores biomédicos a explotar las herramientas tales como un software de análisis y secuenciación de ADN, así como una capacidad de almacenamiento para grandes cantidades de datos científicos. Los detalles del desarrollo han de ser publicados como una carta en la revista Nature Biotechnology.

El Dr. Nekrutenko informó que él y su equipo desarrollaron, por primera vez, el sistema informático Galaxy en 2005, debido a que “la biología estaba en un estado de shock. Los laboratorios de bioquímica y biología generan montañas de datos, y después, los científicos se preguntaban: '¿Qué hacemos ahora? ¿Cómo podemos analizar todos estos datos’”? Galaxy, que fue desarrollado en Penn State y sigue usando los servidores de la Universidad por su potencia de cálculo, resuelve muchos de los problemas que encuentran los investigadores reuniendo una variedad de herramientas que permiten la fácil recuperación y el análisis de grandes cantidades de datos, simplificando el proceso del análisis genómico.

Como se describe en uno de los artículos de los científicos a principios de la revista Genome Research, Galaxy, “combina la potencia de las bases de datos actuales de anotación del genoma con un portal Web simple para permitir a los usuarios buscar recursos remotos, combinar los datos de consultas independientes, y visualizar el resultado”. Galaxy también permite que otros investigadores revisen los pasos que se han tomado, por ejemplo, en el análisis de una cadena de código genético. “Galaxy ofrece transparencia científica - la opción de crear un informe público de análisis. Así que, después de que un artículo ha sido publicado, los científicos en otros laboratorios pueden hacer los estudios con el fin de reproducir los resultados descritos”, dijo el Dr. Nekrutenko.

Ahora, los científicos han llevado a Galaxy a la siguiente fase mediante el desarrollo de una opción “en-la-nube” usando, por ejemplo, la popular nube de Amazon Web Services. “Una nube es básicamente una red de computadoras de gran alcance a la que se puede acceder de forma remota sin la necesidad de preocuparse por la calefacción, la refrigeración y la administración del sistema. Dicho sistema permite a los usuarios, sin importar dónde se encuentren en el mundo, a cambiar la carga de trabajo del software de almacenamiento, el almacenamiento de datos y la infraestructura de hardware a este lugar remoto de computadores en red”, explicó el Dr. Nekrutenko. “En lugar de ejecutar Galaxy en el computador propio o utilizar los servidores de Penn State para acceder a Galaxy, ahora un investigador puede aprovechar el poder de la nube, que permite una potencia de cálculo casi ilimitada”.

Como caso de estudio, los científicos informan en la investigación reciente, publicado en la revista Genome Biology en la que los científicos, con la ayuda de Ian Paul, profesor de pediatría en el Centro Médico Hershey de Penn State, analizaron el ADN de nueve personas de tres familias usando la Nube Galaxy. Debido a la enorme potencia de cálculo de la plataforma, los investigadores pudieron identificar cuatro sitios heteroplásmicos - variaciones en las mitocondrias, la parte del genoma que se transmite de madre a hijo.

La Nube Galaxy ofrece muchas ventajas que no son las más obvias, como la potencia de cálculo de grandes cantidades de datos y la capacidad de un científico sin mucha formación en informática de poder usar herramientas de análisis de ADN que de otro modo no podrían estar accesibles”, concluyó el Dr. Nekrutenko. “Por ejemplo, los investigadores no necesitan invertir en infraestructura informática costosa, para ser capaces de realizar análisis con gran cantidad de datos y científicos sofisticados”.

Por otra parte, otro de los beneficios de la Nube Galaxy es su capacidad de almacenamiento de datos. Usando la nube de Amazon Web Services, los investigadores tienen la opción de almacenar grandes cantidades de datos en un lugar seguro. “Hay nuevas tecnologías que producirán 100 veces más datos que la secuenciación de ADN existente, de última generación, que ya ha llegado al punto en el que más almacenamiento se convierte en un problema, por no hablar del análisis”, dijo el Dr. Nekrutenko.

Enlaces relacionados:

Pennsylvania State University

Emory University



Últimas Bio Investigación noticias