La transformaci¨®n digital impulsada por los macrodatos est¨¢ cambiando todo tipo de sectores. Y el sector de las ciencias de la vida no es una excepci¨®n.
En el pasado, se necesitaban varios a?os y miles de millones de d¨®lares para secuenciar un genoma humano. Actualmente, la misma tarea puede realizarse en menos de 24 horas y por menos de 1000 $.
Las tecnolog¨ªas de laboratorio esenciales para trabajar en estos campos tambi¨¦n han evolucionado a gran velocidad. Por ejemplo, las herramientas m¨¢s nuevas para la investigaci¨®n en el ¨¢mbito de las ciencias de la vida han permitido que los cient¨ªficos creen complejas visualizaciones tridimensionales de las mol¨¦culas de prote¨ªnas. Los cient¨ªficos utilizan estas visualizaciones como ayuda para descubrir f¨¢rmacos y para lograr avances pioneros en la medicina personalizada.
El motor principal de estos avances revolucionarios son los macrodatos. El volumen y la complejidad de los datos sigue creciendo a un ritmo vertiginoso, sobre todo en el campo de la gen¨®mica, la bioinform¨¢tica, la biolog¨ªa predictiva y la qu¨ªmica.
Los instrumentos de laboratorio tambi¨¦n producen cantidades importantes de datos ¡ªa veces, hasta un terabyte de datos por hora¡ª.
Por supuesto, cuanto m¨¢s crece el volumen de datos, mayores son las necesidades de almacenamiento. La infraestructura inform¨¢tica que sustenta las bases de datos utilizadas en las ciencias de la vida tiene que evolucionar al mismo tiempo que crece la escala y la dimensionalidad de los datos.
Los cient¨ªficos manejan unas cantidades ingentes de informaci¨®n, por ello, tambi¨¦n necesitan unas herramientas de software modernas con las que visualizar r¨¢pidamente los macrodatos y poder interactuar con ellos. De lo contrario, las organizaciones dedicadas a las ciencias de la vida tendr¨¢n un mont¨®n de datos, pero muy poca informaci¨®n.
Beneficios m¨¢s generales de los macrodatos para el sector de las ciencias de la vida
Si las organizaciones dedicadas a las ciencias de la vida siguen mejorando sus infraestructuras inform¨¢ticas, para integrar mejor los macrodatos en sus procesos centrales, su trabajo seguir¨¢ dando unos frutos incre¨ªbles, por ejemplo:
- La mejora de la evaluaci¨®n del riesgo: con la ayuda de los macrodatos los cient¨ªficos pueden reunir informaci¨®n que revele posibles riesgos para la salud, evaluar el grado de peligro asociado a estos riesgos y sacar conclusiones con las que resolver el problema.?
- La medicina personalizada: a medida que los cient¨ªficos y los m¨¦dicos puedan procesar de manera m¨¢s efectiva y entender mejor la informaci¨®n electr¨®nica relativa a la salud de las personas, podr¨¢n decidir con m¨¢s exactitud qu¨¦ tipo de tratamiento m¨¦dico necesita cada paciente.?
- Las valoraciones m¨¢s efectivas de los ensayos cl¨ªnicos: en la actualidad, con casi todos los medicamentos se utiliza el modelo del ¡°tratamiento est¨¢ndar¡±, que consiste en proporcionar un tratamiento basado en las respuestas de grupo generales y los ensayos cl¨ªnicos. Sin embargo, con un uso m¨¢s efectivo de los macrodatos, se puede evaluar de manera m¨¢s precisa c¨®mo afectan los tratamientos m¨¦dicos a cada tipo espec¨ªfico de pacientes, lo que incluye tambi¨¦n la detecci¨®n de los efectos secundarios que de otro modo pasar¨ªan desapercibidos. Esto contribuye, entre otras cosas, a progresar de manera continuada en el descubrimiento de medicamentos.
Los cuellos de botella de la infraestructura de TI tradicional impiden los posibles avances
Los beneficios que los macrodatos pueden aportar a las ciencias de la vida parecen muy prometedores, pero las organizaciones necesitar¨¢n una infraestructura de TI y unas capacidades de almacenamiento de datos que les permitan afrontar el aumento cada vez mayor de las demandas de estos.
Seg¨²n un?estudio de 2019 de Deloitte/MIT, solo el 20% de las organizaciones dedicadas a la biofarmacia y las ciencias de la vida est¨¢ madurando digitalmente con la suficiente rapidez. Lamentablemente, los sistemas de almacenamiento tradicionales generan cuellos de botella en el rendimiento e impiden que las aplicaciones reciban los datos que los cient¨ªficos necesitan para lograr m¨¢s avances revolucionarios.?
Por suerte, est¨¢n apareciendo nuevos instrumentos y tecnolog¨ªas en el campo de las ciencias de la vida. Y estos pueden crear nuevas oportunidades de investigaci¨®n con las que se obtendr¨¢ m¨¢s informaci¨®n. Sin embargo, las organizaciones tienen que enfrentarse primero a varios retos tecnol¨®gicos para poder aprovechar plenamente estas innovaciones.
Reto n.? 1: los silos de datos
Muchas organizaciones se esfuerzan por acabar con los silos de datos. Los silos hacen que los investigadores pierdan mucho tiempo y tengan dificultades para acceder a los datos de los que depende su trabajo. Los silos se desarrollan, en parte, porque los datos se almacenan en diversas herramientas y soluciones de software, en lugar de hacerlo en una base de datos de ciencias de la vida centralizada.?
Para eliminar las barreras creadas por la segregaci¨®n de los datos, las organizaciones tienen que encontrar la manera de cambiar sin disrupciones sus sistemas de datos por una herramienta de software f¨¢cil de usar.
Reto n.? 2: la escalabilidad
Tal como hemos dicho anteriormente, las tecnolog¨ªas cient¨ªficas m¨¢s nuevas producen una cantidad considerable de datos. Por lo tanto, las organizaciones dedicadas a las ciencias de la vida tienen que aumentar su capacidad de almacenamiento para dar cabida a este flujo cada vez mayor de informaci¨®n.?
Si no se logra la escala adecuada a tiempo, los flujos de trabajo que se basan en los datos captados por esos instrumentos sufren perturbaciones e interrupciones.
Reto n.? 3: el an¨¢lisis de los macrodatos
El valor de los macrodatos equivale al de la informaci¨®n que se puede extraer de ellos. Tanto si ejecuta un pipeline de an¨¢lisis de macrodatos para impulsar la medicina personalizada como si utiliza la IA como ayuda para descubrir nuevos f¨¢rmacos, la computaci¨®n de alto rendimiento (HPC) necesita un almacenamiento de datos de alto rendimiento. Por ello, en la actualidad, el cambio de las unidades de disco duro rotatorio a las cabinas de almacenamiento totalmente flash, con una baja latencia y unas E/S por segundo altas, ha pasado a ser una necesidad.