El big data puede ayudar a curar el cáncer
El cáncer ahora tendrá mayores posibilidades de ser curado. Si bien, los avances en medicina continúan dando frutos, se podrá disponer de la información generada por miles de pacientes en el mundo para ser aprovechada, realizar mejores diagnósticos y tratamientos.
Por Jennifer Juárez
Supongamos que una persona en un par de años será diagnosticada con cáncer de próstata. No es un escenario insólito, dado que uno de cada siete hombres, en algún momento de su vida, recibe exactamente este diagnóstico.
Tan sólo en México, en 2014, se diagnosticaron alrededor de 233,000 nuevos casos de cáncer de próstata correspondientes a 17% de todos los cánceres en varones, lo cual lo hace el más frecuente en este género. El riesgo es mayor después de los 60 años de edad, sobre todo en hombres con obesidad y que siguen una dieta rica en grasas.
Con sólo 3% de la población con cáncer participa en ensayos clínicos, y eso en Estados Unidos, una de las naciones con la más intensa investigación del cáncer. En México, como a nivel global, el estimado es aún menor, incluso sin cifras oficiales.
A diferencia del pobre escenario actual, en tan sólo un par de años, este hipotético paciente con cáncer de próstata podrá beneficiarse desde el momento de su diagnóstico. ¿Cómo? Con la información obtenida de los tratamientos realizados a millones de pacientes atendidos por tumores malignos antes que él.
La Sociedad Americana de Oncología Clínica (ASCO, por sus siglas en inglés) está lanzando CancerLinQ, una base de datos masiva cuyo objetivo es aprovechar la información del 97% de los pacientes que actualmente se pierde en las estanterías, los archivos y las memorias de los consultorios oncológicos de todo el mundo. El anuncio se realizó a finales de mayo en el congreso anual de la Sociedad, llamado Iluminación e innovación, transformando datos en aprendizaje.
“Con las 15 clínicas que hemos registrado, para finales de 2015 esperamos tener más de 500,000 pacientes”, prevé el director senior de Operaciones de CancerLinQ, Rich Ross. Se calcula que en 2016 los registros ya se cuenten por millones de pacientes, con las próximas instituciones de práctica médica que se sumen a la iniciativa. El costo de CancerLinQ es de 80 millones de dólares (mdd), según anunció la Casa Blanca a finales de 2013. Esta es parte de la apuesta del presidente estadounidense Barack Obama por el big data, especialmente en temas como la salud, el ejército y la ecología.
El 40% de los socios de ASCO está fuera de Estados Unidos y cientos de ellos laboran en hospitales públicos y privados en México. Eventualmente algunos centros médicos del país podrían utilizar esta base de datos tanto para extraer información como para capturar los datos de sus propios pacientes y en un futuro tener poblaciones representativas de pacientes mexicanos en el sistema.
“Hay organizaciones y redes mexicanas en ASCO. Se busca, en un primer lugar, que esto crezca en Estados Unidos, pero ASCO está diseñado para aprovechar también los datos globales”, explica el director de Medicina de SAP, David Delaney.
SAP, uno de los líderes globales de sistemas de gestión empresarial (conocidos como ERP), es la empresa que puso los sistemas de CancerLinQ, mientras que ASCO, claramente, pondrá (y trabajará) los datos. La potencia de CancerLinQ se debe en gran medida al resultado de una década de trabajo: una base de datos en memoria que permite trabajar con cantidades exorbitantes de datos en periodos ínfimos, la cual SAP presentó en su conferencia anual a principios de mayo en Orlando. Su nombre es HANA.
Con HANA, un oncólogo podrá hacer una búsqueda en una base de datos con millones de historiales médicos para segmentar a un grupo de personas con el cual su paciente actual comparta características como el género, la edad, el tipo de tumor que tiene, enfermedades anteriores como diabetes o hipertensión y ciertas mutaciones genéticas. En menos de ocho segundos, CancerLinQ obtendrá respuestas que la forma tradicional de hacer ciencia tardaría varias generaciones en lograr. Es uno de los ejemplos de cómo ciertas tecnologías, como la capacidad de análisis en tiempo real, el big data y la computación en la nube se alinearon para poner al alcance de las instituciones más variadas una capacidad de procesamiento que anteriormente estaba reservada para las supercomputadoras.
Las 200 caras del cáncer
Un total de 8.2 millones de personas mueren anualmente por tumores malignos en todo el mundo, según la Organización Mundial de la Salud (OMS). En México, los tumores mataron a 73,000 personas en 2013 (el 12% de todas las muertes), según datos del Instituto Nacional de Geografía y Estadística (Inegi). Es la tercera causa de muerte en el país después de las enfermedades del corazón y la diabetes mellitus y tiene una cobertura nacional de 100% en niños y 75% en adultos. Pero el cáncer, en realidad, no es una sola enfermedad.
“La palabra cáncer es un término común que se utiliza para nombrar a los tumores malignos y se dice que engloba muchas enfermedades porque hay más de 200 tipos de tumores. Antes se veían desde el punto de vista histológico (del tejido) como similares. Ahora, con las nuevas tecnologías, hay una mejor clasificación de los tipos de tumores. Cuando se hacen diagnósticos moleculares se ve que tienen un comportamiento y una expresión molecular diferente; y por ello requieren un tratamiento distinto, a pesar de que estén en el mismo órgano”, explica el director general del Instituto Nacional de Cancerología (Incan), Antelmo Abelardo Meneses.
Se sabe que incluso la misma mutación genética puede tener distinto efecto, dependiendo del órgano que ataca. Un ejemplo sencillo es la mutación BRCA1, por la que la actriz Angelina Jolie se sometió a dos cirugías preventivas: una mastectomía y una remoción de los ovarios y las trompas de falopio. La presencia de este gen en mujeres aumenta el riesgo de cáncer de mama hasta en 85%, mientras que en el ovario lo aumenta hasta 50% como máximo.
Actualmente, la forma tradicional de generar conocimiento médico es por medio de los ensayos clínicos, mediante los cuales una población es expuesta a un tratamiento experimental y se comparan los resultados de éste, por una parte con la ausencia de tratamiento alguno (mediante el uso de placebos en grupos de control) y también con otros tratamientos utilizados comúnmente.
Solamente en 3% de los pacientes con cáncer que participan en ensayos clínicos se obtiene una documentación de sus características, del tratamiento que reciben y el resultado. Esto significa que la ciencia sólo está aprendiendo del 3% de 200 enfermedades a la vez, mientras que 97% de los casos restantes no contribuye al aprendizaje científico, a la búsqueda de una cura o métodos de prevención eficaces.
Además, un inconveniente de los ensayos clínicos es que los criterios de exclusión no corresponden a la práctica clínica cotidiana. Con la finalidad de obtener los resultados más representativos y de que otras condiciones médicas no “contaminen” los resultados, frecuentemente se analizan poblaciones muy homogéneas de personas del mismo género, rango de edad, raza y condición médica; y se excluye, por ejemplo, a personas mayores de 75 años, con enfermedades como diabetes o hipertensión. “El reto en la vida real es que cuando llegan pacientes a tu consultorio para que los trates, puedes tener a alguien de 75 años, con un historial de falla cardiaca, entonces el ensayo clínico que se hizo en cierta población no se asemeja al paciente que estás viendo”, explica Delaney.
Otro caso es cuando ya vas muy avanzado, pero no sabes qué sigue: “Tienes un paciente con un cáncer de pulmón al que sólo sobreviven tres de cada 100. Si tu paciente sobrevive, ¿qué haces? ¿Sigues haciendo la quimioterapia esperando que no queden células malignas o te detienes para atacar en caso de que regrese el cáncer? A ese punto no hay un estudio para guiarse”, agrega.
Un juego de números
En un tratamiento de cáncer, desde que el paciente entra, ya tiene un historial médico, en ocasiones electrónico. Las variables de los tratamientos para los distintos tumores son muchísimas y no pueden obviarse detalles tan generales como edad o género, pero tampoco tan específicos como potenciales mutaciones genéticas en cada paciente. Es un reto para los especialistas en bioinformática.
“El volumen total de datos por paciente es mayor que en otros tipos de industrias, como la venta minorista. En oncología tienes información muy compleja, datos estructurados y no estructurados muy complejos de historiales electrónicos de salud, imagenología, resonancias magnéticas funcionales, escaneos, datos sobre la terapia de radiación, incluyendo posibles mapas en 3D con versiones por tiempo y datos de quimioterapia. Tienes también información relacionada con el paciente, con la cura, y tienes que documentar todos esos aspectos. Es un set de datos muy complejo cuyo diseño e implementación conlleva muchas pruebas. Tienes una gran inversión; las decisiones que se van a tomar son en términos de costos humanos, lo que está en juego es la vida humana. Por todos esos factores, la información médica es de un orden de magnitud distinto, al igual que la variedad de los datos y la importancia, en comparación con otras industrias”, explica el médico Delaney.
Multipliquemos todos estos clústers de información por los millones de pacientes diagnosticados con cáncer anualmente. ¿Dónde almacenar tanta información y, sobre todo, cómo aprovecharla? Hace 10 años los analistas se preguntaban de qué servía toda la información que hay en internet si son datos sueltos que no generan conocimiento. El reto es encontrar los significados y las correlaciones que existen entre esos unos y ceros que por primera vez conviven en el mismo lugar y lenguaje. Los sistemas de cómputo por primera vez están listos para lidiar con estos volúmenes sin una sobrecarga de información.
“El reto es poder extraer el valor de todo esto”, dice Delaney. A ocho segundos por búsqueda, las correlaciones podrían dejar de ser un problema.
Los evangelistas de HANA explican el origen de estas capacidades. “Para mí uno de los momentos más poderosos fue cuando (Hasso Platter, cofundador de SAP) hizo la pregunta: ‘¿qué pasaría si tuvieras una base de datos con un tiempo de respuesta igual a cero?’ Es un concepto que, de hecho, a la gente le toma cierto tiempo entender. Pero en cuanto lo superan y lo comprenden, empiezan a descubrir lo que es posible”, enfatiza Delaney.
Una de estas posibilidades es darle movilidad a los sistemas de gestión e inteligencia empresarial más sofisticados. “El puente que trae el poder de HANA hacia los dispositivos móviles es SAP Mobile Platform. Las tabletas y los smartphones lo utilizan para enviar los datos de forma segura y en tiempo real”, explica el solution manager de SAP, Alejandro de León Languré. Una implementación presentada en Orlando, con el nombre clave velocity raptor, permite hacer búsquedas con big data en tiempo real en móviles, ya que ocupa solamente 20 mb de memoria, el equivalente a cinco mp3. Las personas pueden recibir en segundos, en su iPad, resultados de informes que hace un par de años tardaban horas en procesarse, agrega.
Uno de los creadores de HANA no pensaba que este sistema fuera posible. “Yo decía: ‘apliquemos velocidad a lo que ya tenemos y será un éxito enorme’. Siempre me preguntaban: ‘¿Qué puedes hacer con eso?’. Y algunos me decían: ‘No necesito esto’. Especialmente nuestra competencia decía: ‘No necesitas esa velocidad para finanzas’. Y ahora esta capacidad de SAP está en todas las grandes empresas de finanzas”, dijo en conferencia de prensa el cofundador de SAP, Hasso Plattner —tal vez lo conozcas por frases como “el Instituto Plattner, en Alemania”—.
“Pero lo más grande no es tomar el mismo software, hacerle un remake y que corra mucho mejor que nunca, sino que (ahora) podemos hacer las cosas que nunca pudimos. No podíamos hacer predicciones inteligentes; problemas en una forma gráfica para solucionarlos automáticamente; no podíamos lidiar con billones de datos en un sistema, con una respuesta de un segundo. Si me hubieras preguntado hace dos años, ‘¿puedes hacer esto de una forma en la que puedas correr 200,000 millones de datos con una garantía de tiempo de respuesta menor a ocho segundos para cualquier búsqueda y de menos de tres segundos para la mayoría de las búsquedas y de un segundo para las búsquedas del último trimestre?’, habría dicho ‘¿estás bromeando?’”.
¿Hasta dónde podrían llegar las capacidades predictivas de una base de datos con una capacidad de procesamiento y análisis de datos sumamente poderoso? En la industria minorista, ya se puede predecir en qué tiendas de una cadena de supermercados se vencerán las fechas de caducidad de cierto producto lácteo en una venta de una semana y sugerir retrasar o adelantar el resurtido de dicho producto.
Pero en cuestiones médicas, falta mucho para ver estas capacidades. “No creo que algún día veas que la tecnología reemplace al médico. Lo que veremos es que los sistemas de información proveerán al paciente de más información dirigida específicamente a ellos, para que puedan tener una conversación más informada con su médico. Ultimadamente, la combinación de un paciente mejor informado y un médico también mejor informado resultará en el cuidado de alta calidad que todos queremos”, dice Ross, de CancerLinQ, quien también es maestro en tecnologías de las ciencias informáticas.
El objetivo final de la recolección y el procesamiento de datos en este sistema es que eventualmente un paciente con cáncer pueda tomar, junto con su médico, las decisiones de tratamiento mejor informadas, con base en millones de casos similares al suyo, en las decisiones que otras personas tomaron cuando anteriormente estuvieron en sus zapatos y en los resultados que ellas obtuvieron.
Se dice que nadie experimenta en cabeza ajena, pero en un tumor predecesor, tal vez pronto sea posible.