La abundancia de datos está abriendo paso a una nueva comunidad de profesionales que tiene la extraordinaria virtud de preguntarle a los números cualquier cosa para predecir el futuro. El día de mañana, sin duda, serán los empleados más cotizados de empresas y gobiernos.    Por Hiroshi Takahashi   Las fórmulas matemáticas advierten que hay peligro alrededor del popocatépetl, que hay que estar atentos y listos para la evacuación. El volcán presenta actividad explosiva de escala intermedia a alta. Sensores remotos y cámaras digitales alrededor del volcán Popocatépetl arrojan millones de datos en tiempo real hacia las máquinas del Centro Nacional de Prevención de Desastres (Cenapred). La sismicidad, las cenizas, las explosiones, son parte de los cientos de miles de números que cada segundo alimentan la base de datos que encenderá en algún momento la alerta roja de desalojo. El comportamiento del volcán es observado por cientos de expertos en el mundo. La predicción de escenarios es uno de los objetivos de la ciencia de los datos. Lo más difícil de avizorar con los números, hasta ahora, tiene que ver con los desastres naturales. Es más fácil conocer el comportamiento de los humanos y manipularlo. Por eso, ahora, los data scientist (científicos de datos) se ponen de moda gracias a que, con su extraordinaria manera de descifrar el misterio de los datos, pueden ayudar a empresas y gobiernos a resolver sus grandes problemas. Entre ellos está Poblano, quien nació en enero de 1978, estudió Economía en la Universidad de Chicago y luego en la London School of Economics. Juega póker casi profesionalmente, se apoda así porque le encanta la comida mexicana, pero en realidad se llama Nathaniel Read Silver. Poblano, predijo correctamente el resultado en 49 de los 50 estados de la Unión Americana en las elecciones presidenciales de 2008. En el futuro, será considerado como un gurú de las predicciones. Hasta hace poco tiempo, Nathaniel era reconocido como el autor de PECOTA (Player Empirical Comparison and Optimization Test Algorithm), un sistema matemático para pronosticar el desempeño y logros profesionales de los jugadores de las grandes ligas del beisbol. Pero más que eso, Poblano es el rockstar de una nueva generación de expertos en matemáticas que han decidido demostrarle al mundo que es posible ver de otra forma el universo, la política, el destino de un país. El futuro.   Números y dinero   noelle_sio1 En el campo de los negocios, Fox Interactive Media aprovechó las bases de datos de MySpace para conocer más a los jóvenes. Noelle Sio comenzó ahí su carrera. La contrataron porque estudió matemáticas y necesitaban a alguien con su perfil para iniciar sus investigaciones. No tenía experiencia en tecnología. Esta joven es hoy líder de proyectos en Greenplum, una empresa que se considera el dream team de los científicos de datos. De igual forma, EMC es una empresa que se dio cuenta hace años del potencial de este saber que se basa en grandes bases de datos. Hace años instaló un complejo sistema en el estadio de los Red Sox de Boston para analizar el desempeño del equipo y de sus rivales, y así mejorar en el campo progresivamente. Nathaniel no está dentro del presupuesto de ninguna compañía, mientras que los pocos equipos que hay en esta disciplina son comprados en su totalidad con todo y la empresa que los entrena. Ese fue el caso de Greenplum. Sus sueldos equivalen a más de cinco ceros al año. Precisamente por sus salarios y los pocos data scientist que existen. ¿Hay algunos en México? “La ciencia de datos está en todas partes”, dice Noelle Sio. “Cualquier proceso que se pueda optimizar es data science. Inició en la publicidad, en la industria de Internet, pero cualquier experiencia que tienes puede optimizarse”. La Senior Data Scientist de Greenplum, que también es otra rockstar de esta nueva industria, dice que uno de los ejemplos de su presencia en todas partes son los medios masivos de comunicación. Los clientes le piden saber quiénes son los espectadores, quieren entender quién es el objetivo, a qué hora pueden impactarlo más.   Los números en el día a día   Empresas como General Electric y Nike se han acercado a EMC para saber cuáles son las posibilidades de aprovechar ese gran cúmulo de datos que todos los días producimos los humanos: le llaman biofeedback. Frank Gens, vicepresidente senior y analista en jefe de IDC, ubica el gran negocio que se puede hacer con ello: “Puedes imaginar que tendrás servicios de salud en un smartphone. Alguien que tiene diabetes puede monitorear el nivel de azúcar de su sangre por bluetooth con su iPhone y éste puede conectarse con el hospital que está a 500 millas de distancia”. Otro caso: los supermercados quieren interactuar más con sus clientes y el único momento que tienen para ello es cuando éstos llegan a la caja. Quieren saber qué es lo que buscan y no encuentran. Los científicos de datos les pueden ayudar a desentrañar el misterio. “Los datos se convierten en el nuevo material crudo de los negocios, en un insumo económico, casi a la par del capital y el trabajo”, dijo Rollin Ford, el Chief Information Officer de Wal-Mart al semanario The Economist. La información que generamos los humanos es apenas una parte de lo que los científicos de datos pueden usar para dibujar el futuro. Las cosas están generando datos que se comparten directamente con lectores y otras máquinas que ya ni siquiera necesitan intervención humana; están programadas con fórmulas que arrojan millones de respuestas por segundo. Es anatomía de un instante, big data analysis. Los dispositivos que nos rodean están comenzando a ser cargados de sensores para que arrojen en cada momento información a las bases de datos, que permitan conocer patrones de comportamiento. A eso lo llaman ya el “Internet de las cosas”, machine learning. Hace unos días Nathaniel le dijo a The Guardian: “No quiero que la gente me vea como el tipo que predice cosas. La predicción es una herramienta muy importante, y es esencial para la ciencia ver qué tipo de realidad subjetiva hace match con el mundo objetivo. Pero en realidad no es un show de carnaval”. Sin embargo, sí lo parece. Es un show que apenas está comenzando. Moneyball, la película que protagonizó Brad Pitt en la que es un entrenador de beisbol que contrata a un genio de las matemáticas para armar un equipo altamente competitivo a partir de las estadísticas de los jugadores, es uno de los ejemplos más claros para analizar grandes bases de datos y traducirlas en fórmulas sencillas que los tomadores de decisiones deben aplicar en momentos decisivos. Noelle Sio acepta que hoy más que nunca le sobra trabajo. Demanda tiene mucha, sobre todo porque no existe la carrera como tal. Lo que existe es la formación en matemáticas y física. Las fórmulas y experiencia que va ganando al momento de resolver problemas la están haciendo famosa. De acuerdo con un reporte de McKinsey, hay por lo menos cinco nuevas cosas que se pueden aprovechar de la abundancia de datos: crear transparencia en las actividades e incrementar la eficiencia de la empresa; mejorar el análisis de los empleados y su desempeño; segmentar poblaciones para diseñar acciones; reemplazar o darle apoyo a decisiones humanas con algoritmos automatizados; innovar en nuevos modelos de negocios, productos y servicios. “Tenemos alianzas con muchos colegios para desarrollar la formación de científicos de datos”, dice Jeremy Burton, vicepresidente ejecutivo de Operaciones de Producto y Marketing de EMC. Burton reitera que no sólo las empresas buscan los servicios de los científicos de datos, sino que las agencias de inteligencia también desean contar con sus servicios. Los científicos de datos quieren predecirlo todo. Apenas comienzan a conocer su potencial. El Popocatépetl es uno de los experimentos de predicción de fenómenos naturales, y tal vez alguno de los estudiantes de la UNAM que trabaja en el Cenapred se vuelva el siguiente rockstar por salvar miles de vidas.

 

Siguientes artículos

EU se ahorraría millones si la gente tomara sus medicinas
Por

La adherencia a la medicación es una práctica a la baja en Estados Unidos que cuesta millones en asistencia médica cada...