Con Hadoop, tu empresa puede almacenar datos en diferentes formatos, por lo que se reduce la inversión de tiempo y dinero para procesarlos, pero ¿cómo empezar? En mi experiencia, dar “pequeños pasos” y “aprender haciendo” es la clave del éxito.

 

Por Alex Infanzon

Todo el mundo está hablando de Hadoop, analítica y big data. Según el analista IDC, el mercado de soluciones de big data y analítica en América Latina representó 661 millones de dólares en 2014. Se espera que la adopción de soluciones de analítica y big data se incremente como resultado de la madurez del ecosistema de Hadoop y el incremento en el uso de herramientas y aplicaciones analíticas.

La adopción de la analítica y big data en América Latina ha estado llena de incertidumbres. El trabajo realizado por los diferentes proveedores para educar y capacitar al mercado no ha sido tan exitoso. El número de empresas que iniciaron proyectos de este tipo es muy bajo, según la información de IDC. La principal razón es la complejidad de este tipo de proyectos.

En Hadoop tenemos un ecosistema muy diverso, que crece día a día, por lo que es difícil estar actualizado en todos los proyectos activos. Por tal motivo es importante apalancarse al trabajo realizado por proveedores de software para simplificar y tomar ventaja del ecosistema.

 

¿Cómo iniciar un proyecto de este tipo?

  • Lo primero es preguntarse ¿por qué hacerlo? Debe existir un caso de uso convincente, un conductor competitivo, un factor de costo, o algún otro tema que ha sido identificado para la aplicación de tecnologías de big data y analítica.
  • Lo segundo es seleccionar a los integrantes del equipo antes que a la tecnología. La selección de personal es la variable más importante en el éxito del proyecto, sobre todo cuando se trata de tecnologías emergentes.

Lo recomendable es dar pasos pequeños con un alcance bien definido y acotado. Tomar un caso de uso real con un retorno de inversión (ROI) claro que fundamente el proyecto. Por ejemplo, utilizar Hadoop como un repositorio centralizado de datos con el fin de abatir el costo de almacenamiento e incrementar la capacidad de procesamiento de grandes volúmenes de datos.

 

Inicie con pasos pequeños

Es muy importante moverse lento y seguro. En mi experiencia, dar “pequeños pasos” y “aprender haciendo” es la clave del éxito. A la fecha existen en Hadoop aproximadamente 133 proyectos en diferentes categorías:

SAS-Hadoop-Alex_Página_2Con tantas opciones es fácil perderse y desperdiciar los escasos presupuestos y recursos de tecnologías de la información (TI) si tratamos de abarcar todos ellos, por lo que es recomendable definir y acotar nuestro proyecto y seleccionar el ecosistema o los proyectos que mejor se adecuen a nuestros objetivos.

 

Alcance definido y acotado

Un factor fundamental de éxito es la definición de objetivos del proyecto, previo a la planificación del mismo. ¿Por qué son importantes los objetivos? Principalmente por tres razones:

  1. Ayudan a acotar el alcance real.
  2. Permiten monitorear la evolución.
  3. Validar la satisfacción de expectativas.

Una técnica frecuentemente utilizada para evaluar si los objetivos están correctamente definidos es verificar si son SMART (Specific, Measurable, Achievable, Realistic, Time bound o Específicos, Medibles, Alcanzables, Realistas, Límite de tiempo).

 

Necesidad real

– En México, Iusacell ha logrado rebasar diversos retos de negocios, entre los cuales destacan la reducción de los niveles de abandono de clientes y la oferta de campañas más estratégicas a sus clientes.

– En Colombia, el banco Davivienda presenta un caso práctico. DaviPlata es un producto que permite al cliente manejar de forma fácil y gratis su dinero desde su celular, sin necesidad de tener una cuenta bancaria o tarjeta de débito. Una vez activado el celular con DaviPlata se puede recibir y enviar dinero. Banco Davivienda ha tomado técnicas emergentes de big data para analizar los comportamientos típicos de grupos de clientes similares y controlar o rechazar usos atípicos.

– En Argentina, Arcos Dorado, la mayor cadena de restaurantes de servicio rápido de América, analiza los recibos de las cajas, recolectando los datos de las ventas realizadas en todos los restaurantes, para saber quién come qué, cuándo, con quién, y después evaluar las nuevas ofertas a ofrecer en función de menús, recetas, regiones, horarios, etcétera.

Son muchos los campos donde big data es utilizado. En empresas del sector financiero, bancario, salud, automotriz, gubernamental, farmacéutico, y otros sectores económicos en todos los continentes. Si bien existen un número de aplicaciones “sexy” como las antes mencionadas, big data no es siempre tan sexy; de hecho, las más veces no lo es. De ahí que la clave del éxito es identificar una necesidad real de la empresa y cuál es el retorno de la inversión esperado.

 

Retorno de inversión

Los proyectos de big data son complejos, de alto riesgo, y el retorno de la inversión es difícil de cuantificar. Definitivamente, éste es el nuevo tipo de aplicaciones que se requieren. Sin embargo, en la fase de aprendizaje lo mejor es iniciar creando un fundamento sólido para su desarrollo. Los proyectos mencionados en la sección anterior tienen en común el acceso a un volumen de datos adecuado en forma oportuna y con la calidad suficiente para su análisis.

Las empresas exitosas en este tipo de proyectos han empezado evolucionando su almacenamiento de datos y su forma de extraerlos y procesarlos hacia un esquema de big data y herramientas de analítica avanzada para aprovechar la información lo mejor posible.

Un factor clave ha sido la escalabilidad y el bajo costo de Hadoop. Por ejemplo, un cluster Hadoop con un petabyte de capacidad para almacenamiento requiere entre 125 y 250 nodos, que cuestan aproximadamente 1 millón de dólares. El costo de una distribución comercial de Hadoop tiene precios similares (aproximadamente 4,000 dólares por nodo), que es una pequeña fracción del costo de una bodega de datos (10-100 millones de dólares) utilizando una base de datos relacional y almacenamiento tradicional. Las empresas innovadoras tienen hoy Hadoop; la pregunta es ¿cómo van a aprovecharlo y qué tan rápido se convertirá en una tecnología de misión-crítica?

Para iniciar un proyecto con Hadoop, analítica y big data es recomendable dar pasos pequeños, con un alcance bien definido. Hay que democratizar el acceso a los datos y tener una plataforma robusta para manejarlos.

Con Hadoop, las empresas pueden almacenar los datos en diferentes formatos, por lo que se reduce la inversión de tiempo y dinero para procesarlos, en comparación con el tiempo requerido para configurar las bases de datos relacionales y sus tablas rígidas. Hadoop es la plataforma perfecta, ya que el crecimiento es más sencillo y económico, además de facilitar la captura de datos procedentes de múltiples fuentes.


Alex Infanzon es Arquitecto de la Práctica de High Performance Analytics en SAS.

 

Contacto:

Twitter: @SASMexico

Facebook: SASMx

Página web: SAS

 

Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Forbes México.

 

Siguientes artículos

La transformación de las pymes en la web
Por

Los jóvenes de entre 24 y 35 años de edad (sí, los millennials) están redefiniendo la manera como las pymes hacen negoci...