No todo lo que generan los sistemas de información y modelos analíticos es el evangelio. Pero, ¿cómo evitar que el lago de datos se convierta en relleno sanitario?

 

Por Alex Infanzon

La tendencia de las personas a aceptar como verdadera la información generada por sistemas computarizados, resulta sorprendente. Esto, porque el razonamiento parece ser: “Si los datos fueron procesados por un sistema de cómputo, entonces el resultado debe ser correcto.” Esto no es necesariamente cierto. Veamos un ejemplo:

PUBLICIDAD

 

Basura entra

Si invertimos 200,000 pesos cada mes en una campaña de mercadotecnia enfocada en un segmento específico de 100,000 clientes, entonces el costo anual de la campaña es de 2.4 millones de pesos (excluyendo salarios y costos de operación). En años anteriores, el ingreso generado por las ventas asociadas a la campaña había sido de 5 millones de pesos y la ganancia de 2.6 millones de pesos (ingresos menos costos).

Ahora bien, si el algoritmo que se ejecuta para seleccionar y enviar el correo a los clientes es correcto, entonces ¿cuál es el impacto en el éxito de la campaña si la calidad de los datos es mala? Por ejemplo, datos erróneos en forma de registros duplicados, direcciones incorrectas, listas obsoletas y otros errores. Si se asume una tasa de error del 50% (una cifra común en departamentos de mercadotecnia), entonces la mitad de los correos se pierden y, por lo tanto, el ingreso se reduce también a la mitad (de 5 millones a 2.5 millones de pesos). Las ganancias también se reducen de 2.6 millones a 100,000 pesos. Si añadimos salarios y otros costos de operación, ¡lo más probable es que perdamos dinero!

Si definimos el gobierno de datos como un programa que abarca la calidad de los datos, sus políticas de uso, así como aspectos de seguridad y privacidad, entonces la escena descrita arriba es sólo un aspecto de dichos programas. En las últimas dos décadas, la gobernabilidad de datos ha madurado significativamente en áreas como:

  • Integración de datos: Combinar los datos que residen en diferentes fuentes y proporcionar una visión unificada.
  • Gestión para la calidad de datos: Asegurar que los datos cumplen con los requerimientos y criterios de aceptación del negocio.
  • Gestión de metadatos: Repositorio centralizado con información acerca de los datos tales como: su significado, sus relaciones con otros datos, su origen, uso y formato.
  • Gestión de datos maestros (Master Data Management): Para vincular los datos críticos en un archivo, llamado un archivo maestro, que proporciona un punto de referencia común.
  • Seguridad y privacidad de los datos: Se ocupa de la capacidad para determinar qué datos pueden ser compartidos con terceros y quién(es) tienen privilegios para acceder a ellos.

Con el advenimiento de Big Data, el nuevo paradigma es crear un lago de datos (Data Lake), por lo que es necesario reexaminar qué tan bien se cumplen los requerimientos originales de cada una de las áreas antes mencionadas. Pero, ¿qué quiere decir crear un lago de datos? Éste se define como un repositorio de almacenamiento masivo y económico, como Hadoop, donde se puede almacenar permanentemente todo tipo de datos para realizar procesos analíticos o de minería de datos. El lago de datos contiene los datos en su forma más cruda, sin procesar y con un mínimo de gobierno. Para evitar que el lago de datos prístino se convierta en un relleno sanitario (basurero) es necesario implementar un programa de gobierno de datos.

 

Evangelio sale

Pero, ¿qué hay respecto a los resultados generados por los sistemas de información? La tecnología de la información se ha convertido en el posibilitador de notables cambios en las organizaciones. Su uso ha ocasionado una profunda transformación de las mismas, e incluso de los mercados, de manera que la información se ha convertido en un activo cada vez más valorado. Por ello, hoy las organizaciones deben redoblar esfuerzos para establecer procesos de gobernabilidad que garanticen la confiabilidad de la información a partir de dichos sistemas.

De la misma forma, en muchas organizaciones los procesos analíticos están creciendo rápidamente, lo que genera nuevos retos de gobernabilidad en temas como: integración entre diferentes áreas de la empresa y sus fuentes de datos; aspectos regulatorios y/o legales y de capital humano, así como otros aspectos como:

  • La planificación y sistematización (sistemas de control de la calidad) para satisfacer los requisitos de calidad de los modelos analíticos.
  • Establecer estándares a utilizar en la organización referente a: datos, aplicaciones, procesos y mejores prácticas.
  • Evaluación de los procedimientos y políticas de seguridad y privacidad.
  • Certificar que los programas de gobierno de datos garantizan que los datos y metadatos de la organización son precisos, completos y consistentes.

Ahora bien, aun cuando la información generada sea correcta, deben existir controles de gobierno para mitigar otro tipo de riesgos, por ejemplo, el de la imagen corporativa.

En Estados Unidos en el 2012, la empresa Target tuvo que enfrentar un problema de su imagen corporativa cuando el periódico New York Times publicó un artículo: “Cómo las Empresas Conocen Tus Secretos” (How Companies Learn Your Secrets, por Charles Duhigg, febrero 16, 2012). El artículo describe la forma en que la compañía utilizó modelos analíticos para identificar si una clienta estaba embarazada, incluso si ella no quería saberlo.

El problema surgió cuando el padre de una adolescente se quejó ante la empresa de que le estaban enviando cupones y publicidad para mujeres embarazadas a su hija. La empresa se disculpó aun cuando era verdad que la adolescente estaba embarazada.

Hay que ser cauteloso, verificar los resultados y el impacto de las acciones que se toman.

No todo lo que generan los sistemas de información y modelos analíticos es el evangelio. Debemos validar siempre su veracidad. Como dice el refrán: “Si te digo que la burra es parda es porque tengo los pelos en la mano.


Alex Infanzon, Arquitecto de la Práctica de High Performance Analytics en SAS.

 

Contacto:

Twitter: @SASMexico

Facebook: SASMx

Página web: SAS

 

Las opiniones expresadas son sólo responsabilidad de sus autores y son completamente independientes de la postura y la línea editorial de Forbes México.

 

Siguientes artículos

Disney quiere cautivar a las mujeres con Star Wars
Por

La empresa busca llegar al público femenino para ampliar la audiencia de una franquicia predominantemente masculina y tr...