2 julio, 2014

Es importante dilucidar si Big Data es una nueva tecnología o, simplemente, un nuevo nombre para algo muy viejo que ahora se puede hacer más rápido, y con más datos, debido a que las máquinas son más poderosas.

No se puede traducir Big Data como “datos grandes”, porque, si bien el volumen de datos sigue creciendo exponencialmente, lo principal de las tecnologías de Big Data es la flexibilidad que agregan al análisis estadístico de datos, con el fin de mejorar el desempeño de la empresa o institución.

Ciertamente, el análisis estadístico de datos no es cosa nueva: hace más de 40 años, lo estudiamos en la universidad, utilizando una gran computadora y un software que trajo un profesor de Michigan (en una cinta de nueve canales). Aprendimos a hacer análisis multivariable, a calcular índices de correlación parcial y otro montón de maravillas que poca gente entiende.

Pero las nuevas tecnologías de Big Data no solo son capaces de analizar grandes cantidades de datos, también incluyen datos en formatos muy variados (por ejemplo, tweets ), datos en movimiento (por ejemplo, GPS o Waze) y datos con diversos grados de incertidumbre.

Tecnología más poderosa. La tecnología de hoy en día es mucho más poderosa, tanto el hardware como el software. Hoy en día, tenemos disponibles enormes cantidades de capacidad de procesamiento y almacenamiento a muy bajo costo (en la nube). También tenemos la posibilidad de capturar muchos más datos debido a la ubicuidad de miles de dispositivos electrónicos (puntos de venta, celulares, peajes, GPS, semáforos, comercio electrónico en sitios web, etc.). Conforme avanza la Internet de las cosas, habrá órdenes de magnitud más dispositivos recabando datos.

Pero tal vez la principal diferencia con el análisis de datos que hacíamos hace 40 años (los métodos estadísticos no han variado mucho) no es la escala ni la técnica, sino la experiencia del usuario.

Las herramientas de software que existen hoy para el análisis ya no requieren el profundo (y difícil) entendimiento estadístico que se necesitaba antes. Tampoco se requieren las grandes inversiones de antes, pues, además de hardware en la nube, también existen numerosas herramientas de software libre.

Incluso, se ha creado una nueva ocupación: el “científico de datos” (ya hay varias universidades ofreciendo carreras). ¿Será esta nueva ocupación solo un nuevo nombre para que los estadísticos podamos cobrar más? Me aseguran que, realmente, es un nuevo tipo de profesional, muy estadístico y muy computacional.

Datos internos y externos. Es notable la amplia gama de datos que se utilizan hoy para el análisis estadístico: no solo datos internos de la organización, sino también datos externos que provienen de redes sociales, datos de posicionamiento geográfico, datos demográficos, etc. Todo esto –herramientas nuevas, bajos costos, datos diversos y nuevas destrezas– traen como resultado, casi obligado, un retorno muy elevado sobre la inversión y/o el esfuerzo que se le invierta al análisis de datos utilizando las tecnologías de Big Data.

Casos de estudio hay muchos, y provienen de casi todas las industrias y sectores de la economía (servicios financieros, telecomunicaciones, distribución y logística, agroindustria, ventas al detalle, servicios de salud, servicios gubernamentales, ciencias de la vida, etc.). Muchos ejemplos se relacionan con servicio al cliente, retención y crecimiento de participación del mercado, pero también hay muchos casos de optimización operativa que mejora sustancialmente la eficiencia y la productividad.

Dado todo lo anterior, el Club de Investigación Tecnológica realizará un “almuerzo pensante” el próximo 16 de julio, en el cual contaremos con presentaciones de dos destacados profesionales locales y, como conferencista de fondo, tendremos al evangelizador de Big Data de IBM. En esta ocasión, además de discutir y aprender acerca de los fundamentos de Big Data, aprenderemos cómo crear una cultura que promueva el análisis avanzado de datos, y cómo ser proactivos en la privacidad, seguridad y gobernabilidad de los datos.

Ciertamente, ideas que valen la pena difundir.

Etiquetado como: