La mayoría de los técnicos con los que he hablado piensan que Big Data no es nada nuevo. Parecen estar partiendo de la premisa de que el único propósito de Big Data en la vida es servir a la inteligencia de negocios. Como alguien me dijo el otro día, «Walmart ha estado disfrutando el fruto de su inversión en almacenamiento de datos/inteligencia empresarial durante años; mucho antes de que existiera Hadoop o NoSql». Cierto, pero Big Data no se trata de «Qué». Se trata de «Cómo». ¿Cuánto tiempo se ejecutan los trabajos nocturnos de Walmart para transformar los datos sin procesar en datos significativos (datos comerciales) que pueden usar sus herramientas de BI? Además, ¿Walmart está procesando actualmente sus datos no estructurados para agregar valor a su estrategia de BI?
Vi a Werner Vogels, el CTO de Amazon elaborar sobre lo que hoy se llama «Big Data» en 2006. Estaba hablando de cómo Amazon había hecho un cambio radical de bases de datos relacionales a archivos planos para almacenar los datos de sus clientes. Dijo que las bases de datos relacionales no podían cumplir con los requisitos de Amazon. Lo interesante es que Werner Vogel se refería a las dificultades que enfrentaban al procesar la parte OLTP de su negocio y no DSS. Sin embargo, hoy en día, Big Data abarca OLTP, DSS y BI en tiempo real.
Equilibremos el mito con los hechos: ¿Qué no es Big Data? Big Data no está vinculado a un conjunto de tecnologías ni es aplicable a todas las empresas que se sientan encima de grandes cantidades de datos. Es cierto que la industria de TI ha logrado grandes avances en el almacenamiento en caché de datos, el rendimiento de E/S, la escalabilidad, la disponibilidad, la consistencia, el procesamiento de datos en tiempo real y el trabajo con datos no estructurados. Sin embargo, esas mejoras podrían haber cobrado vida orgánicamente por las manos invisibles de la dinámica del mercado para respaldar la evolución de la inteligencia comercial. Donde los hechos y el mito se desvían es que el mito no tiene en cuenta la probabilidad de que hubiéramos estado donde estamos hoy, incluso si no hubiera nadie como Amazon.
En conclusión, el término «Big Data», si bien es legítimo porque se refiere a nuevas formas de procesar grandes cantidades de datos, es engañoso debido a que «tamaño» es parte del nombre, pero los tipos de tamaño (pequeño, mediano , grande) no son constantes y cambian con el tiempo. Lo que se consideraba un gran conjunto de datos hace veinte años puede caer hoy en una categoría pequeña. Personalmente, preferiría referirme a ellos como «Datos netos», en alusión a la forma en que los datos se distribuyen en muchos servidores en archivos de disco en lugar de bases de datos.
business intelligence
Viajes Universitarios by Viajes Fin de Curso
Transformación digital by Inteligencia de Negocios
#curioso #caso #definición #Big #Data
Comentarios recientes