El Big Data en detalle

22 octubre, 2019
El Big Data en detalle

Las tendencias en el sector empresarial se dirigen hacia una integración de la inteligencia artificial en diferentes áreas de la misma, con el objetivo de agilizar procesos y dar solución de manera más económica a aquellas situaciones complejas que son costosas por la mano de obra.

Un aspecto fundamental para la correcta integración de la inteligencia artificial son los datos. Y en 2019, podemos afirmar que los datos se han convertido en el petróleo del siglo XXI, ¿porqué? Porque gracias a los datos podemos crear patrones y crear reglas por las cuales aprender a detectar riesgos, preferencias de compra, o para integrar diferentes procesos de manera más económica.

Que los datos se han vuelto un elemento más valioso que el petróleo y el oro es algo que desde años se preveía, y esto se debe en gran parte a la gran cantidad de datos que se recogen en Internet, que se ha configurado como el banco de datos por excelencia del mundo entero.

Las redes sociales se han convertido en especialistas en la tarea de recoger datos, ya que en los muros los usuarios comparten su vida de una manera tan intensa que permite que se recojan millones de bits de datos con información sobre preferencias, gustos, opiniones, preferencias y registro de compras, temas de interés y un largo etcétera.

Aunque todo sea dicho, los Estados también recogen muchos datos los cuales son accesibles mediante los diferentes registros. En el caso de España, tenemos el ejemplo de Camerdata, una base de datos de empresas que recoge su información de los registros mercantiles, lo que garantiza una información totalmente fiel con la realidad.

En el artículo de hoy vamos a hablar en profundidad sobre el Big Data, que ya resuena en nuestros oídos, y que se ha configurado en la herramienta ideal para procesar grandes volúmenes de datos.

Porqué es una herramienta tan potente

Una de las aproximaciones más completas de big data es la facilitada por Gartner (2012): «Son activos de información caracterizados por su alto volumen, velocidad y variedad, que demandan soluciones innovadoras y eficientes de procesado para la mejora del conocimiento y toma de decisiones en las organizaciones».

Big data no es solo un conjunto de nuevas tecnologías, sino que es una combinación de negocio y analítica para obtener valor de los datos (convertirlos en información y conocimiento) que, por sus características, situación, volumen, variedad o velocidad antes no se aprovechaban.

La gran generación de volúmenes de datos que se producen a diario, sumado a la velocidad con la que lo hacen, y la extensa variedad de procedencia, hacen que el procesamiento y análisis se convierta en un proceso de selección complejo. Por esta razón, se añaden al proceso dos nuevas uves, veracidad y valor, imprescindibles a la hora tomar decisiones y maximizar la rentabilidad.

Volumen: alusión al gran tamaño de generación de datos diarios, ya sean por parte de empresas o usuarios. Velocidad: hace referencia a la rapidez en la que fluyen los datos, así como al tiempo de procesamiento a tiempo real. Variedad: los datos provienen de diferentes fuentes, ya sean estructurados, no estructurados y semiestructurados. Esta variedad es la que afecta directamente a la complejidad de almacenaje y análisis de estos. Veracidad: dado el gran volumen de datos que se generan, es necesario analizarlos para garantizar así la autenticidad y fiabilidad para la posterior toma de decisiones. Valor: Este contexto menciona la necesidad de seleccionar aquellos datos que sean útiles para poder rentabilizarlos y generar ventajas competitivas.

Por último, vamos a distinguir tres tipos de datos según su procedencia. Los Datos estructurados se presentan en un formato o esquema bien definido y que poseen campos fijos. Son hojas de cálculo, archivos, bases de datos tradicionales provenientes de CRM, ERP, etc., que han sido recolectados por profesionales del marketing en algún momento. Los datos semiestructurados no tienen formato definido, pero sí contienen etiquetas u otros marcadores con el fin de clasificar los elementos de estos. En esta categoría encontramos textos con etiquetas XML y HTML. Y los datos no estructurados., que son los más numerosos, son datos de tipo indefinido, almacenados principalmente como documentos u objetos sin estructura fija ni bajo ningún patrón concreto. Pueden ser generados por máquinas y personas. Son archivos de audio, vídeo, fotografía y formatos de texto libre como emails, SMS, artículos, WhatsApp, etc.