COMPARTIR

Todo lo que debes conocer del Big Data para un óptimo análisis

BIG DATA

Redactado por Luisana Puy-arena

Publicado el 12/10/2019

Cada minuto se suben 48 horas de vídeo a YouTube y se comparten más de medio millón de publicaciones en Facebook. Y eso no es nada. 

Cuando lleguemos a 2020, produciremos 44 veces más datos que en 2010. Nadamos en un océano de información, pero ¿significa eso que somos más inteligentes?

El Big Data ya es imprescindible para un número creciente de compañías. ¿Cómo pasan las empresas de este mar de números a la información útil? ¿Cómo se convierten los datos en inteligencia?

Convirtiendo Data en herramientas inteligentes

El Big Data está en todas las esquinas. Desde la herramienta de recomendación de series de las plataformas de streaming hasta las predicciones de Google Maps sobre el número de clientes que habrá en nuestro restaurante favorito.

Dejando el aspecto tecnológico de lado, si hay un sector en el que el Big Data ha irrumpido a todos los niveles, es el de los negocios.

Para muchas industrias, el Big Data se está convirtiendo en una nueva fuente de información que, hasta ahora, había permanecido oculta.

Cada 24 horas, los miles de millones de dispositivos y seres humanos conectados a Internet generan 2,5 millones de Terabytes de información

Este dato esconde dos de las principales características del Big Data: su gran volumen y la velocidad con que se produce.

Además, procede de multitud de fuentes diversas. De hecho, el 90% de los datos que se genera es desestructurado, como los cientos de miles de tuits y posts de Twitter y Facebook.

Por último, el Big Data tiene que ser veraz, es decir, tiene que ser información en la que se pueda confiar.

Esta ha sido y es la definición más tradicional de Big Data. En los últimos años, por la necesidad de transformar este conjunto de técnicas, herramientas y datos en algo enfocado a los negocios, se le ha sumado una quinta característica: la inteligencia.

Los datos tienen que empezar a aportar valor para la toma de decisiones y su ejecución.

Antes de ingestar los datos, hacemos distintos procesos de calidad, para ver si estos datos aportan o no información. 

Es fundamental que los datos lleguen con una calidad buena, que tengan todos los campos rellenos y que sean coherentes para poder obtener información de ellos.

El valor del dato depende del uso que le des, así que la mejor manera de convertirlo en algo valioso es pensar ¿qué quiero hacer y qué tipo de información puedo usar para conseguir ese objetivo?

Luego, obviamente, tiene que haber una labor de depuración para ver si puede ser usado para aquello que nos habíamos propuesto.

Ahora bien, durante muchísimo tiempo personas y empresas, sobre todo las pequeñas  cometen 2 errores primordiales y quizá hasta un tercero, esto son, infravalorar el BIG DATA que producimos individualmente y despreciar el VALOR de esa información.

Por eso, te contamos un poco más su importancia y su utilidad. 

1.- La importancia de los datos

“La información es poder”- Francis Bacon

Esta frase nos debería invitar a reconsiderar nuestra actitud hacia los datos y la información que producimos de forma individual.

Si usamos correctamente los antecedentes, fuentes o materiales del que disponemos, entonces tendremos la sartén por el mango, por tanto merece dedicarle tiempo al registro de esos antecedentes, fuentes o materiales.

El mundo virtual basado en la gran cantidad de herramientas tecnológicas, realizan esa recopilación y registro de información de forma automática gracias a los científicos de datos datos.

2.- Las oportunidades basadas en datos

Todo lo mencionado lineas arriba es una previa para hablar acerca de OMNIPRESENCIA DE LAS OPORTUNIDADES BASADAS EN DATOS, esto significa que hay oportunidad a cada momento y en todas partes, como consecuencia de la vasta cantidad de DATA disponible hoy en día.

Las empresas pequeñas medianas y grandes de distintos sectores deben enfocarse en explotar la DATA para alcanzar VENTAJAS COMPETITIVAS.

Según Michael Porter la ventaja competitiva busca propiciar la diferenciación de tu negocio mediante el reconocimiento de lo que produce valor para el cliente y colocarse como empresa líder en su sector en un mercado altamente globalizado.

El volumen y la variedad de los datos han superado por lejos la capacidad del análisis manual, pero también en paralelo ha crecido el poder computacional, las redes, y los algoritmos, permitiendo conectar diferentes bases de datos con la finalidad de lograr un análisis más amplio y más profundo.

Todo esto no era posible en el pasado.

3.- Diferencias sutiles pero importantes

A nivel empresarial es vital ser guiados por los datos, para cual es importante contar con un equipo de especialistas tanto en Data Science y Data Engineering.

A partir de las lecciones aprendidas por los expertos en el tema sugieren la utilización de la regla 10/90 (Avinash Kaushik – Web Anlytics 2.0).

Lo que significa que, si el objetivo es extraer un altísimo valor de los datos, entonces los costos de las herramientas deberían representar el 10% de la inversión y el otro 90% debe ser en recursos inteligentes o analistas.

Los analistas son los los responsables y pieza clave para dar sentido a los datos, extrayendo insight e implementando estrategias competitivas.

La ciencia de datos mejoran la toma de decisiones, la cual está directamente relacionado al interés de los negocios.

Por tanto un científico de datos (data science) utiliza principios, procesos y técnicas para el entendimiento de los fenómenos mediante el análisis (automatizado) de los datos.

Mientras que el data engineer (data engineering and processing) se encargan de un aspecto más general y son el soporte de los científicos de datos.

Sin embargo hoy en día muchas de las habilidades de procesamiento, conocimientos de sistemas y tecnologías se confunden con ciencia de datos (ver más en Data Science for Business – Foster Provost & Tom Fawcet).

4.- Herramientas en el marketing digital que gestionan big data.

Una cosa que hemos dejado en claro acerca de la importancia de los datos y lo imprescindible es contar con un equipo de especialistas que darán sentido a los datos y mejorarán la toma de decisiones.

Dos de los sectores en donde el uso de los datos y algoritmos están más desarrollados son: finanzas y marketing digital; este último cuenta con aliados como Google, Facebook, Twiter, Hubspot, Marketo, Mailchimp,  Survey Monkey, Google Analytics, Google Adwords, Yahoo Anlytics, Power BI, Similar Web, Nuvi, y cientos más, para la extracción de datos, recopilación, procesamiento y visualización de los mismos.

Una de las ventajas más importantes que tiene el marketing digital es poder realizar A/B testing en lugar de realizarlo de forma tradicional como catálogos o anuncios de televisión.

Una web permite lanzarlo más rápido y ver el éxito o fracaso de una forma significativamente más rápida y barata, además permite generar más datos y permite una medición y control en tiempo real.

Utilizando Google con segmentación, aprovechamos el potencial de sus algoritmos para procesos, incluso de análisis de patrones en las imágenes.

Las 7Vs que caracterizan al Big Data

Las 7Vs que caracterizan al Big Data

Bien, es importante que sepas que, en el proceso del Big Data, existen características fundamentales que lo conforman como lo son el volumen masivo, la variedad, la velocidad, veracidad y valor.

Estas características son conocidas como las 5V del Big Data, sin embargo, varios expertos afirman que se deben incluir 2V más, que vendrían siendo: la variabilidad y la visualización de los datos.

Por tanto, se puede decir que son 7Vs las que conforman el Big Data. ¿Quieres saber en qué consiste cada una de ellas? ¡A continuación te contamos!

1. Volumen

Volumen

Bien sabido es que en años anteriores no contábamos con la tecnología que tenemos hoy en día, por tanto, la recolección de datos se realizaba de manera manual.

Pero con el pasar de los años y la revolución tecnológica, ya no es necesario seguir haciéndolo de esta manera, puesto que, los datos provienen de dispositivos o máquinas, lo cual permite que se gesten de forma automática.

Ahora bien, al estos datos provenir de estos dispositivos, ya sean, tablets, laptops, móviles, entre otros, generar una gran cantidad de datos, por lo que el volumen de datos a analizar es masivo.

Por tanto, se puede decir que esta primera característica se refiere al tamaño de las cantidades de datos que se generan actualmente, cabe mencionar que las cantidades pueden llegar a ser exorbitantes.

Y ¿cómo no? Si casi toda la población mundial está conectada a la red, con decirte, que la cantidad de datos que se producen entre 48 a 42 horas, equivalen a todos los datos que se generaban en un año, antes del 2002. Increíble ¿no?

Por supuesto, esta cantidad de datos suponen retos técnicos y analíticos de mucha importancia para las empresas que realizar el procesamiento de datos.

2. Velocidad

Tal como te comentamos unas líneas más arriba, la cantidad de datos es gigante y se producen a cada segundo, por tanto, el flujo de los datos es masivo y constante.

Lo que quiere decir que, al generarse los datos, estos se almacenan a la misma velocidad que se generan, lo cual, puede ser un arma de doble filo, puesto que, todo es tan rápido que pierden valor cuando aparece data nueva.

Por tanto, es ideal que las empresas reaccionen con la misma velocidad para recopilarlos, almacenarlos y procesarlos y puedan obtener información de utilidad antes de que pierdan su potencial valor.

3. Variedad

Variedad

En esta era del Big Data, los datos provienen de diversas fuentes, ya sean, móviles inteligentes, autos, sistemas GPS, redes sociales, correo electrónico, entre otros sistemas que también estén conectados a la red.

Por tal motivo, los datos podrían venir en dos formatos: estructurados y no estructurados. De tal manera que dependiendo de como vengan, se procesarán mediante herramientas especificas para cada tipo de dato.

Sin embargo, posteriormente, estos datos se combinan y configuran unos con otros, por lo cual, se genera un gran grado de complejidad al momento de almacenarlos y realizar el análisis de los datos recolectados.

4. Veracidad

Sin duda alguna, este 4to punto es uno de los más retadores en cuanto al Big Data, porque al tener un volumen de data tan grande, es difícil definir y tener la plena seguridad de la veracidad de los mismos.

Puesto que, pasa que, en muchas ocasiones, los datos llegan incompletos o no son correctos, por tanto, son datos que plantean dudas sobre si son o no de calidad.

Por tanto, para poder salir de dudas garantizar que los datos recolectados realmente funcionen y sean de calidad, la empresa debe sede asegurarse mediante un análisis exhaustivo.

En este análisis deben limpiar los datos, de modo que puedan cerciorarse si lo datos que están recopilando tienen validez y son adecuados para poder alcanzar los objetivos que se pretenden alcanzar.

Pero, ¿a qué se debe que los datos puedan llegar incompletos o incorrectos? Bien, se debe a múltiples factores, pero los más significativos son que los datos se originan en distintos países, así como también, los formatos de los proveedores.

5. Valor

Este aspecto es bastante importante y se trata del valor que generan los datos que se almacenados y analizados, luego de realizar la conversión a información sencilla de leer.

Su valor representará las nuevas oportunidades, movimientos y estrategias que puede desarrollar una empresa a través de la aplicación del Big Data, por tanto, es de vital importancia reconocer qué elementos le suman un valor positivo.

Estas 5V, son las principales que conforman y caracterizan al Big Data, pero, tal como te comentamos a inicio de este artículo, varios expertos aseguran que existen 2V adicionales que no debemos pasar por alto. ¡Véamos de que se trata!

Variabilidad

Es probable que asocies variabilidad con otro de las V del Big Data como lo es la variedad, pero lo cierto, es que no están relacionadas, ni realizan la misma función.

La variabilidad es relevante al momento en que se realiza el análisis de percepciones, puesto que, los datos presentan distintos comportamientos como la repetición en diferentes momentos, así como su variedad significados.

Por tanto, es requerido aplicar una serie de métodos estadísticos para realizar las comparaciones pertinentes de sus variaciones y tener un acercamiento mucho más profunda a la causa.  

Visualización

Visualización

Tal como nos indica su nombre, la visualización se trata del modo en el que los datos son presentados.

Posterior al proceso de los datos, estos se encuentras posicionados en tablas y hojas de cálculo, lo cual, no es muy digerible al momento de presentarlos, por tanto, es ideal, hallar un método de representarlos visualmente.

Con el fin de que sea legibles y accesibles para cualquier persona, además, es clave al momento de buscar patrones y claves ocultas en el tema que se va a estudiar.

Hoy en día, existen miles de herramientas de visualización que te pueden ayudar a que los datos sean más comprensibles por medio de gráficas.

Implementar las 7V del Big Data es de suma importancia para poder lograr un óptimo proceso de análisis de datos, por ello, es vital no saltarse ninguna de ellas.

Si aún no has recurrido a la implementación del Big Data en tu empresa ¿qué estás esperando? Recuerda que te permite conocer mejor a tus usuarios, tomar mejores decisiones y crear estrategias ganadoras.

 

foto de Luisana Puy-arena

Luisana Puy-arena

Redactora de contenidos en Velogig. Comunicadora audiovisual de profesión, con experiencia en edición y creación de contenidos.


Suscríbete al Blog.

Agregue un comentario

Su dirección de correo no se hará público. Los campos requeridos están marcados *

Publicaciones relacionadas

imagen del post
4 tácticas de marketing digital para incentivar el turismo todo el año

Por Mónica Angeles

23/01/2020

Existen un sinfín de empresas de turismo empleando los beneficios del marketing digital para sus estrategias... pero realmente les está funcionando? En Velogig te ayudamos con esto.

LEER MÁS
imagen del post
Cómo el marketing digital ha cambiado la industria de viajes y turismo

Por Mónica Angeles

13/01/2020

La industria turística ha tenido que cambiar su forma de atender al cliente, como consecuencia de lo que representa un mundo cada vez más digitalizado.

LEER MÁS
imagen del post
Top 9 Aplicaciones Móviles Educativas

Por Alexander Menezes

10/01/2020

⭐🚀Las aplicaciones móviles están cada vez más incorporadas en los sistemas educativos y en todos los hogares. Son una gran herramienta. 🚀⭐

LEER MÁS