¿Qué es el Big Data?

Generalmente, big data se refiere a grandes cantidades de datos que superan las capacidades de los entornos informáticos convencionales. El manejo de estos volúmenes de datos requiere nuevas infraestructuras informáticas para procesarlos y es una de las principales tendencias informáticas actuales.

El término "big data" no está exactamente definido. Sin embargo, se refiere a conjuntos de datos que son tan grandes que los sistemas de bases de datos establecidos tienen problemas para gestionar estos datos de manera eficiente. Estos problemas van desde la simple captación de los datos, pasando por su almacenamiento, distribución y búsqueda, hasta su análisis y visualización. En las empresas, el Big Data es uno de los temas más importantes (o la cuestión de cómo se pueden utilizar estos volúmenes de datos de forma significativa).

¿Cuándo surgió el Big Data?

Los conjuntos de datos grandes son un fenómeno que llegó por primera vez a la vista de las empresas gracias a la amplia conexión en red de dispositivos de todo tipo. En todo el mundo, la cantidad de datos procedentes de máquinas, sensores, chips RFID en productos de todo tipo y, por último, pero no por ello menos importante, de Internet de acceso público, ha aumentado de forma espectacular. En 2011 se transfirió por primera vez más de 1 zettabyte en todo el mundo; para 2020 se espera que se multiplique por 35.

También son responsables del auge del término Big Data los diferentes formatos de archivo que se han abierto paso en las bases de datos clásicas. La falta de estructura para procesar esos tipos de datos también plantea grandes dificultades para los sistemas clásicos de bases de datos. Al mismo tiempo, el uso correcto del Big Data es una gran ventaja, por lo que las grandes empresas no pueden prescindir de las soluciones.

¿Por qué el Big Data es un problema?

Muchas soluciones de bases de datos conocidas ya no son adecuadas para manejar los datos debido a la cantidad de datos. Las bases de datos relacionales no pueden manejar el gran volumen, mientras que muchas bases de datos basadas en procesos ETL son demasiado lentas. Por lo tanto, son necesarios nuevos métodos para analizar los volúmenes de datos a una velocidad razonable.

¿En qué áreas ofrece soluciones el Big Data?

Por un lado, el Big Data se dedica a procesar volúmenes de datos muy grandes y también diferentes conjuntos de datos. En el campo de la analítica, en cambio, se trata de la minería de datos y la creación de modelos para evaluar estos datos. Otro objetivo importante es la velocidad: a pesar de que los volúmenes de datos aumentan drásticamente, los datos deben poder recuperarse más rápidamente y ser más fáciles de seleccionar. Por último, se investigan soluciones que permitan simplificar la estructuración de los datos y la gestión de los distintos tipos de datos.

Las empresas más grandes son también, clásicamente, las que más rápido impulsan la investigación. Microsoft, SAP, Google y otras empresas están trabajando en soluciones para tratar adecuadamente el Big Data.

Deja un comentario