Gestión de Big Data: controlando a la bestia

Quienes conozcan la obra de James Patterson se acordarán de “Zoo”, una novela donde el argumento se basa en que los animales gobiernan el mundo, de forma descontrolada, hasta que se encuentra la cura para un virus mutante que los ha convertido en terribles depredadores. Cuando hablamos de gestionar Big Data, es posible que nos sintamos así: como si estuviésemos en un zoo donde un depredador llamado Big Data anda suelto y expmountain-lion-1577644_1920ectante.

Para controlar a la “bestia” del Big Data, es necesario contar con una estructura de gestión heterogénea que pueda manejar tanto los datos estructurados como los desestructurados, que soporte miles de nodos de Big Data, que entienda la necesidad de cumplimiento normativo y los requisitos de gobierno de la información, y que pueda enviar estos datos a la nube, todo esto mientras separa los datos críticos con implicaciones legales de aquellos menos esenciales. Ahí el zoo empezaría a tener mejor aspecto.

Controlar el Big Data es el primer paso para las empresas que se están dando cuenta del amplio espectro de beneficios que pueden obtener de las analíticas en tiempo real desde un punto de vista de negocio. El Instituto Internacional de Analíticas predice que en 2020, las empresas que usen los datos de forma efectiva obtendrán alrededor de 430.000 millones de dólares en beneficios de productividad frente a las organizaciones que fallen a la hora de usar los datos.

Como no estamos en una novela, no vamos a inventar una cura mágica para los animales infectados, pero sí que contamos con las herramientas técnicas necesarias para mantener el Big Data bajo control. Y con la organización y preparación necesarias para ayudarnos a mejorar la competitividad mediante la extracción de conocimiento de los datos. Estas son algunas cuestiones técnicas clave a tener en cuenta:

Atando en corto los datos desestructurados

los correos electróboard-1364650_1920nicos y los vídeos son ejemplos de datos desestructurados, una categoría dentro de Big Data que está creciendo cada vez más, ya que es una forma efectiva para comunicar desde el punto de vista del marketing y a la mayoría de la gente le gusta. En una organización, el vídeo y otras formas de datos desestructurados están sujetos a la misma normativa legal que los datos estructurados. Es sólo cuestión de tiempo que el eDiscovery de vídeo se convierta en algo tan rutinario como el descubrimiento de documentos básicos. Por tanto, una organización que quiera aprovechar el Big Data necesita tener una estructura de backup, archivado y descubrimiento que soporte igualmente datos estructurados y no estructurados.

Cuestión de nodos

Las organizaciones tratan con el gigante Big Data ejecutando sistemas multi-nodales que les permite consultar un nodo específico, descubrir qué información contiene y luego, en función de su nivel de importancia, asignar soporte para retención, recuperación y recuperación de desastres. Al desarrollar más en profundidad un plan de administración de Big Data, es necesario buscar una solución que permita investigar, nodo por nodo, la importancia relativa de los datos, con el fin de asignar los recursos más adecuados en cada momento y según la criticidad de los mismos.

Aprovechando el poder de la nube

cloud-37010_1280La mayoría de las empresas utiliza una combinación de plataformas de almacenamiento y recuperación, que incluyen la nube, instalaciones on-premise e incluso almacenamiento en cinta offsite. La nube es una opción atractiva para mover los sets de Big Data de gran magnitud fuera, debido a la sencillez de escalado y al control de costes. De todas formas, es necesario asegurar que haya un plan sólido de recuperación ante desastres y de continuidad de negocio para los activos residentes en la nube. Esto asegurará el cumplimiento normativo y la efectividad de eDiscovery cuando sea necesario. También, es necesario asegurarse de que la solución de gestión de datos implementada pueda proporcionar una portabilidad adecuada entre la nube y otras plataformas, como backup on-premise.

Controlar la bestia de Big Data es esencial para aprovechar el valor de negocio completo que aporta esta extraordinaria cantidad de datos que las organizaciones están generando y recibiendo cada día. La mayoría de las empresas todavía se encuentra en los preámbulos del juego, ya que se están peleando con los problemas de gestionar, almacenar y proteger estas enormes montañas de información, y de extraer inteligencia de negocio de estos datos. Un buen comienzo es hacer frente a la creciente cantidad de datos desestructurados y asegurarse de que tienen la protección adecuada y la capacidad de eDiscovery, determinando la forma en que la nube encaja con la solución de recuperación de Big Data y asegurando que se cuenta con una solución que permita la portabilidad entre plataformas.

 

Por Bill Wohl, director de comunicación de Commvault a nivel mundial

1 Response

  1. marzo 24, 2017

    […] en hardware tradicional mientras proporciona el rendimiento y escalabilidad que se necesitan para Big Data, repositorios digitales, backup y otras cargas de trabajo digitales de gran envergadura. Con el […]