Conoce Atico34 - Solicita presupuesto
CiberseguridadLOPDGDD & RGPD

Dark Data ¿Qué es? ¿Supone un riesgo para la gestión de datos en la empresa?

Organizaciones de todo tipo recopilan datos continuamente, no es un secreto para nadie que en la era de Internet y la información, los datos se han convertido en uno de los activos más valiosos para las empresas. Sin embargo, esta recopilación continua de datos genera también el denominado Dark Data, pero ¿qué son estos datos oscuros?, ¿y qué entrañan para las empresas? Vamos a explicarlo en este artículo

¿Qué es el dark data?

El dark data son aquellos datos recopilados por las organizaciones que no se emplean para nada, simplemente se almacenan, sin darles ningún uso o siquiera analizarlos.

Para una definición más «técnica», tenemos la de Gartner, que define el dark data como «los activos de información que las compañías procesan y almacenan durante sus actividades de negocio, pero que no consiguen utilizar para otros propósitos». En otras palabras, los datos se recogen y almacenan, pero no pueden usarse ni aportan valor alguno.

El dark data está actualmente estrechamente relacionado con el Big Data y con su gestión; incluso con la presencia de un big data architect preocupado en la empresa, cuando continuamente se están recabando datos, es imposible procesarlos y analizarlos a tiempo para que resulten útiles.

Es importante entender que la definición de dato es aquella unidad mínima en la que se puede descomponer la información o, mejor dicho, los datos son los elementos que, una vez puestos en relación, estructurados y analizados, ofrecen información relevante para quien los gestiona.

Cuando una organización acumula datos oscuros, no está obteniendo ninguna información relevante, porque no estos datos ni están estructurados ni han sido analizados, simplemente se «ocultan» en el data center, irrelevantes y sin aportar ningún tipo de valor a la organización.

El dark data se puede diferenciar en tres tipos (cuatro en realidad, pero el último tipo carece interés en relación con la protección de datos, puesto que hace referencia a datos que no se han recopilado):

  • Datos conocidos, pero no utilizados
  • Datos conocidos, pero sin organizar o estructurar
  • Datos desconocidos (están almacenados, pero la organización no sabe que los posee)

Lo más «curioso» de todo, es que el dark data forma la mayor cantidad de datos almacenados por una organización; la mayoría de las fuentes, utilizando la analogía del iceberg, estiman que los datos conocidos y visibles para las organizaciones (la punta del iceberg) están en torno al 10-15%, mientras que el resto (la masa sumergida del iceberg), 85-90% correspondería a datos oscuros.

Qué es el dark data

¿Cómo se crea el dark data?

El dark data está formado por diferentes tipos de datos personales y de otras categorías, que se crean mediante la recopilación de los mismos a través de diferentes herramientas informáticas. Debemos tener en cuenta que actualmente nuestra relación con Internet y las nuevas tecnologías y nuestra interacción con ellas, generan ingentes cantidades de datos, ya sea como clientes o público objetivo de las compañías o como empleados de las mismas.

El dark data se crea a través de los procesos empresariales habituales, solo que en vez de estructurarlo y analizarlo, queda olvidado en el almacén de datos, en ocasiones, porque no se puede acceder a ellos (pérdida de contraseñas, extensiones de archivo obsoletas, etc.), en otras ocasiones porque se recopila tal cantidad de datos, que es imposible analizarlos todos. E incluso puede haber datos de los que todavía no se dispone de las herramientas para poder analizarlos y extraer información relevante.

Los datos incompletos o desactualizados también forman parte del dark data, así como de aquellos datos recabados solo para dar cumplimiento a determinadas normativas, como la normativa para el cloud computing en materia de protección de datos.

Ejemplos de dark data

Para ilustrar qué datos son considerados dark data, aquí dejamos unos ejemplos:

  • Los emails de antiguos empleados
  • Los archivos de registro web
  • Estadísticas de visitas a nuestro sitio online
  • Grabaciones de cámaras de seguridad
  • Interacciones en redes sociales
  • Archivos de audio de llamadas telefónicas
  • Historiales de actividad…

¿Qué problemas puede suponer el dark data para la empresa?

Uno podría pensar que algo está almacenado y medio olvidado, pocos problemas puede generar, sin embargo, el dark data implica una serie de problemas para las empresas.

Para empezar, el coste innecesario que implica el espacio de almacenamiento de esos datos oscuros. Si una organización sigue recabando datos y más datos, de los que apenas usa y explota un 10%, tiene un 90% desaprovechado y ocupando un espacio innecesario, que además solo genera gastos y no aporta realmente beneficios. Este problema ha aumentado con las posibilidades «infinitas» de espacio de almacenamiento en la nube.

Otro de sus problemas es que dentro del dark data puede haber datos útiles, a los que es muy difícil, sino imposible acceder, porque, como dijimos, están desestructurados y es muy difícil encontrar información concreta dentro del dark data (es la proverbial aguja en el pajar, pero en un pajar de dimensiones casi infinitas). No hallar o contar con la información útil, puede llevar a usar información insuficiente o errónea, que afectará en los procesos de toma de decisión de las organizaciones (uno de los usos más habituales del big data y su análisis).

Si no se sabe qué datos se poseen, se corre el riesgo de no protegerlos de la manera debida y exigida por la ley, lo que nos lleva a nuestro siguiente punto y problema.

El dark data y la protección de datos

La normativa de protección de datos es muy clara respecto a qué medidas deben tomarse e implantarse para garantizar la seguridad de los datos personales y de sus titulares, tal y como explicamos en nuestro artículo sobre big data y protección de datos. Pero si una organización desconoce qué datos posee, no puede determinar qué medidas de seguridad son las más adecuadas para protegerlos.

Dentro de ese iceberg sumergido que es el dark data, podría haber datos sensibles o de categorías especiales, información confidencial o secreta, que podría caer en malas manos si la organización sufre un ciberataque. Imaginemos a un hacker que es capaz de pasar días recorriendo los sistemas y redes de una organización y que se encuentra con todo un montón de datos desprotegidos, que una vez puestos en relación, pueden servir para extraer información sensible de los usuarios o clientes.

¿Tiene utilidad el dark data?

Si se organizan, estructuran y analizan, los datos oscuros pueden resultar útiles a las organizaciones, de la misma forma que los datos conocidos lo son. El dark data puede complementar información que hasta entonces parecía incompleta o insuficiente, por ejemplo, ayudando así a tomar mejores decisiones.

Sin embargo, cuanto más dark data hay acumulado, más difícil resultará gestionarlo y conseguir que resulte útil.

¿Cómo gestionar el dark data?

Para conseguir gestionar el dark data y poder convertirlo en datos útiles y relevantes, es recomendable dedicar tiempo y recursos a su estructuración y análisis, empleando las herramientas más adecuadas para ello (como por ejemplo, el empleo de IA).

Una buena forma de evitar esta acumulación de datos olvidados, es realizar auditorías periódicas de los datos que se han ido almacenando, para poder categorizarlos y clasificarlos, de manera que resulte más sencilla su localización, además de marcar aquellos que puedan seguir resultado útiles y aquellos que han quedado obsoletos (por ejemplo, los datos de geolocalización suelen ser más útiles en tiempo real).

Para evitar problemas de seguridad, es importante fijar protocolos de cifrado para todas las bases y almacenes de datos, de manera que hasta el dark data quede encriptado. De esta forma, es más difícil que una filtración de datos pueda causar graves daños a la compañía.

En definitiva, toda compañía que recabe datos, acaba acumulando dark data; ser consciente de ello y empezar a gestionarlo, podría ahorrarnos problemas de seguridad en el futuro, ayudarnos con el cumplimiento normativo e incluso aportar valor para la empresa en algún momento.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio está protegido por reCAPTCHA y se aplican la política de privacidad y los términos de servicio de Google.

Las siguientes reglas del RGPD deben leerse y aceptarse:
Este formulario recopila tu nombre, correo electrónico y e contenido para que podamos realizar un seguimiento de los comentarios dejados en la web. Para más información revisa nuestra política de privacidad, donde encontrarás más información sobre dónde, cómo y por qué almacenamos tus datos.