Data Minimalism: Una nueva filosofía en la era del Big Data

Las empresas, a nivel global, han avanzado mucho en la recopilación de información y de datos en los últimos dos años, y han aprendido el gran valor que tiene el poder disponer de información objetiva y clasificada para poder tomar mejores decisiones.

Como consecuencia, tanto la cantidad como el valor de los datos se ha disparado. De hecho, el 90% de los datos, a nivel global, han sido creados en los últimos dos años. El aumento de la implementación de dispositivos IoT ha sido una de las razones de ese crecimiento tan grande, ya que cada vez hay más dispositivos conectados que están constantemente recopilando, analizando y compartiendo información. De hecho, se calcula que para finales de 2020 habrá más de 50 millones de dispositivos inteligentes conectados en el mundo.

Durante los próximos 5 años, se espera que el volumen global de los datos disponibles crezca a una tasa del 40% anual alcanzando los 175 zettabytes para 2025. La consideración de los datos como el activo más crítico para una empresa sigue creciendo, pero a pesar de las grandes inversiones realizadas para administrar la entrada, cada vez mayor, de éstos, la gran mayoría de las empresas todavía no pueden recuperar información de valor que les permita aprovechar el potencial creado por todos esos datos.

La principal razón es la cantidad de datos que se acumulan y que crecen constantemente, y esa lucha para recoger la mayor cantidad de datos posible hace que los costes de infraestructura, de almacenamiento, de procesamiento y de análisis aumenten al mismo tiempo que la calidad de esos análisis disminuye. De hecho, la mayoría de las empresas solo analizan el 12% de los datos que tienen.

Esa gran acumulación de datos en almacenes y bases de datos se hace con la idea fija de que cuantos más datos se tengan mejor, pero pasando por alto el hecho de que cuanta más información se recopile más cantidad de ruido, datos redundantes y obsoletos habrá, y más difícil será analizarlos.

Por todo esto, cada vez es más necesaria una buena planificación en el proceso de la recopilación de la información, creando una serie de estrategias para asegurarse de que los datos que se recopilan se vayan a utilizar, que estén limpios y bien administrados, para maximizar el valor de esa información y de los datos como activo estratégico. Esto es uno de los principios básicos del Data Minimalism, Minimalismo de datos o, en algunos contextos también denominado Datos Mínimos Viables o Minimum Viable Data (MVD), una filosofía que las empresas deberían considerar implementar.

Data Minimalism Una nueva filosofía en la era del Big Data

El concepto de Data Minimalism

El Minimalismo de datos llega en un momento en el que las capacidades del Big Data, de la Computación en la nube, del procesamiento de datos y de las herramientas analíticas crecen constantemente; así como en un momento en el que las empresas intentan generar y almacenar todos los datos posibles, tanto si los necesitan como si no.

Se trata de una nueva filosofía que está empezando a calar profundamente en las empresas ya que ayuda a mejorar la toma de decisiones, y también mejora la calidad, así como la sostenibilidad de los sistemas. La clave del Minimalismo de datos está en recopilar únicamente la información que se necesita, para poder maximizar el rendimiento de las inversiones que una empresa hace en todas las herramientas y plataformas analíticas, así como implementar estrategias de recopilación de datos que estén alineadas con los objetivos comerciales.

Con el Minimalismo de datos surge, además, la necesidad del intercambio de datos estandarizados, incluso un mayor uso de API abiertas y nuevas soluciones tecnológicas como la Inteligencia Artificial o las Redes Neuronales Profundas (Deep neural networks). Estas redes neuronales permiten a los proveedores crear mejores ofertas individuales para los clientes utilizando menos datos, o incluso utilizando únicamente los datos que los propios clientes les permiten procesar.

Por otro lado, disponer de un plan de Data Governance será fundamental para llevar a cabo este cambio de estrategia, ya que así se conseguirá cuidar la calidad de los datos obtenidos, se asegurará que todos los datos que se recopilan y se procesan en la organización están dentro de un contexto específico (operativo, regulatorio, etc.), y con un objetivo siempre en mente.

Beneficios del Minimalismo de datos

Implementar el Minimalismo de datos puede ser un desafío, pero al mismo tiempo muy beneficioso para las empresas. La cantidad de datos que se registran cada día hace que las empresas no consigan realmente diferenciar entre los datos que tienen valor y los que no, esto dificulta la toma de decisiones ya que puede que la información que se haya recogido no tenga valor real.

Con el Minimalismo de datos esto no sucedería, ya que primero se establecen unos objetivos y unas estrategias concretas, y a raíz de eso entonces se recopilan y se analizan los datos necesarios. Esta filosofía puede aportar beneficios a las empresas en muchos aspectos:

  • Rentabilidad: Aunque almacenar los datos resulta relativamente económico, los costes computacionales aumentan considerablemente a medida que entran una gran cantidad de datos y se analizan. Estos costes pueden ser directos, como el precio que hay que pagar por tener almacenamiento en la nube; o indirectos, como los costes de energía y tiempo. Ambos se pueden minimizar si se reduce el tamaño del conjunto de datos que entran.
  • Responsabilidad social y ambiental: Por un lado, toda esa cantidad de datos que se transfieren de forma innecesaria crea riesgos en la seguridad y en la privacidad. Por otro lado, cada hora que pasa la CPU procesando datos redundantes constantemente provoca un uso innecesario de energía y, por lo tanto, transmisiones de CO2 también innecesarias.
  • Mayor y mejor calidad del sistema: La creencia generalizada de que la falta de datos es síntoma de que existe un rendimiento bajo del sistema es errónea, ya que los datos redundantes y que no aportan valor pueden corromper el rendimiento del sistema. El Minimalismo de datos elimina esos datos tóxicos de la ecuación y se centra en los datos que únicamente aportan valor y que son beneficiosos para el sistema.
  • Más estabilidad: El uso de grandes cantidades de datos requiere de técnicas de muestreo más sofisticadas, y si bien esos algoritmos, a menudo, muestran un rendimiento bueno y estable, en ocasiones la estabilidad no es la que se desea. Con el Minimalismo de datos no hay riesgos, ya que al recopilar menos cantidad de datos el muestreo también es menor y siempre se logra una mejor estabilidad.

Como se puede ver las ventajas de implementar una filosofía de Minimalismo de datos son importantes, aunque pueden resumirse en lo más importante que es recoger única y exclusivamente los datos que realmente sean necesarios para mitigar el tiempo y el dinero asociados con el mantenimiento de esa información.

De esto ya se hicieron eco los investigadores del Departamento de Energía del Laboratorio Nacional Lawrence Berkeley (Berkeley Lab) que desarrollaron un nuevo enfoque para el Machine-Learning dirigido al análisis de imágenes experimentales. En los métodos convencionales los modelos de ML dependen de decenas o miles de imágenes. Para este nuevo enfoque, se desarrolló una “Red Neuronal de Convolución Densa de Escala Mixta” (Mixed-Scale Dense Convolution Neural Network (MS-D)) que requería menos imágenes para que el sistema aprendiera más rápidamente. El sistema producía imágenes de alta resolución y a una velocidad mayor.

Privacidad de los datos

El Minimalismo de datos también es una respuesta a la privacidad y a la seguridad de los datos, así como al problema de GDPR. Por lo tanto, resulta fundamental para abordar los datos de los clientes, especialmente a la luz de las crecientes regulaciones y preocupación por la privacidad y seguridad de sus datos. Este contexto está creando la necesidad de que las organizaciones recopilen únicamente los datos necesarios para que puedan ofrecer sus productos y servicios, y ser transparentes con sus clientes.

La confianza de los clientes respecto a los datos se está convirtiendo en un tema muy importante y primordial para la mayoría de las empresas, que deben asegurarse de que únicamente recopilan aquellos datos necesarios para diseñar o mejorar sus productos, y de una forma transparente y confiable.

Esto es lo que en los últimos años está marcando la diferencia entre las empresas, ya que, por un lado, los usuarios cada vez quieren tener más control sobre sus datos, y, por otro lado, que las empresas no recojan sus datos de forma masiva, sino que recopilen únicamente los datos que necesiten, y que además especifiquen qué es lo que van a hacer con ellos. Esto da valor a la empresa y hace aumentar la confianza de los usuarios.

Por ejemplo, con una filosofía de Minimalismo de Datos y un sistema basado en Blockchain, los usuarios pueden vender sus propios datos, mantener la propiedad de ellos y decidir si compartirlos con una empresa o no. Por otro lado, la empresa puede solicitar acceso a algunos datos específicos y utilizarlos para crear o mejorar sus servicios.

Conclusiones

Los próximos años estarán dominados por el Minimalismo de datos que permite a las empresas centrar su atención en los datos que realmente necesitan para ofrecer la mejor experiencia a los clientes.

El proporcionar menos cantidad de datos hace que tanto el tiempo como el dinero asociados con el mantenimiento de la información sean menores, ya que cuanta más información se recopile el número de datos para analizar y para mantener también será mayor, aumentando considerablemente el gasto. Por lo tanto, si se reduce el número de datos también se reducen los costes del mantenimiento.

Por ejemplo, uno de los grandes problemas de un proyecto de Inteligencia Empresarial es la preparación de los datos, la cantidad y el estado de éstos hace que esta fase sea la más costosa. Con un enfoque de “menos datos, más eficacia” es más fácil reducir los costes, al mismo tiempo que garantizar la coherencia y reducir el riesgo de exposición de la información

El Minimalismo de datos consigue que se puedan tomar decisiones a bajo coste y muy efectivas utilizando un conjunto pequeño de datos, y esto a menudo no se termina de entender. La creencia de que el Big Data y la recopilación indiscriminatoria de datos puede proporcionar una gran cantidad de información valiosa para una empresa es completamente errónea. Las empresas, en la gran mayoría de las ocasiones, no saben qué hacer con tanta cantidad de datos, y eso provoca que muchas de las decisiones que toman no estén bien fundamentadas.

Con el Minimalismo de Datos las empresas seleccionan adecuadamente los datos que realmente necesitan teniendo siempre un objetivo concreto en mente, gracias a esto las empresas pueden tomar decisiones mejor informadas, centrarse en garantizar que los clientes tenga una buena experiencia, así como ganarse su confianza garantizando la seguridad y la privacidad de sus datos al ofrecer información transparente y clara de qué datos son los que recogen, y qué hacen con ellos.