Transformando datos brutos en oro: el camino hacia la madurez de los datos

Los datos tienen un enorme potencial para transformar el negocio y generar éxito entre los clientes. En el mejor de los casos, si se utilizan con sensatez, son mágicos: identifican eficiencias, aportan productividad y nuevas oportunidades de negocio. Pero la investigación también muestra una curva de aprendizaje para generar grandes resultados, y el 75% de las empresas son inmaduras en el uso de IA/ML para explotar los datos.

Forrester Research nos dice que hasta el 73% de los datos que las empresas recopilan hoy en día no se utilizan para el análisis. ¿Qué lo impide? En el fondo, estamos ante otro cambio cultural. Mientras que la primera fase de utilización de datos se centró en la recopilación de información, estamos aprendiendo que las empresas también deben hacer mejor uso los datos que recopilan para obtener valor real de ellos.

Adoptar el aprendizaje organizativo

Un informe afirma que sólo el 10% de las organizaciones obtienen beneficios significativos de sus inversiones en IA. Las empresas que tienen éxito con los datos parecen dispuestas a cambiar los procesos de la empresa para facilitar el aprendizaje organizativo con IA. Esta visión centrada en los datos requiere una estrategia de datos definida y un cambio cultural para construir la alfabetización de datos. Se trata de humanos y datos trabajando y se enseñándose mutuamente.

"Con el aprendizaje organizacional, las probabilidades de reportar beneficios financieros significativos (a partir de los datos) aumentan hasta el 73%", afirma Boston Consulting Group. Sostiene que las empresas en las que humanos y máquinas aprenden juntos tienen cinco veces más probabilidades de obtener beneficios comerciales relevantes.

Estos beneficios pueden ser tangibles. Por ejemplo, Orange ayudó a Evonik, una empresa de especialidades químicas, a acelerar la innovación optimizando su infraestructura de tratamiento y formación de datos. Ahora desarrolla nuevas fórmulas químicas hasta un 80 % más rápido que antes, al tiempo que mejora la experiencia del cliente.

Enfoque centrado en los datos

Mientras algunas empresas ya hacen un buen uso de sus datos, otras no. "Los datos son intrínsecamente poco inteligentes. Son inútiles si no se sabe cómo utilizarlos, cómo tratarlos. El verdadero valor de los datos reside en los algoritmos", afirma Peter Sondergaard, vicepresidente Senior y director de Investigación de Gartner.

El secreto está en adoptar un enfoque data-centric. El enfoque centrado en los datos diseña negocios en torno a los datos. Construye ecosistemas que obtienen valor para el cliente y el negocio a partir de los datos, asegurándose de que los datos se encuentran en el lugar adecuado para generar información valiosa. Gartner también señala la necesidad de una gobernanza de datos flexible, que permita a las organizaciones responder rápidamente a las oportunidades que ofrecen los datos.

Es importante tener en cuenta cómo hemos llegado hasta aquí. Para la mayoría de las empresas, el proceso de recopilación de datos se inició casi por accidente. Lo que comenzó como un registro de cifras internas de ventas y operaciones pronto se complementó con datos de clientes y creció a medida que se añadían otras pilas de datos a la base. Algunos de los retos que plantea la explotación de datos son la necesidad de mantener la privacidad y seguridad de la información, la falta de interoperabilidad de los datos entre sistemas y las limitaciones de utilizar tecnología heredada.

Gestión y estructuración de datos

Muchos de los datos que se han recopilado aún no se han siquiera ordenado adecuadamente, lo que significa que no pueden analizarse ni compararse con eficacia. IDC predice que, en 2025, el 80% de los datos mundiales no estarán estructurados. Es una enorme cantidad de información desperdiciada, dado que hoy en día sólo se analiza el 0,5% de estos recursos.

Resolver este problema con seres humanos es una opción cara. Los científicos e ingenieros de datos son perfiles muy buscados, por lo que generan importantes costos empresariales, pero gran parte de ese costoso tiempo se dedica a estructurar, gestionar y limpiar la información para hacerla utilizable en lugar de trabajar en convertir esos datos en información útiles.

El aprendizaje automático (AutoML) puede utilizarse para automatizar parte de este trabajo, liberando tiempo para el manejo de datos maduros. Un informe de Snowflake señala varias tendencias que deberían ayudar a las empresas a sacar más provecho de sus datos:

  • Las plataformas de datos consolidadas y las herramientas de ML fáciles de usar están evolucionando para achicar la brecha entre la IA y el análisis
  • Las nubes de datos y los sistemas automatizados de gestión de datos ayudan a optimizar incluso los datos no estructurados
  • La evolución de los feature stores a partir de los cuales los científicos de datos pueden obtener soluciones de ML listas para usar para una implementación rápida y a escala
  • Rápidas mejoras en las herramientas y marcos de ML, incluidos los sistemas automatizados para optimizar los datos existentes
  • La información también puede optimizarse rápidamente utilizando herramientas de reconocimiento de voz, procesamiento del lenguaje natural o reconocimiento de imágenes para crear perspectivas a partir del flujo de datos en bruto

En otras palabras, los científicos de datos están creando herramientas estándar para automatizar algunos aspectos de la gestión de datos. Las ponen a disposición a través de ML feature stores que permiten a los equipos de datos de las empresas seleccionar e implementar los componentes de IA que necesitan para explotar los activos de datos existentes. Este enfoque "componible" permite a las empresas combinar las capacidades de análisis de datos y de IA de varios proveedores en lugar de limitarse a un único proveedor.

Mejorar la gestión de datos con IA

La IA también puede desempeñar un papel importante en la gestión de los datos. Tradicionalmente, el almacenamiento de datos está centralizado, pero las empresas digitales suelen estar basadas en la nube, y el peligro es que la información se reúna en silos no interoperables. Imágenes, vídeos, archivos y toda una serie de datos en formatos de archivo específicos del sector permanecen inactivos en bancos de datos que no aportan ninguna información valiosa para el negocio.

Orange Business cuenta con expertos que trabajan para dar sentido a estas vastas colecciones de activos. Y, por supuesto, convertir estos activos en datos machine-readable que puedan alimentar diferentes sistemas de ML abre la puerta para ofrecer más valor a partir de los datos que posee.

En última instancia, la IA por sí sola no es suficiente. Para desarrollar conocimiento y generar oportunidades basadas en datos, las organizaciones maduras deben centrar la toma de decisiones en datos. Comprender cómo las personas, las máquinas y los datos trabajan juntos para tomar decisiones es una parte importante de esto. Requiere un profundo cambio cultural, flexibilidad, conocimiento de los datos y la capacidad de garantizar que los datos que se introducen en los sistemas son pertinentes, útiles y precisos.

Jon Evans

Jon Evans es un periodista y editor especializado en tecnología. Escribe profesionalmente desde 1994. En la actualidad, se pueden leer sus columnas diarias de opinión en Computerworld AppleHolic. Jon es también editor de tecnología de la revista Calibre Quarterly y editor de noticias de la revista MacFormat, la mayor publicación sobre Mac en el Reino Unido. Está muy interesado en el impacto de la tecnología sobre la chispa creativa en el corazón de la experiencia humana. En 2010 ganó el premio Azbee (American Society of Business Publication Editors) por su trabajo en Computerworld.