Lo único que necesita un modelo de inteligencia artificial (IA) que funcione correctamente son datos. Muchísimos datos. Pero en lugar de arrojar los datos en su dirección como una manguera de incendios, el enfoque más eficaz es optimizar la alimentación de datos a través de una amplia variedad de métodos de investigación, curación y análisis.
Esto requiere no sólo una infraestructura importante, sino un software de gestión muy sofisticado. Estos elementos, a su vez, se mezclan en una arquitectura de tejido capaz de extraer datos de múltiples fuentes y dispersarlos en múltiples direcciones a la vez para proporcionar al modelo de IA la perspectiva más amplia posible.
Se trata de un trabajo hercúleo. Una que normalmente exigiría un vasto equipo de científicos de datos y gestores de recursos informáticos. Sin embargo, gracias a las tecnologías emergentes, muchos de estos procesos pueden ahora automatizarse, y la fuerza motriz de esta automatización no es otra que la IA.
Apoyo mutuo
Esta relación simbiótica entre la IA y los tejidos de datos no es casual. De hecho, ha sido cuidadosamente dise?ada para complementar las capacidades de ambas tecnologías y formar un todo que funcione mejor. Como se?aló recientemente Analytics Insight, los tejidos de datos proporcionan el tipo de datos oportunos, precisos y no sesgados que impulsan los resultados positivos de los algoritmos inteligentes, mientras que algunos de esos algoritmos permiten que los tejidos funcionen a la velocidad y escala necesarias para apoyar la formación y las operaciones de IA.
Los tejidos de datos actuales ofrecen una amplia gama de ventajas sobre las arquitecturas de red más tradicionales cuando se trata de apoyar modelos de IA. Por un lado, permiten el acceso a los datos en tiempo real desde diversas fuentes, independientemente de su ubicación. También acaban con las arquitecturas basadas en silos que existen en la mayoría de las organizaciones y que sólo sirven para impedir que surjan versiones completas de la verdad. Y los tejidos no sólo son escalables, sino también muy ágiles, lo que les permite pivotar ante necesidades y entornos cambiantes.
En otras palabras, un tejido de datos proporciona una visión holística de todos los activos de información de que dispone una organización determinada, tanto internos como externos, públicos y privados.
Douglas Vargo, vicepresidente de servicios de consultoría de CGI, afirma que lo consigue aportando tres funcionalidades básicas al proceso de formación de IA y al entorno de datos más amplio que impulsa los modelos de negocio modernos:
- Ingestión de datos: Prioriza los datos en formatos por lotes, en tiempo real y basados en eventos para el análisis y la toma de decisiones;
- Almacenamiento de datos: Organiza los datos en niveles de información en bruto, transformada y curada para soportar un bajo coste y una alta fiabilidad;
- Indexación y catalogación: Garantiza la visibilidad y la capacidad de búsqueda para un descubrimiento y una recuperación más rápidos.
Una vez establecidas estas capacidades, pueden utilizarse para crear modelos de IA que agilicen el intercambio de datos, la colaboración y la innovación para aplicaciones de usuario avanzadas y plataformas y bibliotecas de IA de código abierto.
Un tejido no es una malla
Pero hay que tener cuidado de no confundir un tejido de datos con una malla de datos, dice Daniel Comino, director de marketing digital del desarrollador de la plataforma de gestión de datos Denodo.
Malla de datos | Un enfoque cultural/organizativo de la propiedad de los datos en la empresa |
Tejido de datos | La construcción arquitectónica y tecnológica real que permite técnicas de gestión de datos más avanzadas. |
En una malla de datos, éstos se organizan en función de ámbitos empresariales clave, como ventas, marketing y atención al cliente. Esto permite a los equipos individuales apropiarse de sus datos y utilizarlos para lograr los mejores resultados para sus áreas de responsabilidad.
Un tejido integra datos procedentes de múltiples fuentes y, a continuación, se basa en la automatización para reducir la complejidad y garantizar un amplio acceso y una estricta seguridad.
No hay ninguna razón por la que las mallas y los tejidos no puedan trabajar juntos, por supuesto, pero en términos de funcionalidad de IA, es el tejido de datos el que produce un mayor rendimiento.
Cómo la gobernanza del tejido de datos permite una IA fiable y digna de confianza
Una de las formas de conseguirlo es creando modelos de IA fiables y dignos de confianza, según John J. Thomas, vicepresidente e ingeniero distinguido de IBM Expert Labs. Con una arquitectura de tejido, las organizaciones pueden aplicar fácilmente amplias políticas relativas al acceso y uso de los datos, al tiempo que establecen barandillas para evitar que los modelos de IA se desvíen con los sesgos naturales que existen en todos los conjuntos de datos.
Este tipo de gobernanza es crucial para prevenir lo que muchos empiezan a temer de la IA: algoritmos desbocados que generen consecuencias catastróficas para las empresas y, tal vez, para toda la raza humana. Al minimizar los problemas de integración y permitir el acceso basado en reglas, la gobernanza de la IA se vuelve escalable y automatizada para producir procesos coherentes y repetibles con un funcionamiento interno transparente, trazable y, en última instancia, responsable.
En este marco, los resultados negativos pueden identificarse rápidamente y corregirse antes de que los da?os alcancen una fase crítica.
Todo gira en torno a la relación simbiótica entre la IA, el tejido de datos y la experiencia humana
Si bien es cierto que la IA es propensa a realizar gran parte del trabajo pesado cuando se trata de construir y mantener el tejido de datos, esto también requerirá una cantidad sustancial de mano de obra humana.
Como ocurre con la mayoría de las aplicaciones, se espera que la IA se encargue del trabajo pesado, mientras que expertos cualificados asumirán las funciones creativas relacionadas con el desarrollo arquitectónico, la supervisión y la planificación estratégica.
Al mismo tiempo, el entramado desmiente la idea de que la IA andará suelta por la empresa, encontrando y corrigiendo todo lo que considere insuficiente.
El tejido es tanto el campo de juego como las reglas bajo las que se juega, y necesita un equipo de tierra vibrante y experimentado para garantizar que tanto los jugadores como los espectadores estén seguros y el resultado sea justo.
De este modo, podemos considerar el emergente ecosistema de datos inteligentes como una forma de simbiosis a tres bandas en la que la IA, el tejido de datos y el elemento humano trabajan juntos en beneficio mutuo.