En el ámbito de la tecnología, el eterno enfrentamiento entre los modelos de código abierto y los propietarios está siendo testigo de un nuevo campo de batalla con la IA generativa.
A medida que las empresas exploran activamente soluciones de IA generativa, con un significativo 19% de ellas ya en fases piloto o de producción, se ha vuelto fundamental elegir entre modelos de código abierto y propietarios.
En este artículo, nos adentramos en estos modelos, explorando sus méritos y deméritos.
El debate en curso: Código abierto frente a modelos propietarios
El debate entre los modelos de desarrollo de código abierto y propietario no es nuevo; ha sido una piedra angular de la industria del software durante décadas. Se originó a principios de los 80, cuando Richard Stallman inició el movimiento de la Licencia Pública General GNU (GPL) para contrarrestar el creciente dominio del software privativo.
Este movimiento cobró impulso con la publicación del núcleo Linux en 1991, que ofrecía una alternativa al sistema operativo privativo Unix.
Hoy en día, esta competencia ha evolucionado y se ha ampliado, abarcando diversas categorías de software como navegadores web, aplicaciones de productividad, bases de datos, servidores web, servicios de computación en la nube, sistemas operativos móviles y herramientas de desarrollo.
La elección entre software de código abierto y propietario depende de las necesidades, objetivos y preferencias individuales.
El software propietario o patentado suele ofrecer funciones especializadas, soporte dedicado e integración perfecta con otros productos del mismo proveedor. Por el contrario, los modelos de código abierto ofrecen accesibilidad, personalización, transparencia y el poder del desarrollo colaborativo.
Muchos sostienen que el código abierto destaca en el mercado gracias a estas ventajas.
La nueva frontera: IA generativa
El software de código abierto frente al propietario tiene ahora un nuevo frente de batalla: la IA generativa.
Aunque pueda parecer una batalla convencional, hay una diferencia fundamental que la distingue. A diferencia del movimiento de código abierto, en el que recursos como la inversión, la capacidad intelectual y el esfuerzo pueden obtenerse mediante crowdsourcing, la IA generativa exige datos y energía considerables.
Ambos recursos son cada vez más caros y, en su mayoría, están fuera del alcance de quienes contribuyen al código abierto.
En consecuencia, crear un modelo de IA generativa de código abierto no es totalmente gratuito. Puede conllevar gastos de etiquetado de datos y costes de infraestructura para entrenar los modelos de IA.
Sin embargo, es importante se?alar que esta inversión es mucho más rentable a largo plazo que la IA generativa patentada, que suele conllevar el pago de licencias.
La transparencia desempe?a un papel vital en el contexto de los modelos de IA generativa de código abierto, especialmente dada la naturaleza de caja negra de estos sistemas de IA, sobre todo cuando se utilizan en aplicaciones críticas.
Además, optimizar eficazmente una IA generativa de código abierto puede reducir la latencia y mejorar el rendimiento. Por otra parte, disponer del código fuente internamente ofrece a las organizaciones un control total sobre sus datos, garantizando que la información sensible permanezca dentro de su red y mitigando el riesgo de filtración de datos o acceso no autorizado.
Además, los modelos de IA generativa de código abierto preentrenados pueden ajustarse para adaptarse a los requisitos específicos de una organización, y la IA también puede entrenarse en conjuntos de datos específicos. En cambio, realizar estos cambios o especificaciones en una IA generativa patentada suele implicar trabajar con un proveedor, lo que conlleva gastos financieros y de tiempo.
En contraste con el código abierto, la IA generativa patentada ofrece un nivel de fiabilidad derivado del desarrollo y mantenimiento dedicados por parte de un equipo especializado de expertos. Estos modelos no son el resultado de contribuciones fortuitas de la comunidad, sino que son meticulosamente elaborados y puestos a punto por un selecto grupo de personas con un profundo conocimiento de los entresijos de la IA.
Además, las organizaciones que optan por la IA generativa propia se benefician de un apoyo a medida y de conocimientos especializados. Esto se complementa con la presencia de acuerdos de nivel de servicio (SLA) y asistencia técnica, que ofrecen una tranquilizadora capa de seguridad, especialmente para las operaciones de misión crítica.
La facilidad de integración en la infraestructura existente y las rigurosas medidas de control de calidad hacen que las soluciones de IA propietaria sean ideales para empresas de cualquier escala. En esencia, la IA generativa patentada presenta a las empresas una solución fiable y totalmente respaldada.
Panorama de la IA generativa: Modelos de IA de código abierto frente a modelos de IA patentados
En el mundo de la IA generativa de código abierto, LLaMa2 de Meta es un destacado modelo lingüístico conocido por su adaptabilidad y versatilidad.
Se puede acceder fácilmente a este modelo, que cuenta con una impresionante gama de parámetros de 7.000 a 70.000 millones, a través de plataformas como Watsonx.ai y Hugging Face. Por su parte, Bloom, de BigScience, es un modelo multilingüe desarrollado de forma transparente por una amplia comunidad de investigadores en IA, lo que pone de relieve la importancia de la apertura y la colaboración en este campo.
El Falcon LLM del Instituto de Innovación Tecnológica es un contendiente notable que ofrece notables capacidades de resolución de problemas consumiendo menos recursos.
Además, modelos perfeccionados como Vicuna y Alpaca, que se basan en la arquitectura LLaMa, han conseguido ofrecer niveles de rendimiento equiparables a los de GPT-4.
Los modelos de IA generativa de código abierto han encontrado una amplia aplicación en diversos sectores. La colaboración entre IBM y la NASA dio lugar al desarrollo de un modelo de lenguaje de código abierto (LLM) entrenado con datos geoespaciales, lo que contribuyó a iniciativas relacionadas con el cambio climático.
Las organizaciones sanitarias han aprovechado la IA generativa de código abierto para aplicaciones que abarcan diagnósticos, optimización de tratamientos, gestión de datos de pacientes e iniciativas de salud pública. El sector financiero también ha adoptado su propio LLM de código abierto, FinGPT, para diversas aplicaciones financieras.
En el mundo de la IA generativa patentada, gigantes del sector como OpenAI y Google están marcando el ritmo. El GPT-4 de OpenAI, con aproximadamente 1,8 billones de parámetros, demuestra una excepcional capacidad de resolución de problemas y generación de contenidos. Bart, de Google, con 137.000 millones de parámetros, interpreta y responde a consultas humanas con rapidez y precisión.
Estas herramientas propias de IA generativa encuentran aplicaciones en diversas organizaciones. Duolingo presentó Duolino Max, que incorpora el procesamiento del lenguaje natural de GPT-4. Khanmigo, de Khan Academy, es una herramienta de chat con IA potenciada por GPT-4, y el servicio de chat Bing de Microsoft aprovecha GPT-4 para mejorar la búsqueda y mantener conversaciones en lenguaje natural.
El dilema: código abierto frente a IA generativa patentada
El debate en torno a los modelos de IA generativa de código abierto ha aumentado, sobre todo teniendo en cuenta un incidente reciente en el que unos investigadores pidieron a un sistema de IA generativa patentado llamado MegaSyn que creara moléculas tóxicas, con el resultado de que algunas se parecían a conocidos agentes nerviosos.
Esto plantea una cuestión candente: los que se oponen a la IA generativa de código abierto creen que debería bloquearse para evitar usos indebidos, mientras que los defensores del código abierto argumentan que los modelos propietarios concentran demasiado poder en manos de unos pocos elegidos.
Conclusión
La IA generativa está transformando las industrias, pero elegir entre modelos de código abierto y propietarios es crucial. El código abierto aboga por la personalización y la transparencia, mientras que el propietario ofrece fiabilidad y asistencia.
La IA generativa de código abierto exige recursos, pero proporciona control y rentabilidad. Los modelos propietarios ofrecen conocimientos especializados y seguridad.