La intersección entre tecnología y finanzas tiene una rica historia, que se remonta a la calculadora básica. Con el tiempo, esta relación ha evolucionado hasta lo que hoy llamamos FinTech, donde la tecnología desempe?a un papel fundamental en la racionalización de las operaciones financieras, el aumento de la eficiencia y la mejora de los procesos de toma de decisiones.
Sin embargo, en el panorama financiero digital actual, el sector depende de una amplia gama de fuentes de información, principalmente en forma de datos de texto. Esto puede incluir noticias financieras, publicaciones en redes sociales, archivos de empresas y mucho más.
Estos datos textuales pueden aprovecharse para multitud de aplicaciones financieras, como el análisis de opiniones, la predicción del precio de los activos, la orientación de las inversiones, la detección del fraude y la previsión de la inflación.
La aplicación de la inteligencia artificial (IA) ha sido fundamental para analizar estos datos. Sin embargo, debido a la naturaleza única de los datos financieros y a la escasez de grandes conjuntos de datos públicos anotados, la IA se enfrenta a importantes retos para destacar en todas estas aplicaciones.
Cuando los LLM se encuentran con los mercados financieros
Mientras tanto, los grandes modelos lingüísticos (LLM) basados en IA, entrenados en grandes volúmenes de texto web, han demostrado sistemáticamente su notable competencia en un amplio espectro de tareas de procesamiento del lenguaje natural (PLN). Estos LLM muestran una capacidad extraordinaria para funciones como la comprensión lectora, la respuesta a preguntas abiertas y la clasificación de textos, ofreciendo resultados con una precisión notable.
Lo que distingue a estos modelos es su capacidad para mostrar un comportamiento emergente. Esta capacidad única les permite adquirir rápidamente destreza en tareas nuevas con sólo un pu?ado de ejemplos, lo que amplía sustancialmente la gama de funciones que pueden manejar con destreza. Esto no sólo amplía su versatilidad, sino que también reduce significativamente la demanda de una extensa anotación de datos.
El salto de Bloomberg a los LLM
Consciente del potencial de los LLM en el sector financiero, Bloomberg, una potencia económica mundial, presentó su propio LLM, BloombergGPT. Con la asombrosa cifra de 50.000 millones de parámetros y entrenado con un amplio conjunto de datos de 700.000 millones de fichas, este modelo combina datos propios de Bloomberg con fuentes públicas.
En rigurosas pruebas comparativas, BloombergGPT ha demostrado su superioridad en diversas tareas específicas de las finanzas. El modelo posee dos características clave útiles para los usuarios de Bloomberg: la capacidad de generar Bloomberg Query Language (BQL) y hacer sugerencias de titulares de noticias.
A pesar de su notable rendimiento, BloombergGPT tiene ciertas limitaciones. Se trata de un modelo propietario, lo que significa que el acceso está restringido y la transparencia en cuanto a la recogida de datos, los protocolos de formación y el propio modelo es limitada.
La necesidad de alternativas de código abierto
Estas limitaciones inherentes a los modelos propietarios subrayan la importancia de las alternativas de código abierto adaptadas al sector financiero. Los modelos de lenguaje financiero de código abierto (FinLLM) ofrecen su propio conjunto de ventajas únicas, logrando un equilibrio:
1. Acceso universal: Los FinLLM de código abierto están abiertos a muchos usuarios, adhiriéndose al principio de democratización de los modelos de lenguaje financiero. No mantienen el poder y el conocimiento en manos de unos pocos, sino que lo hacen accesible a muchos.
2. Transparencia y confianza: Los modelos de código abierto son transparentes en cuanto a su código base, lo que fomenta la confianza. En un sector tan crítico como el financiero, la transparencia es esencial para las partes interesadas.
3. Aceleración de la investigación y el desarrollo: La naturaleza de código abierto de estos modelos impulsa el progreso en la investigación y el desarrollo de la IA. Permite a los investigadores construir sobre modelos existentes, fomentando la innovación y el descubrimiento científico.
4. Creación de comunidad: Los modelos de código abierto promueven una comunidad global de colaboradores. Esto garantiza la durabilidad y eficacia de los modelos a largo plazo.
FinGPT: Un marco para desarrollar FinLLM de código abierto
Recientemente, investigadores de las universidades de Columbia y Nueva York han presentado una posible solución: un marco de código abierto denominado FinGPT. Este marco aborda el desarrollo de FinLLM, ofreciendo un equilibrio entre modelos propietarios y de código abierto. FinGPT consta de cuatro componentes clave
1.? Capa de fuente de datos: Organiza la recopilación de datos financieros exhaustivos de diversas fuentes en línea, garantizando una cobertura completa del mercado. Las fuentes de recopilación de datos incluyen noticias financieras de medios reputados como Reuters y CNBC, plataformas sociales como Twitter y Facebook, sitios web de autoridades reguladoras monetarias como la SEC en Estados Unidos, y las principales bolsas de valores como NYSE, NASDAQ y la Bolsa de Shanghái.
2. Capa de ingeniería de datos: Esta capa procesa los datos NLP en tiempo real para filtrar el ruido y resaltar la información relevante, abordando los retos que plantean los datos financieros.
3. Capa LLMs: Esta capa es una pasarela para acceder a modelos lingüísticos preentrenados a través de APIs. Además, FinGPT ofrece modelos adaptables, lo que permite a los usuarios ajustarlos con sus propios datos y adaptarlos a aplicaciones financieras específicas.
Dentro de esta capa, los usuarios también tienen la flexibilidad de ajustar los LLM utilizando diversas técnicas, como el ajuste mediante el aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). El énfasis principal dentro de esta capa es mantener la agilidad, asegurando que el modelo permanezca actualizado y relevante en el siempre cambiante panorama de los datos financieros.
4. Capa de aplicación: El componente final demuestra las aplicaciones prácticas de FinGPT, ofreciendo tutoriales prácticos y demostraciones para diversas tareas financieras, desde servicios de asesoramiento robotizado hasta el comercio cuantitativo y el desarrollo de código bajo.
Aunque los FinLLM de código abierto pueden abordar los retos a los que se enfrentan los FinLLM propietarios, se enfrentan a problemas de fiabilidad derivados de la falta de desarrollo y mantenimiento dedicados por parte de un equipo especializado de expertos. Estos modelos son el resultado de contribuciones fortuitas de la comunidad, en lugar de haber sido meticulosamente elaborados y puestos a punto por un grupo selecto de personas con un profundo conocimiento de los entresijos de la IA. Además, las organizaciones que optan por el código abierto carecen de soporte y mantenimiento a medida.
Aplicaciones de las FinLLM
Las FinLLM tienen una amplia gama de aplicaciones potenciales, entre las que se incluyen:
1. Asesor personalizado: Las FinLLM pueden ofrecer asesoramiento financiero a medida, reduciendo la necesidad de consultas periódicas en persona.
2. Análisis del sentimiento financiero: Los FinLLM pueden evaluar los sentimientos a través de varias plataformas financieras para proporcionar una guía de inversión perspicaz.
3. Creación de contenidos: Los FinLLM pueden generar contenido financiero de alta calidad para sitios web y canales de medios sociales, lo que permite a las empresas llegar a un público más amplio de forma más rápida y sencilla.
4. Herramientas educativas: Los FinLLM de código abierto pueden servir como valiosas herramientas educativas, permitiendo a estudiantes e investigadores profundizar directamente en las complejidades de los modelos de lenguaje financiero, facilitando el aprendizaje.
5. Análisis de datos financieros: Los FinLLM pueden democratizar el análisis de datos financieros, capacitando a los usuarios para realizar intrincadas tareas de análisis de datos de forma sencilla.
6. Traducción de formatos de datos: Las FinLLM podrían facilitar la traducción de patrones de datos complejos. BloombergGPT demuestra un ejemplo de esta traducción generando Bloomberg Query Language (BQL) a partir de lenguaje natural.
7. Chatbots con FinLLM: Estos pueden participar e interactuar con los clientes 24/7 y mejorar las conversaciones en línea.
Conclusión
El viaje del sector financiero hacia el mundo de los grandes modelos lingüísticos es prometedor, con modelos propietarios y de código abierto que ofrecen cada uno sus puntos fuertes y desafíos únicos. No cabe duda de que el futuro depara más innovaciones en el campo de los FinLLM, que tenderán puentes entre la tecnología y las finanzas.
Ya sean propios o de código abierto, estos modelos tienen el potencial de revolucionar la forma en que interactuamos con los datos financieros, ofreciendo información, orientación y apoyo de una forma nunca vista. La clave está en navegar por este panorama, sopesar los pros y los contras y tomar decisiones informadas que se adapten a las necesidades específicas de las organizaciones financieras y las partes interesadas.
Mientras seguimos explorando esta apasionante frontera, podemos esperar una transformación del sector financiero impulsada por el poder de los modelos lingüísticos y la inteligencia artificial.