Retrieval-Augmented Generation (RAG)

Betrouwbaarheid
In het kort

Retrieval-Augmented Generation (RAG) is een AI-techniek waarbij een groot taalmodel (LLM) wordt gekoppeld aan een externe kennisbank. Op deze manier kunnen gebruikers genieten van betere en actuelere antwoorden. Het maakt verbinding met een externe kennsibank en gebruikt diverse bronnen (documenten, databases, etc.). De output vereist overigens wel zorgvuldige monitoring voor nauwkeurigheid.

Wat is Retrieval-Augmented Generation (RAG)?

RAG staat voor Retrieval-Augmented Generation, een AI-ontwikkelingstechniek waarbij een groot taalmodel (LLM) wordt verbonden met een externe kennisbank om de nauwkeurigheid en kwaliteit van zijn antwoorden te verbeteren.

De soorten bronnen waarmee LLM’s verbinding kunnen maken met RAG zijn onder andere documentopslagplaatsen, bestanden, API’s en databases.

Techopedia legt uit wat RAG betekent

Retrieval-Augmented Generation

LLM’s gebruiken Retrieval Augmented Generation om informatie uit een externe kennisbank te kunnen halen. Hierdoor krijgt het model toegang tot actuele, domein-specifieke informatie, waarnaar het kan verwijzen wanneer het in realtime reageert op gebruikersvragen.

Een van de belangrijkste voordelen van deze aanpak is dat de kennis van het model niet beperkt is tot trainingsgegevens met een bepaalde einddatum. De kennisbank kan ook worden bijgewerkt zonder dat het model opnieuw hoeft te worden getraind.

Toegang tot een externe bron vermindert de kans op AI-hallucinaties, waarbij een LLM verifieerbaar onjuiste of onware uitvoer produceert. Tegelijkertijd maakt de duidelijke link naar een kennisbank het voor gebruikers makkelijker om de bronnen van de beweringen van de chatbot te bekijken en te fact-checken.

Nu we een definitie hebben uitgelegd voor het genereren van een retrieval augment, laten we eens kijken hoe het werkt.

Hoe werkt Retrieval-Augmented Generation?

Op een hoog niveau heeft RAG twee hoofdfasen: een ophaalfase en een fase voor het genereren van inhoud.

Hoe werkt Retrieval-Augmented Generation?

Tijdens de ophaalfase maakt een machine learning (ML) algoritme gebruik van natuurlijke taalverwerking (NLP) van de prompt van de gebruiker en gebruikt dit om relevante informatie uit de kennisbank te identificeren.

Deze informatie wordt vervolgens doorgestuurd naar een generatormodel of LLM, dat de prompt van de gebruiker en de gegevens die tijdens de ophaalfase zijn verzameld, gebruikt om een relevant antwoord te genereren dat overeenkomt met de oorspronkelijke prompt-intentie. Het proces is gebaseerd op natuurlijke taalgeneratie (NLG).

Geschiedenis van RAG

De term Retrieval Augmented Generation werd oorspronkelijk bedacht in een onderzoekspaper met de titel Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks, opgesteld door onderzoekers van Facebook AI Research, University College London en New York University.

Deze paper introduceerde het concept van RAG en schetste hoe het gebruikt zou kunnen worden in taalgeneratie taken om meer specifieke en accurate output te produceren.

Dit werk biedt verschillende positieve maatschappelijke voordelen ten opzichte van eerder werk: het feit dat het sterker gegrond is in echte feitelijke kennis (in dit geval Wikipedia) zorgt ervoor dat het minder ‘hallucineert’, met meer feitelijke generaties als resultaat, en biedt meer controle en interpreteerbaarheid,” aldus het paper.

Daarnaast merkte het onderzoek op dat “RAG kan worden gebruikt in een breed scala aan scenario’s met direct voordeel voor de samenleving, bijvoorbeeld door het te begiftigen met een medische index en het open-domein vragen te stellen over dat onderwerp, of door mensen te helpen effectiever te zijn in hun werk”.

RAG architectuur

De RAG architectuur heeft een aantal kerncomponenten die het mogelijk maken om te functioneren. Deze zijn als volgt:

Webserver/ Chatbot

De webserver host de chatbotinterface waar gebruikers kunnen communiceren met het taalmodel. Prompts worden doorgegeven aan een opvraagmodel.

Spoiler title

Deze kennisbank/ gegevensopslagcomponent bevat bestanden, afbeeldingen, video’s, documenten, databases, tabellen en andere ongestructureerde gegevens die het LLM verwerkt om te reageren op gebruikersvragen.

Ophaalmodel

Het ophaalmodel analyseert de vraag van de gebruiker met NLP en zoekt naar relevante informatie in zijn kennisbank, voordat het deze doorstuurt naar het ophaalmodel.

Generatiemodel

Het generatiemodel verwerkt de initi?le vraag van de gebruiker en vervolgens wordt informatie verzameld met het opvraagmodel om een antwoord te genereren dat via de chatbotinterface naar de gebruiker wordt gestuurd.

Gebruik van RAG

RAG biedt veel potenti?le gebruiksmogelijkheden voor bedrijven. Hieronder bekijken we enkele van de belangrijkste:

Gebruik van RAG

  • Documentonderzoek assistenten bouwen: Met behulp van RAG kunnen organisaties chatbots bouwen die werknemers kunnen gebruiken om gegevens op te vragen die zijn opgeslagen in bedrijfsdocumenten. Dit is handig voor het beantwoorden van technische vragen over HR, compliance en beveiligingsonderwerpen.
  • Klantenondersteuning: Bedrijven kunnen RAG ook gebruiken om chatbots voor klantenondersteuning te maken die gebruikers toegang geven tot meer accurate en betrouwbare informatie. Een detailhandelaar kan bijvoorbeeld een chatbot ontwikkelen die vragen van gebruikers over het leverings- en retourbeleid beantwoordt.
  • Inhoud genereren: Marketeers kunnen RAG gebruiken om domeinspecifieke LLM’s te bouwen die content kunnen cre?ren, zoals artikelen, blogposts en nieuwsbrieven, die zijn afgestemd op de behoeften van een bepaalde doelgroep.
  • Marktanalyse: Beslissers kunnen taalmodellen met RAG ook gebruiken om marktanalyserapporten te maken. De gebruiker kan bijvoorbeeld marktgegevens en sectorrapporten toevoegen aan een kennisbank en vervolgens een chatbot vragen om de belangrijkste trends samen te vatten.
  • Begeleiding in de gezondheidszorg: Zorgverleners kunnen RAG gebruiken om chatbots te bouwen die pati?nten toegang kunnen geven tot medische informatie en ondersteuning. Dit kan helpen om 24/7 pati?ntenzorg te bieden wanneer een arts niet beschikbaar is.

RAG Uitdagingen

Hoewel RAG een zeer nuttige benadering is voor AI-ontwikkeling, is het niet perfect. Misschien wel de grootste uitdaging bij het gebruik van RAG is dat een developer een uitgebreide kennisbank moet opbouwen met inhoud van hoge kwaliteit als referentie.

Dit is een moeilijk proces omdat de gegevens zorgvuldig moeten worden gecureerd. Als de kwaliteit van de invoergegevens laag is, zal dit de nauwkeurigheid en betrouwbaarheid van de uitvoer negatief be?nvloeden.

Ook moeten developers nagaan of de kennisbank vooroordelen of vertekeningen bevat die moeten worden aangepakt.

Tot slot, hoewel RAG kan helpen om de betrouwbaarheid te vergroten, kan het de risico’s van AI-hallucinaties niet volledig wegnemen, dus eindgebruikers moeten nog steeds voorzichtig zijn met het vertrouwen van de output.

Voor- en nadelen van Retrieval-Augmented Generation

Als techniek biedt RAG organisaties een breed scala aan voor- en nadelen. Hieronder bekijken we enkele van de belangrijkste voor- en nadelen.

Voordelen

  • Verbinding maken met een domeinspecifieke kennisbank zorgt voor nauwkeuriger informatie ophalen en vermindert verkeerde informatie
  • Het bijwerken van de kennisbank in plaats van het opnieuw trainen van het model bespaart tijd en geld voor ontwikkelaars
  • Gebruikers krijgen toegang tot citaten en referenties, waardoor ze gemakkelijk feiten kunnen controleren
  • Domeinspecifieke outputs voldoen beter aan de gespecialiseerde behoeften van gebruikers

Nadelen

  • Zonder gegevens van hoge kwaliteit kan de uitvoerkwaliteit eronder lijden
  • Het opbouwen van een substanti?le kennisbank vergt veel tijd en organisatie
  • Vertekeningen in trainingsgegevens kunnen de uitvoer be?nvloeden
  • Zelfs met verbeterde nauwkeurigheid blijft er een risico op hallucinaties

Conclusie

RAG is een waardevolle technologie om de kernmogelijkheden van een LLM uit te breiden. Met de juiste kennisbank kan een ontwikkelaar gebruikers toegang geven tot een hoop domein-specifieke kennis.

Dat gezegd hebbende, moeten gebruikers nog steeds proactief de output controleren op hallucinaties en andere fouten om verkeerde informatie te voorkomen.

FAQs

Wat is Retrieval-Augmented Generation in eenvoudige bewoordingen?

Welk type informatie wordt gebruikt in RAG?

Is RAG hetzelfde als generatieve AI?

Wat betekent RAG in LLM’s?

Gerelateerde begrippen

Tim Keary
Editor
Tim Keary
Redacteur

Sinds januari 2017 is Tim Keary een freelance technologieschrijver en verslaggever die zich bezighoudt met bedrijfstechnologie en cyberbeveiliging.