Googles Gemini AI ?r ett allvarligt hot mot ChatGPT – h?r ?r varf?r

Varf?r oss?
Viktiga noteringar

Introduktionen av Google Gemini, en upps?ttning stora spr?kmodeller (LLM) som inneh?ller AlphaGo-inspirerade tekniker, markerar Googles strategiska svar p? ChatGPT. Med multimodala funktioner och potentiell tillg?ng till Googles omfattande egna tr?ningsdata fr?n olika tj?nster, syftar Gemini till att utmana ChatGPT:s dominans inom generativ AI. Detta understryker Googles engagemang f?r AI-innovation och konkurrens p? den snabbt v?xande marknaden f?r generativ AI, som ber?knas vara v?rd 1,3 biljoner dollar ?r 2032.

Lanseringen av ChatGPT i november f?rra ?ret skakade om Google i grunden. Den popul?ra chatboten utgjorde ett s?dant hot mot f?retagets verksamhet att man var tvungen att deklarera en r?d kod och b?rjade investera i att komma ikapp med det generativa AI-t?get. Denna satsning har inte bara resulterat i lanseringen av Google Bard utan ?ven Gemini.

Vad ?r Google Gemini?

Gemini ?r en upps?ttning stora spr?kmodeller (LLM) som utnyttjar tr?ningstekniker fr?n AlphaGo, inklusive f?rst?rkningsinl?rning och tr?ds?kning, som har potential att sl? ut ChatGPT som den mest dominerande generativa AI-l?sningen p? planeten.

Nyheten kommer bara n?gra m?nader efter att Google kombinerade sina AI-laboratorier Brain och DeepMind f?r att skapa ett nytt forskarteam kallat Google DeepMind, och bara n?gra m?nader efter lanseringen av Bard och dess n?sta generations PaLM 2 LLM.

Forskare r?knar med att marknaden f?r generativ AI kommer att vara v?rd 1,3 biljoner USD ?r 2032, s? det ?r tydligt att Google satsar allt p? att investera i omr?det f?r att beh?lla sin position som ledande inom AI-utveckling.

Allt vi hittills vet om Gemini

Medan m?nga f?rv?ntar sig att Google Gemini kommer att sl?ppas h?sten 2023, ?r inte mycket k?nt om modellens kapacitet.

I maj publicerade Sundar Pichai, VD f?r Google och Alphabet, ett blogginl?gg med en ?versikt ?ver LLM och f?rklarade:

“Gemini skapades fr?n grunden f?r att vara multimodal, mycket effektiv n?r det g?ller verktygs- och API-integrationer och byggd f?r att m?jligg?ra framtida innovationer, som minne och planering.”

Pichai noterade ocks? att “?ven om det fortfarande ?r tidigt, ser vi redan imponerande multimodala funktioner som inte setts i tidigare modeller.

“Efter finjustering och rigor?sa s?kerhetstester kommer Gemini att finnas tillg?nglig i olika storlekar och med olika kapacitet, precis som PaLM 2.”

Sedan dess har inte mycket sagts om lanseringen officiellt, f?rutom Google DeepMinds VD Demis Hassabis intervju med Wired d?r han noterade att Gemini kommer att “kombinera n?gra av styrkorna hos system av AlphaGo-typ med de stora modellernas fantastiska spr?kkunskaper.”

Android Police har ocks? h?vdat att en anonym k?lla som ?r involverad i produkten har kommenterat att Gemini kommer att kunna generera text och kontextuella bilder och kommer att tr?nas p? k?llor som YouTube-videotranskriptioner.

Kommer Gemini att ta ?ver kronan fr?n ChatGPT?

En av de st?rsta diskussionerna kring lanseringen av Gemini ?r huruvida den mystiska spr?kmodellen har vad som kr?vs f?r att sl? ut ChatGPT, som i ?r n?dde ?ver 100 miljoner aktiva anv?ndare varje m?nad.

Till en b?rjan anv?nde Google Geminis f?rm?ga att generera text och bilder f?r att skilja den fr?n GPT4, men den 25 september 2023 meddelade OpenAI att anv?ndarna skulle kunna ange r?st- och bildfr?gor i ChatGPT.

Nu n?r OpenAI experimenterar med en multimodal modell och har anslutit ChatGPT till Internet, ?r Googles stora utbud av egenutvecklade tr?ningsdata kanske den mest hotfulla skillnaden mellan de tv?. Google Gemini kan bearbeta data som h?mtats fr?n olika tj?nster, inklusive Google Search, YouTube, Google Books och Google Scholar.

Anv?ndningen av denna propriet?ra data f?r att tr?na Gemini-modellerna kan leda till en tydlig f?rdel i sofistikeringen av de insikter och slutsatser som den kan ta fr?n en dataupps?ttning. Detta g?ller s?rskilt om de tidiga rapporterna om att Gemini tr?nas p? dubbelt s? m?nga tokens som GPT4 ?r korrekta.

Dessutom kan partnerskapet mellan Google DeepMind och Brain-teamen i ?r inte underskattas, eftersom det st?ller OpenAI mot ett team av AI-forskare i v?rldsklass, inklusive Googles medgrundare Sergey Brin och DeepMinds seniora AI-forskare och maskininl?rningsexpert Paul Barham.

Det h?r ?r ett erfaret team som har en djup f?rst?else f?r hur man anv?nder tekniker som f?rst?rkningsinl?rning och tr?ds?kning f?r att skapa AI-program som kan samla in feedback och f?rb?ttra sin probleml?sning ?ver tid, vilket DeepMind-teamet anv?nde f?r att l?ra AlphaGo att besegra en Go-v?rldsm?stare 2016.

AI:s kapprustning

Geminis kombination av multimodala f?rm?gor, anv?ndning av f?rst?rkningsinl?rning, text- och bildgenereringsf?rm?ga och Googles egen data ?r alla de ingredienser som Gemini beh?ver f?r att ?vertr?ffa GPT-4.

Utbildningsdata ?r den viktigaste skillnaden, trots allt kommer den organisation som vinner LLMs kapprustning till stor del att avg?ras baserat p? vem som tr?nar sina modeller p? den st?rsta och rikaste dataupps?ttningen.

Med OpenAI som enligt uppgift arbetar p? en ny n?sta generations multimodal LLM som heter Gobi kan vi dock inte avskriva den generativa AI-j?tten ?nnu. Fr?gan ?r nu vem som ?r b?st p? multimodal AI?

Relaterade termer

Relaterade nyheter

Tim Keary
Technology Specialist
Tim Keary
Teknikexpert

Sedan januari 2017 har Tim Keary varit en oberoende teknikskribent och reporter som bevakar f?retagsteknik och cybers?kerhet.

',a='';if(l){t=t.replace('data-lazy-','');t=t.replace('loading="lazy"','');t=t.replace(/