A Google nemrégiben mutatta be az új multmodális AI-ját, a Google Geminit, amely a Google szerint az Openai GPT-4-es modelljénél jobban teljesít a legtöbb esetben. Lássuk, mit is érdemes tudni a Google Geminiről, és mi várható tőle?

Aki csak egy kicsit is figyelt az elmúlt években, láthatta, hogy a ChatGPT mekkora népszerűségre tett szert, és hogy az AI egyre nagyobb teret hódít manapság. Várható volt, hogy kihívója akad, és a Google szerint meg is érkezett, méghozzá a Google Gemini személyében. A Google állítása szerint a Gemini 32 esetből 30-ben teljesít jobban az Openai GPT-4-es modelljénél, emellett pedig egy olyan modell, amely az emberi szakértők teljesítményét meghaladó szinten képes működni.

Természetesen várható volt, hogy a Google is kifejleszti a saját mesterséges intelligenciáját, érdekes kérdés persze, hogy valóban jobban teljesít-e, mint az GPT-4. Lássuk, mit is érdemes tudni alapvetőn a Google Geminiről, és hogy mi várható tőle a GPT-4 árnyékában.

Amit a Google Geminiről tudni érdemes

A Google Gemini multimodális, ami azt jelenti, hogy nemcsak szöveges tartalmak értelmezésére és generálására képes, hanem hangi, képi és videós tartalmakéra is. Ennek értelmében, a szöveges tartalom generálása mellett képeket, sőt videót is készíthetünk majd vele. A szöveges értelmezése meglehetősen nagy, ugyanis 32.000 kontextus-ablakot használ, tehát nagyobb szövegek kaphat, sőt, beszélgetés előzményeire is „emlékezhet”.

A Google azt is bejelentette, hogy a Gemini három léptékben fog működni: Ultra, Pro és Nano. Az Ultra lesz a csúcsmodell, vagyis a legerősebb, a három közül, viszont ennek a modellnek a finomhangolása még folyamatban van. A Gemini Pro a közepes méretű modell, ami egy asztalai gépen is működhet majd, a Nano pedig akár mobileszközökön, mint a tablet vagy az okostelefon. A Gemini Nano és Pro a Google különböző szolgáltatásaiba, vagy az android operációs rendszerbbe is integrálható lesz, de ez egyelőre még csak találgatás, hiszen gyakorlati tapasztalatokról még nem számolhatunk be.

A Google már arról is beszámolt, hogy a Bard chatbotja Gemini Pro-n fog alapulni, de a jövőben Gemini Ultra modellt is tervezik beépíteni.

Valóban jobb, mint a ChatGPT?

A Google adatainak tanúság szerint a Gemini Ultra sokkal jobban teljesít, mint a ChatGPT, ami most a népszerűségi listát vezeti az AI-k között, ugyanakkor a gyakorlatban ez nem biztos, hogy tényleg így is van, hiszen egyelőre csak a PR anyagokat láthatják a szakértők is, illetve a tudományos publikációkat, nem a konkrét modellt. A Gemini Pro persze már kipróbálható, viszont a teljesítménye közel sem olyan jó, mint a GPT-4-é, bár a GPT 3.5-nél jobban tejesít.

Érdemes tehát óvatosnak lenni, mert bár a Google demó anyagi nagyon látványosak, ezek csak összeollózott anyagok, gyakorlati tapasztalatokról még nem igazán lehet beszámolni. Emellett pedig a Gemini még a Google adatai alapján is csak egy kicsivel jobb, mint a GPT-4, tehát közel sem biztos, hogy megéri váltani. Ugyanakkor az is tény, hogy videó-elemzésben biztosan jobb, mint a GPT-4.