Egy kis kínai cég azt állítja, hogy megalkotta a világ első önjáró mesterséges intelligenciáját – íme, a Manus

· 03.13. · TECH

Már több mint két éve tart a generatív mesterséges intelligencia (AI), elsősorban a chatbotok és szövegből képeket (és most már zenéket, videókat) gyártó generátorok aranykora, amit egyértelműen azok az amerikai cégek hoztak el, amelyek a mai napig irányítják a területet: az OpenAI, részben rajta keresztül a Microsoft, a Google (és a hozzá tartozó DeepMind), vagy a szektor bonyolultságára legjobban rámutató Anthropic, amit az OpenAI volt munkatársai alapítottak, és az Amazon mellett a Google is feltűnik a finanszírozói között. Ebbe a képbe rondított bele idén januárban a DeepSeek, az első kínai AI-eszköz (és az azonos nevű cég), amelyik áttörte az országhatárokat, és felvette a kesztyűt a nyugati chatbotok alapját képző nagy nyelvi modellekkel (LLM).

Most újra egy kínai cég borzolja a dicsőséges amerikai AI-fölényt féltő hazafik kedélyeit: a Butterfly Effect nevű vuhani startup Manus néven bemutatott eszköze, amit egész egyszerűen úgy hirdetnek, mint egy általános AI-ágenst, amely „tettekre váltja a gondolataidat”. Ez azt jelentené, hogy nemcsak meg tudja válaszolni, hogy hova érdemes utaznod nyaralni, hanem ha felhatalmazod, átveszi az eszközöd felett az irányítást és le is foglalja neked a szállást, megveszi a repülőjegyet, de akár még be is készíti az automatikus Gmail-választ, miszerint „Köszönöm levelét, de július 4. és augusztus 20. között szabadságon vagyok, csak utána tudok válaszolni, LÚZER”.

De a bemutatott példák alapján nem csak olyan feladatok elvégzésére képes, amelyekre egyébként a felhasználó is képes lenne, ha nem volna lusta néhányat kattintgatni. A hivatalos oldalon részletesen dokumentált esettanulmányok szerint kérésre tőzsdét elemez, potenciális vásárlókat keres egy vállalkozásnak, szemléletes oktatási segédanyagokat készít, vagy akár interaktív Trump–Zelenszkij vitaszimulátor játékot készít, miután megnézi a találkozóról készült videót Youtube-on.

Ezekből talán egyértelmű, hogy most itt kivételesen nem az történik, ami szokott, vagyis hogy feltűnt az OpenAI és a ChatGPT legújabb kihívója. Az egyelőre csak meghívásos alapon működő, várólistás Manus egy másik kategóriában, a chatbotok és nyelvi modellek helyett az AI-ágenseknél jelent versenytársat az OpenAI-nak, amely januárban jelentette be hasonló, egyelőre csak néhány ország Pro csomagos előfizetőinek elérhető eszközt, az Operatort. Ráadásul a Manus egy amerikai modellre, a Claude-ra épül. Akkor most az USA nyert, vagy Kína?

A totális fejetlenséghez az is hozzájárul, hogy azok, akik kipróbálták, már telekürtölték a techsajtót – egyfelől azzal, hogy itt az új DeepSeek-pillanat, jaj neked, Amerika, másfelől azzal, hogy már megint itt van egy túlhájpolt AI-cucc, de legalább most a kínaiak égtek be vele.

Ahhoz, hogy megértsük, mi történik valójában, nem árt áttekinteni, hogy miként alakult át az elmúlt hónapokban az AI-ipar, hogy hogyan jött a képbe Kína, és hogy mit tartogat az emberek helyett komplex feladatokat végrehajtó gépek jövője.

Eljött a cselekvés ideje

Ha visszaemlékszünk a régmúltnak tűnő 2022-es évre, a generatív AI-korszak hajnalán találjuk magunkat. Az újságok azt írják, hogy „a DeepMind mesterséges intelligenciája már egy középiskolás szintjén teljesít szövegértésben”, vagy hogy „a Google felfüggesztette a mérnököt, aki szerint érző lénnyé vált a cég mesterséges intelligenciája”, esetleg hogy „a diákok már azzal vágnak fel, hogy mesterséges intelligenciával íratják a házi dolgozatokat”. A könyökünkön kezd kijönni, hogy mesterséges intelligencia, de még nem értjük igazán, hogy mivel is van dolgunk.

Azzal, hogy az OpenAI 2022 novemberének végén kiadta a ChatGPT-t, hirtelen kézzel foghatóvá vált a sok technikai halandzsa: előttünk a csetablak, beszélgethetünk a géppel, ami egy óriási szöveges adatbázisból tanulta meg értelmezni és használni a nyelvet. Az alkalmazás instant siker lett, az elmúlt évek pedig arról szóltak, hogy a Google Geminitől az Elon Musk-féle xAI Grokján át az Anthropic Claude-jáig sorban jöttek a chatbot- és nyelvimodell-klónok, különböző előfizetői csomagokban, egy-egy extra funkcióval (beépített kép- és videógenerálás, hangalapú beszélgetés, érvelés hosszabb gondolkodás után) kiegészülve.

Sam Altman 2016-ban készített interjút Elon Muskkal, amikor féléves volt új, közös nonprofit kutatóintézetük, az OpenAI
photo_camera Sam Altman 2016-ban készített interjút Elon Muskkal, amikor féléves volt új, közös nonprofit kutatóintézetük, az OpenAI Forrás: Youtube/Y Combinator

Az elmúlt hónapokban ez megváltozott. Már nem lehet kitűnni egy újabb chatbottal, az EU nagy iparági reménységének tartott francia Mistral sem tudott igazán betörni a februárban kiadott Le Chat nevű eszközével, és a DeepSeek is elsősorban az energia- és költséghatékonysága miatt nyűgözte le a szakmát, nem a hihetetlen fejlettsége miatt. A chatbotok mellé ezért felsorakoztak az AI-keresők (a Perplexityt már Magyarországon is széles körben használják), az operációs rendszerekbe és irodai alkalmazásokba beépült asszisztensek (Google Gemini, Microsoft Copilot), és igen, az OpenAI Operatorjához vagy a kínai Manushoz hasonló AI-ágensek is, amelyek már nemcsak szövegelnek, hanem cselekednek is.

Kína csendben készülődött

Bár a DeepSeek januári berobbanása mintha meglepetésként érte volna az Amerika-centrikus AI-ipart, azt nem mondhatjuk, hogy ne lettek volna jelei a kínai áttörésnek. Már 2023 elején szinte a teljes kínai technológiai szektor lefektette a terveit a generatív AI új lehetőségeinek kiaknázására – ráadásul az olyan óriásoknak, mint a Baidu, az Alibaba vagy a Tencent, egyébként sem volt ismeretlen terep a mesterséges intelligencia, csak az új modellekkel kellett megismerkedniük.

Tavaly nyáron még mindig volt látható nyoma a világverő kínai AI-eszközöknek, ennek ellenére az 1,4 milliárd lakosú országban nagyobb arányban terjedt el a technológia, mint bárhol máshol. Egy 2024 júliusában közzétett kutatás szerint Kínában a különböző (pénzügyi, kereskedelmi, telekommunikációs, energia-, egészségügyi stb.) iparágak vezetőinek 83 százaléka használt generatív mesterséges intelligenciát, míg ez az arány az USA-ban 65, globálisan 54 százalék volt. A generatív AI területén bejelentett szabadalmak száma még nagyobb kínai fölényt mutat: 2023-ig több mint 38 ezer kínai szabadalmat regisztráltak, 6276 amerikaival szemben.

Lu Yu, a Wantalk nevű chatbotért felelős igazgató 2024 februárjában virtuális karakterek profiljait nézegeti a Baidu által kiadott virtuálistárs-kereső appon belül.
photo_camera Lu Yu, a Wantalk nevű chatbotért felelős igazgató 2024 februárjában virtuális karakterek profiljait nézegeti a Baidu által kiadott virtuálistárs-kereső appon belül. Fotó: JADE GAO/AFP

Ezek után inkább az a különös, hogy – miközben az egész világ a TikTokon rohasztja az agyát – 2025-ig kellett várni arra, hogy a nyugati mainstreambe is átszivárogjon egy-két kínai AI-termék. A DeepSeek ráadásul csak egy a három legnépszerűbb hazai AI-alkalmazás közül, amelyek egymást váltogatják az Apple App Store kínai letöltési listájának élén: a Tencent a WeChaten, a több mint egymilliárd felhasználójával a legnépszerűbb kínai közösségimédia-platformon belül tette letölthetővé Yuanbao nevű chatbotját, míg a TikTok tulajdonosa, a ByteDance Doubao nevű multimodális (szöveget, képet, hangot egyaránt értelmező és előállító) AI-eszköze, amit a DeepSeek taszított le a trónról, továbbra is rendkívül népszerű. És ez még mindig csak a jéghegy csúcsa.

Korai bepillantás a mesterséges általános intelligenciába

Végül elérkeztünk 2025 márciusának elejéhez, amikor épp újra forró téma, hogy mikor jöhet el a mesterséges általános intelligencia (AGI), vagyis az a fajta gépi intelligencia, amely már ténylegesen eléri az emberi képességeket. Sam Altman, az OpenAI első embere már akár idén el tudja képzelni, az Antrophic-vezér Dario Amodei 2026-ot jósolt, míg Ray Kurzweil, a Google vezető AI-kutatója 2029-re teszi az AGI érkezését. Nem csoda, hogy egy ilyen egymásra licitálós időszakban még nagyobbat tud robbanni egy olyan újítás, ami azt jelzi, hogy itt bizony szintlépés történt.

Színre lép a Manus. Március 5-én került fel a Youtube-ra az a videó, amely a Manus oldalára látogatókat is fogadja, és amelyben a vuhani startup társalapítója, Yichao „Peak” Ji tökéletes angolsággal, lazán a következőket mondja:

„Az elmúlt évben csendben építgettük azt, amit a mesterséges intelligencia következő evolúciós lépésének tartunk, és ma bemutatjuk a Manust, az első általános AI-ágenst. Ez nem pusztán egy újabb chatbot, hanem egy valóban autonóm ágens, amely áthidalja a szakadékot a megértés és a végrehajtás között. Míg más AI megáll az ötletek generálásánál, a Manus eredményeket hoz. Úgy gondoljuk, hogy ez az ember és gép közötti együttműködés következő paradigmája, ami korai bepillantást nyújthat a mesterséges általános intelligenciába is.”

A cikk innentől csak a Qubit+ előfizetőinek elérhető. Csatlakozz, és olvass tovább!

Ha már van előfizetésed, lépj be vele. Ha még nincs, válassz csomagjaink közül!