Egy kis kínai cég azt állítja, hogy megalkotta a világ első önjáró mesterséges intelligenciáját – íme, a Manus

Már több mint két éve tart a generatív mesterséges intelligencia (AI), elsősorban a chatbotok és szövegből képeket (és most már zenéket, videókat) gyártó generátorok aranykora, amit egyértelműen azok az amerikai cégek hoztak el, amelyek a mai napig irányítják a területet: az OpenAI, részben rajta keresztül a Microsoft, a Google (és a hozzá tartozó DeepMind), vagy a szektor bonyolultságára legjobban rámutató Anthropic, amit az OpenAI volt munkatársai alapítottak, és az Amazon mellett a Google is feltűnik a finanszírozói között. Ebbe a képbe rondított bele idén januárban a DeepSeek, az első kínai AI-eszköz (és az azonos nevű cég), amelyik áttörte az országhatárokat, és felvette a kesztyűt a nyugati chatbotok alapját képző nagy nyelvi modellekkel (LLM).
Most újra egy kínai cég borzolja a dicsőséges amerikai AI-fölényt féltő hazafik kedélyeit: a Butterfly Effect nevű vuhani startup Manus néven bemutatott eszköze, amit egész egyszerűen úgy hirdetnek, mint egy általános AI-ágenst, amely „tettekre váltja a gondolataidat”. Ez azt jelentené, hogy nemcsak meg tudja válaszolni, hogy hova érdemes utaznod nyaralni, hanem ha felhatalmazod, átveszi az eszközöd felett az irányítást és le is foglalja neked a szállást, megveszi a repülőjegyet, de akár még be is készíti az automatikus Gmail-választ, miszerint „Köszönöm levelét, de július 4. és augusztus 20. között szabadságon vagyok, csak utána tudok válaszolni, LÚZER”.
De a bemutatott példák alapján nem csak olyan feladatok elvégzésére képes, amelyekre egyébként a felhasználó is képes lenne, ha nem volna lusta néhányat kattintgatni. A hivatalos oldalon részletesen dokumentált esettanulmányok szerint kérésre tőzsdét elemez, potenciális vásárlókat keres egy vállalkozásnak, szemléletes oktatási segédanyagokat készít, vagy akár interaktív Trump–Zelenszkij vitaszimulátor játékot készít, miután megnézi a találkozóról készült videót Youtube-on.
Ezekből talán egyértelmű, hogy most itt kivételesen nem az történik, ami szokott, vagyis hogy feltűnt az OpenAI és a ChatGPT legújabb kihívója. Az egyelőre csak meghívásos alapon működő, várólistás Manus egy másik kategóriában, a chatbotok és nyelvi modellek helyett az AI-ágenseknél jelent versenytársat az OpenAI-nak, amely januárban jelentette be hasonló, egyelőre csak néhány ország Pro csomagos előfizetőinek elérhető eszközt, az Operatort. Ráadásul a Manus egy amerikai modellre, a Claude-ra épül. Akkor most az USA nyert, vagy Kína?
A totális fejetlenséghez az is hozzájárul, hogy azok, akik kipróbálták, már telekürtölték a techsajtót – egyfelől azzal, hogy itt az új DeepSeek-pillanat, jaj neked, Amerika, másfelől azzal, hogy már megint itt van egy túlhájpolt AI-cucc, de legalább most a kínaiak égtek be vele.
Ahhoz, hogy megértsük, mi történik valójában, nem árt áttekinteni, hogy miként alakult át az elmúlt hónapokban az AI-ipar, hogy hogyan jött a képbe Kína, és hogy mit tartogat az emberek helyett komplex feladatokat végrehajtó gépek jövője.
Eljött a cselekvés ideje
Ha visszaemlékszünk a régmúltnak tűnő 2022-es évre, a generatív AI-korszak hajnalán találjuk magunkat. Az újságok azt írják, hogy „a DeepMind mesterséges intelligenciája már egy középiskolás szintjén teljesít szövegértésben”, vagy hogy „a Google felfüggesztette a mérnököt, aki szerint érző lénnyé vált a cég mesterséges intelligenciája”, esetleg hogy „a diákok már azzal vágnak fel, hogy mesterséges intelligenciával íratják a házi dolgozatokat”. A könyökünkön kezd kijönni, hogy mesterséges intelligencia, de még nem értjük igazán, hogy mivel is van dolgunk.
Azzal, hogy az OpenAI 2022 novemberének végén kiadta a ChatGPT-t, hirtelen kézzel foghatóvá vált a sok technikai halandzsa: előttünk a csetablak, beszélgethetünk a géppel, ami egy óriási szöveges adatbázisból tanulta meg értelmezni és használni a nyelvet. Az alkalmazás instant siker lett, az elmúlt évek pedig arról szóltak, hogy a Google Geminitől az Elon Musk-féle xAI Grokján át az Anthropic Claude-jáig sorban jöttek a chatbot- és nyelvimodell-klónok, különböző előfizetői csomagokban, egy-egy extra funkcióval (beépített kép- és videógenerálás, hangalapú beszélgetés, érvelés hosszabb gondolkodás után) kiegészülve.

Az elmúlt hónapokban ez megváltozott. Már nem lehet kitűnni egy újabb chatbottal, az EU nagy iparági reménységének tartott francia Mistral sem tudott igazán betörni a februárban kiadott Le Chat nevű eszközével, és a DeepSeek is elsősorban az energia- és költséghatékonysága miatt nyűgözte le a szakmát, nem a hihetetlen fejlettsége miatt. A chatbotok mellé ezért felsorakoztak az AI-keresők (a Perplexityt már Magyarországon is széles körben használják), az operációs rendszerekbe és irodai alkalmazásokba beépült asszisztensek (Google Gemini, Microsoft Copilot), és igen, az OpenAI Operatorjához vagy a kínai Manushoz hasonló AI-ágensek is, amelyek már nemcsak szövegelnek, hanem cselekednek is.
Kína csendben készülődött
Bár a DeepSeek januári berobbanása mintha meglepetésként érte volna az Amerika-centrikus AI-ipart, azt nem mondhatjuk, hogy ne lettek volna jelei a kínai áttörésnek. Már 2023 elején szinte a teljes kínai technológiai szektor lefektette a terveit a generatív AI új lehetőségeinek kiaknázására – ráadásul az olyan óriásoknak, mint a Baidu, az Alibaba vagy a Tencent, egyébként sem volt ismeretlen terep a mesterséges intelligencia, csak az új modellekkel kellett megismerkedniük.
Tavaly nyáron még mindig volt látható nyoma a világverő kínai AI-eszközöknek, ennek ellenére az 1,4 milliárd lakosú országban nagyobb arányban terjedt el a technológia, mint bárhol máshol. Egy 2024 júliusában közzétett kutatás szerint Kínában a különböző (pénzügyi, kereskedelmi, telekommunikációs, energia-, egészségügyi stb.) iparágak vezetőinek 83 százaléka használt generatív mesterséges intelligenciát, míg ez az arány az USA-ban 65, globálisan 54 százalék volt. A generatív AI területén bejelentett szabadalmak száma még nagyobb kínai fölényt mutat: 2023-ig több mint 38 ezer kínai szabadalmat regisztráltak, 6276 amerikaival szemben.

Ezek után inkább az a különös, hogy – miközben az egész világ a TikTokon rohasztja az agyát – 2025-ig kellett várni arra, hogy a nyugati mainstreambe is átszivárogjon egy-két kínai AI-termék. A DeepSeek ráadásul csak egy a három legnépszerűbb hazai AI-alkalmazás közül, amelyek egymást váltogatják az Apple App Store kínai letöltési listájának élén: a Tencent a WeChaten, a több mint egymilliárd felhasználójával a legnépszerűbb kínai közösségimédia-platformon belül tette letölthetővé Yuanbao nevű chatbotját, míg a TikTok tulajdonosa, a ByteDance Doubao nevű multimodális (szöveget, képet, hangot egyaránt értelmező és előállító) AI-eszköze, amit a DeepSeek taszított le a trónról, továbbra is rendkívül népszerű. És ez még mindig csak a jéghegy csúcsa.
Korai bepillantás a mesterséges általános intelligenciába
Végül elérkeztünk 2025 márciusának elejéhez, amikor épp újra forró téma, hogy mikor jöhet el a mesterséges általános intelligencia (AGI), vagyis az a fajta gépi intelligencia, amely már ténylegesen eléri az emberi képességeket. Sam Altman, az OpenAI első embere már akár idén el tudja képzelni, az Antrophic-vezér Dario Amodei 2026-ot jósolt, míg Ray Kurzweil, a Google vezető AI-kutatója 2029-re teszi az AGI érkezését. Nem csoda, hogy egy ilyen egymásra licitálós időszakban még nagyobbat tud robbanni egy olyan újítás, ami azt jelzi, hogy itt bizony szintlépés történt.
Színre lép a Manus. Március 5-én került fel a Youtube-ra az a videó, amely a Manus oldalára látogatókat is fogadja, és amelyben a vuhani startup társalapítója, Yichao „Peak” Ji tökéletes angolsággal, lazán a következőket mondja:
„Az elmúlt évben csendben építgettük azt, amit a mesterséges intelligencia következő evolúciós lépésének tartunk, és ma bemutatjuk a Manust, az első általános AI-ágenst. Ez nem pusztán egy újabb chatbot, hanem egy valóban autonóm ágens, amely áthidalja a szakadékot a megértés és a végrehajtás között. Míg más AI megáll az ötletek generálásánál, a Manus eredményeket hoz. Úgy gondoljuk, hogy ez az ember és gép közötti együttműködés következő paradigmája, ami korai bepillantást nyújthat a mesterséges általános intelligenciába is.”
A cikk innentől csak a Qubit+ előfizetőinek elérhető. Csatlakozz, és olvass tovább!
Ha már van előfizetésed, lépj be vele. Ha még nincs, válassz csomagjaink közül!