A mesterséges intelligencia modellek bizony nem maguktól, a semmiből tanulnak meg tanulni, hanem az adatannotáció segítségével. Az adatannotációt végző ember lényegében az AI bébicsősze, és szűk egy évvel ezelőtt nagy lendülettel és sokan is vállalkoztak erre a munkára. Fizetést azonban már valamiért nem mindenki kapott.

Rugalmas, kényelmet és a jövőt szolgálja

A Time egy évvel ezelőtti cikkében számolt be először arról, hogy egy újabb állástípus ütötte fel a fejét, többek között a Redditen és a TikTokon. A hirdetők azt állítják ezekben a tartalmakban, hogy óránként 20 dollárt vagy még annál is többet keresnek azzal, hogy szabadidejükben kisebb, úgynevezett adatannotációs feladatokat végeznek el az olyan oldalakon, mint a DataAnnotation.tech, a Taskup.ai, a Remotasks vagy az Amazon Mechanical Turk.

A lap elmagyarázza, hogy mivel a vállalatok nagyrészt sietve kezdték el a maguk AI modelljét létrehozni, megnőtt a kereslet az adatcímkézők iránt.

A lényeg, hogy az AI modellek számára előzetesen táplálják be az információkat a különböző forrásokból, amelyeket alapján a modell lényegében elkezd tájékozódni és képes lesz generatív információkat szolgáltatni a felhasználóknak, ha azok erre kérik őt. Csakhogy ezt a tanulási folyamatot az esetek többségében emberek felügyelik.

A véglegesített tanult adatok véglegesítéséhez az adatokat címkézni kell, és a tévedések elkerülése végett ezt az adatcímkézést is emberek végzik.

Hogy egy, a Shaip által is leírt példával éljünk, egy utcai látképről készült fotón egy ember adatokat címkéz akkor, amikor az AI számára egyesével megjelöli, hogy milyen objektumok láthatók a fotón, például megkülönbözteti számára egyesével a közlekedési lámpákat, a járókelőket, a buszt, az autót, a zebrát, a csatornafedelet, stb.

Ennek a folyamatnak köszönhetően a ChatGPT például, ha egy kutyát lát egy képen, amit megmutatunk neki, akkor nem csupán magát az állatot, hanem akár annak fajtáját is képes felismerni.

Milliárdok válhatnak címkézővé

A Time cikke szerint csak megbecsülni lehet, hányan végeznek ilyen munkát: a Google Research egyik 2022-es tanulmánya alapján a számuk akár milliós nagyságrendű is lehet, de akár milliárdos nagyságrendű lehet a jövőben.

A Floridai Egyetem egyik informatikus hallgatója a Business Insidernek adott, az Economx által is szemlézett interjújában azt mondta, hogy ő a DataAnnotation Tech-en keresztül foglalkozik adatcímkézéssel. Ebből kiderül, hogy ő kifejezetten tényellenőrzéssel foglalkozott, és állítása szerint ő óránként akár 25-50 dollárt is képes megkeresni ezzel a munkával, amelyet teljesen rugalmas, otthonról tud végezni, egyetem mellett.

Címletek nélküli címkézés

Azonban a az egyik adatcímkéző állást kínáló vállalat Trustpilot oldalán sorra jelennek meg a negatív vélemények. Már elsőre is szembetűnő, hogy az 507 értékelés 51 százaléka ötcsillagos, míg 31 százaléka a lehető legrosszabb, egycsillagos értékelés.

Az értékelés között többen megjegyzik, hogy a regisztráció rendkívül hosszú időt vesz igénybe és nagyon sok érzékeny adatot kell megadni hozzá. Ráadásul egyáltalán nincs garancia arra, hogy az állásjelentkezésre érdemben reagálnak is.

Szintén többen megjegyzik, hogy hiába végezték el a kért munkát, valamiért nem kaptak fizetséget, mások pedig arról írnak, hogy néhány hétig valóban foglalkoztatta őket a vállalat és tényleg úgy tűnt, hogy korrektül és megbízhatóan fizetnek, ám egyszer csak váratlanul, mindenféle előzetes figyelmeztetés és indoklás nélkül nem kaptak több munkát és teljesen megszüntetett velük minden kapcsolatot a munkáltató.

Ami a fenti negatív tapasztalatokat összeköti, hogy hiába keresték az érintettek a céget, semmi reakciót nem kaptak.

Egy Reddit-posztban szintén fejtegették korábban, hogy esetleg ez a fajta állás átverés lehet, azonban gyanúsan sok választ töröltek a bejegyzés alól. Muaz Ibn Masud kiberbiztonsági szakember egy, a LinkedIn által közölt cikkében azt írja, mielőtt bárkinek adatcímkézésbe kezdünk, győződjünk meg róla, hogy megbízható értékeléseket találunk róla a fentebb említett Trustpilot-on, és amíg a platform biztonságosságáról nem vagyunk meggyőződve, addig ne adjunk meg semmilyen érzékeny adatot sehol.

A legegyszerűbb azonban mindenekelőtt az, ha az ösztöneinkre hallgatunk: ha valamiért rossz megérzésünk van valami kapcsán, akkor legyünk elővigyázatosabbak.

Ezzel a tuti trükkel az Ön gyermeke is simán leérettségizik

Mi szükség van házi feladatra, ha a szülők és a korrepetáló tanár helyett ott a ChatGPT? És mire valók a függvénytáblázatok, ha azt a mesterséges intelligencia gyorsabban fellapozza nekünk? Bár ezekre a kérdésekre a válasz utópisztikusan hat egyesek szájából, egy alapvető különbség egész biztosan sokáig megkülönbözteti az emberi intelligenciát a gépitől: amíg az emberi idegrendszer receptorai egy egészséges embernél szinte tévedhetetlenek, addig a gépi agy szoftveres memóriája sokszor egyszerűen cserbenhagy. Szakértő segítségével most megmutatjuk, hogyan is válhat a legjobb hasznunkra a Turing-teszt pudingpróbája.
Ha többre kíváncsi, itt olvashat tovább.