A Columbián, a California Egyetemen, a London School of Economics-on, Cambridge-ben, a milánói Bocconi Egyetemen, Berlinben, Bangladeshben, Koreában használják, teljesen magyar, mi az? Ez az Adatelemzés című tankönyv, ami olyannyira hiánypótló anyag volt az oktatásban, hogy megjelenése óta egyre szélesebb körben használják a világon.
A mű szerzői Békés Gábor és Kézdi Gábor, akik a CEU-n, a Corvinus Egyetemen, a Michigani Egyetemen és Readingben tanítottak, és kilenc év alatt folyamatosan fejlesztettek egy tananyagot, ami a közgazdasági és szakpolitikai döntésekhez szükséges adattudomány gyakorlatias megközelítését jelentette. Mivel ilyen sztenderd anyag nem létezett, úgy döntöttek, hogy a tananyagból legyen tankönyv. A cél az volt, hogy tömegeknek szóló adatelemzési tudást összegezzenek egy kompakt anyagban, ami az alapoktól az oksági elemzésen át a gépi tanulásig foglalja össze, amit erről a területről a felsőfokú oktatásban részt vevő, adatokkal foglalkozó diákoknak tudni érdemes.
Az elkészült anyag egy nyugati értelemben vett tankönyv, az ökonometria és az adattudomány keveréke. Van saját honlapja, óriási munkával rengeteg esettanulmányt fejlesztettek hozzá, több tízezer sornyi kóddal, sztorikkal. Éppen ezért a könyvhöz kiterjedt online források is kapcsolódnak, többek között elérhetők a nyers és tisztított adatok, valamint az elemzéshez szükséges kódok Stata, R és Python programnyelven. A könyv egy méretes Twitter (X) közösséget is kitermelt, ahol további értékes tudás halmozódik fel a témában.
Hogy mennyire sikerült jól az anyag, azt nem csak az egyre szélesebb körben való alkalmazása igazolja, hanem a kritikai visszhang is. David Card, a California Egyetem Nobel-djías professzora így méltatta a könyvet:
„Az ökonometria és az adattudomány gyönyörű integrációja, amelyben az adatgyűjtéstől és a feltáró elemzéstől egyenes út visz a hagyományos regressziós modellezésig, majd az előrejelzésig és az oksági modellezésig. Éppen erre van szükség ahhoz, hogy a hallgatók következő generációját felvértezzük a két terület eszközeivel és felismeréseivel.”
Joshua Angrist, a Massachusetts Institute of Technology (MIT) Nobel-díjas professzora pedig így fogalmaz:
„Ez az izgalmas, új szöveg mindent tartalmaz, amit napjaink feltörekvő adatelemzőinek ismerniük kell; egyszerre átfogó és könnyen érthető. A két Gábor egy jó konfidenciaintervallumhoz hasonlóan szinte teljesen lefedte, amit érdemes tudni!”
Ez a könyv - pontosabban annak első része - mostantól elérhető magyarul, az Alinea Kiadó gondozásában. Széles összefogással készült el egy magyar változat (fordította Rózsás Sarolta), amit az egyik szerző, Békés Gábor részvételével ma délután mutatnak be a Corvinus Egyetemen. (A másik szerző, Kézdi Gábor 2021-ben, fájdalmasan fiatalon elhunyt.) Békés Gábor a Portfolionak elmondta, hogy a magyar fordítást azért tartotta fontosnak, mert küldetésük a tudás demokratizálása, ezért kell magyar kiadás, hogy a diákok pontosan megértsék a fogalmakat, jobban átlássák az összefüggéseket. A cél érdekében egy szakszótár is készült, benne pici nyelvújítással.
Címlapkép forrása: Portfolio