Adatirigység | Dmlab

Adatirigység

Gáspár Csaba

2021.03.03. • olvasási idő:

Nem tudom, hogy vannak-e olyan kutatások, amik az adatelemzők gondolkodását, pszichéjét elemzik, de ha lennének, akkor biztosan hamar rátalálnának az adatirigység jelenségére.

Nagyon sokan azon keresztül ítélik meg magukat, és a saját adatelemző pozíciójukat, hogy mások mit gondolnak az ő szakmai erejükről. Ehhez a szakmai csodálathoz vezető egyik út az adatokon keresztül visz: ha elmondjuk, hogy milyen izgalmas adatokhoz férünk hozzá, képzeletbeli szakmai erőpontjaink megnőnek. Ez a gondolatmenet persze csalóka: az adatgazda tipikusan különbözik magától az adatelemzőtől. Bár a tapasztalatok ott vannak az elemző fejében, aki az adatokkal dolgozik, de mégis maguk az adatok nem. Így van ez, hacsak nem miénk a cég vagy az adatkonstrukció, ahonnan az adatok származnak.

Megkülönböztethetünk három alapvető viselkedést a fentiek kapcsán:

  • az adatvágy, amikor érezzük magunkban a vágyat, hogy “hú de megelemezném ezt az adatot”;
  • az adatirigység, amikor azután sóvárgunk, hogy más adatát igazából jobb lenne, ha mi tudnánk leelemezni;
  • és az adat féltékenység, ami valami olyasmi, hogy igyekszünk mást nem odaengedni az adathoz, amit mi elemzünk, hogy nehogy aztán ő jusson olyan eredményre, amire mi szeretnénk / szerettünk volna.

Az utóbbi különösen érdekes és izgalmas amikor egy nagy szervezetben, egy nagyvállalatban egyes csoportok, egyes vezetők blokkolják az adatokat a cég többi része elől. Ennek nagyon sok oka lehet. Amikor egy technikai adatelemző blokkolja az adatot, akkor jelenik meg egyfajta adat féltékenység: félelem attól, hogy az adatokban rejlő lehetőségeket valaki más aknázza ki.

Ugyanakkor látom azt is, hogy vannak olyan esetek, amikor egy-egy adatelemző valójában a saját sztárkultuszát, vagy az előadásának a magas értékűségét abból vezeti le, hogy mennyire izgalmas adatok állnak a rendelkezésére, és ő lényegében ennek a hullámán mond valami nagyot. A hallgatóság soraiban nagyon sokan szoktak lelkesedni az ilyen előadások után. Ugyanakkor ezekben az esetekben nem is az elemzés, vagy az eredmények, hanem maguk az adatok a lelkesítőek. Egyrészt sok esetben az előadó nem is mondhatja el, hogy mit csinálnak pontosan az adatokkal. Valamint az igazi szellemi, adatelemzési kihívást jelentő problémákat egy 20-30 perces előadás során nehéz is bemutatni. Ezekben az esetekben a külső szemlélő inkább annak a hatása alatt van, hogy mennyire izgalmas az Uber / Airbnb / hasonló nagy cégek adathalmaza, amit éppen lát.

Ez az egész kérdéskör azért jutott mostanában eszembe, mert hamarosan indul egy igazán érdekes munka az újonnan alakult Nemzeti Adatvagyon Ügynökségnél. Az Ügynökségnél megpróbálják kidolgozni azt a jogi keretrendszert, amely mentén külső piaci szereplők férhetnek hozzá állami adatokhoz megfelelő ellentételezés fejében. Egy háttérbeszélgetés során nagyon izgalmas volt látni, hogy hasonló gondolkodású, ugyanolyan háttérrel rendelkező adatelemzők, adatot üzleti feladatokra felhasználók mennyire különböző módon állnak hozzá a kérdéshez attól függően, hogy az ő szervezetük számára értékes lehet az adatvagyon amihez hozzá lehet jutni, vagy ha valójában nekik ez nem is annyira fontos.

Felmerül a kérdés, hogy szoktam-e én is érezni adatirigységet? Megmondom őszintén, bár nem tartom az irigységet egy jó emberi tulajdonságnak, de volt már rá példa, hogy sóvárogtam más adatvagyona után. Volt olyan eset, amikor egy banknak dolgozva láttam, hogy milyen iszonyatos méretű és milyen gazdag adatvagyonnal rendelkeznek. Ekkor elfantáziáltam, hogy mi minden izgalmas elemzést lehetne ezekből az adatokból kihozni. Nyilván azt a fajta harcot nem irigylem ezekkel az adatokkal nap mint nap dolgozóktól, amit egy bankban meg kell vívni ahhoz, hogy ilyen adatelemzéseket lehessen végezni. 

És te, éreztél már adatirigységet?