Dmlab | Etika a big data világában

Etika a big data világában

Gáspár Csaba

2016.03.24. • olvasási idő:

Néhány hete egy Python kurzus végén beszélgettem egy lelkes kollégával, akinek lelkesen újságoltam milyen izgalmas adatelemzési projektet indítottunk egy új partnernél. A partner neve hallatán ő egyáltalán nem lett lelkes – sőt kijelentette, hogy ennek társaságnak ő sosem dolgozna. Régi gondolatokat ébresztett fel bennem ez a történet.

Korábban nem volt annyira érdekes a civil szférában, hogy egy adatelemző adta eredmény mennyire szól bele az egyén életébe. Egyszerűen nem voltak a legyűjtött adatok olyan részletesek, hogy olyan erős modellt tudjunk építeni, ami alapján valakinek az életébe túlzottan beleszóljunk.

Aztán szép lassan egyre mélyebbre ásott a szakma, mígnem szinte előjel nélkül eljött a data science etika fekete napja, ami egyértelműen a Target.com körül kitört botrány: az árurendelési és böngészési szokásokból nagy pontossággal tudták kimutatni, hogy mikor esett teherbe egy ügyfelük. Ennek birtokában célzottan keresték meg prospektusokkal a kismamákat, akik gyakran még a hírt nem is közölték környezetükkel. Sőt, később kiderült, hogy bizonyos esetekben a Target.com magánál az ügyfélnél is hamarabb tudta meg az új fejleményt, a hatalmas adatmennyiségből olyan termékeket tudtak azonosítani, amik az első trimeszterben levő kismamák figyelmét önkéntelenül felkeltik.

Az eset hirtelen rávilágított azokra a kérdésekre, meddig felelős egy elemző az általa végzett elemzésért, mettől felelős az elemzési eredményekre támaszkodó üzleti oldal, mennyiben kell odafigyelni az elemzésünk lelkiismereti vonatkozásaira?

Napjainkban még csak a dilemmát látjuk, nem annyira a megoldást. Jogos igényünk, hogy legyenek világos szabályok, amik alapján mindig meg lehet mondani, hogy amit teszünk, az etikus (függetlenül attól, hogy a jog mit mond a dologról). Személyes véleményem szerint nem alkotható meg a jó szabályrendszer, minduntalan fogunk pro és kontra ellenpéldákat találni. Ez azonban nem azt jelenti, hogy nem kell próbálkozni a kérdés tisztázásával.

Az én felelősségem abból a szempontból is nagyobb, mert mind a Műegyetemen, mind a cégeknél folyó on-site képzések kapcsán sok ember tőlem hall először erről a dilemmáról, az etikai aggályokról. Egyenlőre nem tudok többet tenni, mint néhány konkrét esetet felvázolva elgondolkodtatom őket arról, hogy ők hogyan döntenének hasonló esetekben, elmondom az én személyes állásfoglalásomat – de nem gondolom, hogy ezt kellene mindenkinek követnie. Ezekkel a sztorikkal szembesítem őket:

  • Régi amerikai hitelbírálati esetek, mikor a hitelfelvevő bőrszínét, majd ennek tiltása után a szomszédban lakók bőrszínét kérdezték meg a jelentkezőtől
  • Megkérdezem, mi a véleményük a keresés tényétől változó repülőjegyárak mechanizmusáról
  • Felvázolom nekik a már említett Target.com történetet az elemző és a marketinges aspektusából
  • Végigbeszélünk egy egészségügyi adatelemzős esetet, mikor műtéti kockázatok számításáról és felhasználásáról gondolkodunk
  • A társkereső oldalakba épített adatelemzési algoritmusok sajátosságai kapcsán feszegetjük a kérdést, hogy ezen oldalak célja a hosszú előfizetési időszak elérése, ami egy idő után már ellentétes lehet azzal, hogy hamar megtalálja a hozzá passzoló lehetséges partnereket.

Tudtok olyan sztorikat még, ami ezen a területen érdekes lehet?