Dmlab | Anonim Adatbányászok Klubja

Anonim Adatbányászok Klubja

Nagy-Rácz István

2011.11.18. • olvasási idő:

Körülbelül két hónapja, hogy beharangoztuk az Andego üzleti szemináriumát, aminek témája az adatbányászati projektek menedzselése volt. Akkor azt is megígértük, hogy a szeminárium után részletesen beszámolunk nektek az ott hallottakról.

Hogy ezt miért csak most tesszük meg, annak oka pont egy projektünk zárása, ami elhúzódott az előzetes várakozásokhoz képest. A szemináriumon hallottak azóta csak még jobban leülepedtek és az adott projekt fényében is aktuálisabbak, mint valaha.

Nem szeretném részletekbe menően ismertetni, hogy milyen előadásokat hallottunk és milyen témákat érintettünk, csak néhány gondolatébresztőt említenék meg, amivel kapcsolatban már a helyszínen is élénk véleménycsere alakult ki a részvevők között és amely gondolatokon azóta is sokat gondolkodom.

(1) Adatbányászok helye a szervezetben. Hol a helye az adatbányászoknak, az adatelemzéssel foglalkozó szakembereknek egy vállalatnál? Tegyünk minden vezető mellé egy elemzőt, akinek a döntését segíthetjük elaprózva ezzel az erőforrásokat? Kovács Gyula egy olyan példát hozott, ahol egy nagy vállalat esetében ez a modell működőképes volt. Már ott is kifejtettem, hogy az én tapasztalataim szerint ez akkor egy sikeres modell, ha a szervezet még eléggé az elején tart a tényalapú döntéseken alapuló működés kialakításában ÉS van egy erős szakmai ember az elemzők felett, aki azok munkáját minden tekintetben átlátja és nála futnak össze a különböző felhasználói területekről érkező igényszálak. Erre jól rímelt Gyula példája is, mert az adott példában a modell csődöt mondott, amikor az elemzők vezetője elhagyta a céget.

Egy, a tényalapú gondolkodást már sokkal inkább magáénak érző vállalat esetében szerintem hasznosabb, ha az elemzők egy szervezeti egységben ülnek (aka BI kompetencia központ) és az elemzési igények itt futnak össze, ez a szervezet felelős a felhasználói oldal képzéséért, az egyre újabb és újabb felhasználási lehetőségek terjesztéséért.

(2) Az adatbányászati projektek határai. Meddig terjed egy adatbányászati projekt határa? A feltárt összefüggések feltárásáig? Azok átadásáig? Vagy az összefüggések beépítéséig a már meglévő üzleti folyamatokba? A sokak által ismert és használt CRISP-DM módszertan szerint egy adatbányászati projekt az üzleti probléma megismerésétől az adatbányászati eredmények “hadrendbe állításáig” tart. Mások véleménye az volt a szemináriumon, hogy egy projekt határait meg kell húzni az összefüggések átadásáig és azok felhasználását az üzleti oldalra kell bízni.

Nem tudom, hol az arany középút, de túl sok olyan projektet láttam már, ami az asztalfióknak készült még akkor is, ha annak eredményeit akár pénzre is lehetett volna váltani. Tanácsadóként végzett projekt esetében nehéz az egész folyamatot végigvinni, de mégis azt hiszem, hogy jobb már a projekt elején kitalálni azt, hogy az eredmények felhasználását hogyan lehet azok fogyasztói számára megkönnyíteni.

(3) Adatbányászat jelentése a vállalatoknál. Sokszor találkoztam azzal a munkáim során, hogy még a projekt szempontjából leginkább érintett szervezeti egységen belül is meg kellett magyaráznom, hogy mit csinál egy adatbányász, miben más ez a munka, mint a riportokat előállító elemzőké, vagy a különböző leválogatásokat megíró adatbázis guruké. (Hogy ez nem csak az én problémám, arra példa Huczman Zsuzsa blogja, aki belefáradt abba, hogy ismerőseinek nehezen tudja csak elmondani, hogy mivel is foglalkozik munkaidőben)

Mihály Szabolcs, aki a Vodafone adatbányászait vezeti, mesélt arról, hogy az ő csoportjában az egyes feladatok milyen arányban vannak jelen. Arányait tekintve kevesebb időt foglalkoznak az emberek riportok gyártásával, mint az annyira vágyott prediktív modellek építésével. Ez egy nagyvállalat működéséből fakadóan érthető is, mégis fontos, hogy a fogyasztói oldalon lévő fejekben tiszta legyen, hogy ki mivel foglalkozik, hiszen csak akkor tudunk jó problémákat megoldani, ha ők is a jó eszközt párosítják hozzá.

A szeminárium fő erőssége abban rejlett, hogy a kiscsoportos előadásokon szinte csak az adatbányászat “fogyasztói” oldala jelent meg – ez alól több szempontból is kivétel voltam, és hogy mindenki elmondta a kendőzetlen véleményét egyes témákkal kapcsolatban. Nem voltak mellébeszélések, mindenki elmondta a valóságot arról, hogy melyik szervezetben mit jelent az adatbányászat és hogy milyen nehézségekkel kell megküzdeni a mindennapok során. Erre is utal a címben szereplő kifejezés: mindig is nagy igény volt bennem arra, hogy szakmabeliekkel beszélgessek azokról a problémákról, nehézségekről, amikkel mindannyian szembesülünk, de mégsem beszélünk róla, mert azzal a cégünkről is többet árulnánk el, mint szeretnénk.

A szeminárium témájából egy dolgot hiányoltam, ami nagyon beleillett volna a tematikába és amely adódik az adatbányászati projektek speciális jellegéből: mi a teendő akkor, ha az adatbányász nem tud feltárni összefüggéseket? Mi van, ha az adatbányászati projektek sikeressége éppen csak jobb, mint a véletlen? Milyen exit stratégiák vannak ilyen esetekre? Nagy vágyam, hogy egyszer részt vegyek egy olyan szemináriumon, ahol sikertelen projektek tanulságait hallgathatom meg, mert vannak ilyenek. Egy ilyen esemény lehetne az Anonim Adatbányászok Klubjának legnagyobb erőssége.