Két új érdekes adatelemző könyv
Kedden két könyvhöz is hozzájutottam, mindkettőre régóta vártam. Az elsőt, az IQSys által szerkesztett, támogatott „Üzleti haszon az adatok mélyén – Az adatbányászat mindennapjai” című munkát ajándékba kaptam Sipos Ferenctől, hálás köszönet érte.
Eddig annyira volt időm, hogy átlapoztam, és minden lapján röviden végigfutottam. Megnéztem a fejezeteket, ábrákat, néhol egy-egy fél bekezdést is elolvastam. Ebből is látszik, hogy igen felszínes véleményt tudok még csak adni. De ez az első benyomás is azt sugallja, hogy valami kivételes dolgot tartok a kezemben. Soha korábban nem láttam semmilyen nyelven olyan könyvet, amit egy üzleti intelligencia, adattárház és adatbányászati projektek területén dolgozó cég munkatársai írtak volna ilyen megközelítéssel. Lényegében egyfajta ars poetica jelleggel elmondják, hogy szerintük hogyan kell ezt a munkát végezni. Kitérnek a menedzsment és a szakmai szempontból lényeges best practice jellegű elemzési javaslataikra. Bár a céljuk az volt, hogy az üzleti oldal és a szakmai oldal közös nyelvét, közös nevezőjét megteremtsék, de nekem mint a szakmai oldal szereplőjének inkább az az érdekes, hogyan közelítik meg a dolgokat. Elgondolkodtató, vitaindító műhelytitkoknak tekintem mindazt, amit leírtak.
Első olvasatra még egy mellékes dolgot emelnék ki: a könyv a fejezetek közötti karikatúrákkal úttörőnek mondható a hazai adatelemzési és adatbányászati viccek világában, amit bizonyára értékelni fognak azok, akik eddig is szívesen olvasták angolszász kultúrkörből származó hasonló csemegéket.
A másik könyv Stephen Baker „Numerátorok” című könyve. A történész végzettségű újságíró az amerikai kontinens nagy adatbűvészeit (adatelemzéssel foglalkozó matematikusait, informatikusait, mérnökeit) kérdezte ki munkájukról. Mondhatni, hogy a mű abszolút laikusoknak szól, és igencsak amerikai stílusban írták. Állítása szerint az úgynevezett numerátorok az adatok és algoritmusok kombinációival lényegében a huszonegyedik század mágusai, akikre egyszerre felnézhetünk, és akiktől egyszerre félhetünk is. Az érintett területek abból a szempontból is érdekesek, hogy ezek nem a tipikus üzleti adatbányászat területeinek mondhatóak, az alábbi szerepben levő emberek adatait dolgozzák fel: dolgozó, vásárló, szavazó, blogíró, terrorista, páciens, szerelmes.
A könyvbe már többször beleolvastam a könyvesboltban, mire megvettem. Pontos indokot nem tudok mondani, mire számítok ettől a könyvtől, de az első 40 oldal olvasása után elmondhatom, hogy annyira könnyed, hogy olvasása közben kipattant a fejemből 5 konkrét adatbányászathoz kapcsolódó ötlet, szerintem már ezért megérte elkezdeni.