Adatelemző szoftverek népszerűsége - Dmlab

Adatelemző szoftverek népszerűsége

Gáspár Csaba

2011.03.28. • olvasási idő:

A jövő heti IQSymposiumon tartandó előadásomra készülve futottam bele egy nagyon érdekes cikkbe arról, hogy melyik adatelemző szoftver a legnépszerűbb (Robert A. Muenchen: The Popularity of Data Analysis Software). Hogy konkrétabb legyek az SAS, SPSS, R, JMP, Minitab, Stata, Statistica és még néhány kisebb szoftver népszerűségét próbálták megvizsgálni.

A cikket ezen a linken éred el.

Az elemzés igen széleskörű és elfogulatlan kívánt lenni, bár az R nyelv iránti pozitív percepció kiolvasható a sorok közül. Sőt ezzel volt az egyik legtöbb probléma a webes anyagok elemzése során, hiszen egy egybetűs szó különböző előfordulási számait nehéz torzulások nélkül vizsgálni. Mégis elég körültekintő elemzéseket láthatunk a témába vágó levelezési listákról, a levelezési listákra feliratkozottak számáról, a szakblogok számáról, az internetes keresési trendekről, a website-ok látogatottsági adatairól, azok PageRank értékéről, az állásajánlatok számáról, illetve a különböző felmérésekben megadott felhasználói preferenciákról egyaránt. Két ábrát be is vágtam a sok közül, de csak az ábrák kedvéért érdemes végigfutni ezt eredeti írást is (cikk linkje mégegyszer).

Az első ábra az eszközökkel foglalkozó legfontosabb levelezési listák forgalmát mutatja, míg a második az álláshírdetések számát az egyik nemzetközi állásközvetítő cég adatai alapján.

Amit én látok a számokból az, hogy nagyon erős figyelmet kap az R programcsomag, tényleg szignifikáns módon kiemelkedik az ábrákon látható trendekből ez a megoldás. Én is ismerek hazai cégeket, csapatokat akik egyik elsődleges eszközükké tették az R nyelvet, vannak biztató példák arra, hogyan lehet jelentős költségcsökkentést elérni kisebb projektek esetén. Ugyanakkor ez a webes figyelem még csak apró bolhacsípés a nagy szállítóknak, az USAban még mindig messze a legtöbb állásajánlat SAS-hoz és SPSS-hez köthető, és az R lényegében még három nagyságrenddel elmarad mögötte.

Ugyanakkor a trendek erősek, néhány év múlva a kisebb elemzési projekteknél az R igazi vetélytárssá tudja kinőni magát, főleg ha valamelyik nagy ilyen típusú megoldással még nem rendelkező vendor a hóna alá nyúl, és felkarolja ezt az open source kezdeményezést. Ez azt is jelenti, hogy azoknak, akik nem kizárólag nagyvállalati BI projektekben szoktak részt venni, érdemes elkezdeni tanulni ezt a technológiát, és – micsoda szerencse –  a net teli van jobbnál jobb anyagokkal.