Meddig tart ennek a parancsnak a végrehajtása python-ban? 4 másodperc. Mennyi memóriát foglalunk? 460 Mb.
A nagy kérdés, hogy ez hogyan néz ki RapidMiner-ben? A válasz az, hogy sehogy. Az eredetileg a Java VM-ben paraméterként beállított 10 Gb-ot telenyomtuk valamivel, a process elszállt azzal, hogy kicsit sokat szeretnénk végrehajtani egyszerre. Remélem mindenki látja már az üzleti modellt emögött. RapidMiner-rel ugyanis válaszúthoz értünk:
- Kifizetünk egy ismeretlen összeget, hogy képesek legyünk ennek a rendkívül bonyolult elemzésnek az elkészítésre. Emellett nem lehetünk biztosak abban, hogy ezzel a verzióval végre tudjuk hajtani majd ezt a feladatot, mert nagy valószínűséggel azt fogjuk tapasztalni, hogy a szerverünkben lévő RAM mennyisége sem elegendő. Vehetünk RAM-ot is 🙂
- Elkezdjük a szokásos hákolást: elkezdünk Loop-olni a változókat, törölgetni a memóriát a RapidMiner userek placebójával, a Free Memory operátorral, feldaraboljuk az adatainkat oszlopok szerint, vagy vehetünk mintát, kiírhatjuk lemezre, azt olvasgatjuk be, hátha azzal lefut, újraindítunk. Reménykedünk. Az biztos, hogy nem rapid lesz a megoldás, a RapidMiner átalakítja az adatbányászt RabidMiner-ré.
Arra a kérdésre, hogy mennyi időt fog ez a feladat igény bevenni RapidMiner használatával tehát a válasz: senki nem tudja, és senkit nem érdekel, mert python-ban 4 másodperc alatt megcsináltuk. Kérem kapcsolja ki.
2013-11-22 15:16 Gáspár Csaba
Python vs RapidMiner összehasonlítást azért érzem erősnek, mert itt azért a vizuális programozási felületeket hasonlítjuk össze egy programozási nyelvvel. De gondolom azért mindenki látta a fentiekből, hogy mekkora előnyei vannak annak, ha valamilyen adatelemzési nyelven is beszélünk. Most SPSS Modeler vagy SAS Guide/Miner futtatást nem csináltam, de biztos vagyok benne, hogy a Modelernek nagyobb gondot nem okozna a dolog, a SAS-sal szemben is bizakodó lennék, ha nem is annyira triviális a dolog.
Mindenesetre a profi ligában a RapidMiner a leggyengébb, nincs ezen mit szépíteni. De én azért annyira nem félteném őket. Ahogy Prekopcsák Zoli írta, az eggyel korábbi verziót mindvégig elérjük, ami mentén a szakmai közösség reméljük fenn marad – ehhez a mostani változás kommunikációja kevés lesz -, akkor a RapidMiner gyors fejlődése be tudja hozni a lemaradásokat. Ehhez komoly fejlesztések kellenek még az alaprendszerben is, reméljük hogy az új bevételekből erre is lesz erőforrás.
Megnéztük már, mit tud a RapidMiner 6, és bizton állíthatom hogy az új logón, néhány kezdőknek szóló tutorial megoldáson kívül nem tud többet, mint a legutóbbi 5.x verzió. Szóval aki eddig ezen a platformon dolgozott, projektelt, tanult, nem kell megijednie, nem fog eltűnni a megszokott technológia. Remélem az új irány hoz annyi új lendületet a RapidMinernek, ami alapján a szabadon elérhető verzió növekedési görbéje az eddig tapasztaltakhoz képest nem fog változni.
2013-11-24 19:35 – Gáspár Csaba
Közben a Rapidminer elkezdett az eddig felépített közössége felé is kommunikálni. Bocsánatot kértek, hogy nem voltak egyértelműek, és részletesen kifejtik, hogy a közösség számára milyen licensz megoldásokat javasolnak. Sőt az árazási struktúrához is hozzányúltak, az úgynevezett RapidMiner Starter csomagot nem 14 napig használhatjuk (ez volt eddig az 1GB-os csomag), hanem ezt a megoldást időkorlát nélkül használhatjuk. Emellett a Professional verziót (8GB memóriakorlát) próbálhatjuk ki 14 napig. Illetve elkezdte hangsúlyozni, ami a honlapról alapból nem jön le: mindig az aktuális verzió bevezetésével az előző verziót ingyenessé teszik – ez most ugye a RapidMiner 5.x verzió.