Blog « dmlab
Home  /   Blog

Adatbányászat Blog

- Gáspár Csaba

(Hallgatóknak rövidítve:) BME választható tárgyak hiteles előadóktól: - Alkalmazott adatelemzés (K-Cs 12h) minden órán laptopoddal dolgozol, Python, R és SAS + data science és gépi tanulás alapjai- 'Big Data' elemzési eszközök nyílt forráskódú platformokon (Sz 12h) Hadoop, Spark, teljes big data stack Go to Neptun! (Külsősöknek, részletek után érdeklődőknek) Idén is meghirdetjük a BME-n tartott legfontosabb tárgyainkat külsősök számára is. Ez azt jelenti, hogy a műegyetemista hallgatók olvass tovább...

- Gáspár Csaba

Hálás vagyok. Ennek az egyszerű gondolatnak mindenféle variációja kavarog a fejemben, mikor arra gondolok, hogy ma 2017 május 10.-én ünnepeljük a dmlab alakulásának tizedik évfordulóját. Ahogy a tíz évnyi élményt átpörgetem a fejemen, valahogy azt érzem, hogy ez nagyon jó tíz év volt. Annyira pozitív bennem az összkép, hogy szinte hitetlenkedve szedem össze az agyam rejtet zugaiból a nehézségek, a kudarcok élményeit. És mikor ezeket is sorba veszem, méginkább kereknek és jónak látom ezt az idősz olvass tovább...

- Gáspár Csaba

Ma hajnalban ütött be a hír, hogy a Google felvásárolta a legnagyobb adatbányászati versenyeket szervező oldalt, a Kaggle.com site-ot (első hír itt, hivatalosabbak itt , de a Google a blogposzt írásának időpontjában még hivatalosan nem jelentette be a tranzakciót). A vételárról nincsenek hírek, a 2010-es alapítása óta eddig 12,5 millió dollár befektetést tudott bevonni a cég. A hír váratlanul ért, de sok szempontból nem annyira meglepő: a Google számára sok dolog jól jöhet a Kaggle portfóliójábó olvass tovább...

- István Nagy

Folytatva a hagyományokat: szeretnénk a figyelmetekbe ajánlani a tavaszi félévben futó data science kurzusunkat a Műegyetemen, amelyben az érdeklődők betekintést nyerhetnek az adatelemzés világába elméleti és gyakorlati órák keretében. A tárgy órái hetente keddenként 10:15-től és minden második pénteken 10:15-től lesznek. Az első alkalom február 7-én, kedden, 10:15-kor kezdődik.Téma szempontjából az adatelemzés alapjait vesszük át: adatmodell, CRISP-DM, felügyelt és nem felügyelt tanulási eljárá olvass tovább...

- Gáspár Csaba

A Műegyetem büféjében egy közgazdász kolléganőnktől hallottam egy érdekes gondolatot (mémet), melyen az elmúlt hónapban sokat morfondíroztam. Zsuzsa meglátása szerint az európai kultúrában a gazdaságban megjelenő adatokhoz, az azokban megjelenő összefüggésekhez, a ma big data néven futó jelenséghez külön nyugati és keleti (bizánci) megközelítés tartozik. A nyugati gondolkodásmódban az adatokra támaszkodva növelhetjük a hatékonyságunkat, alkalmazkodhatunk a változó környezethez, versenyelőnyhöz j olvass tovább...

- Gáspár Csaba

Idén az adventi időszak kötelező feladatai közé bekerült a Posta illetve más csomagküldő szolgálatok szidása, miszerint miért nem készültek fel időben a karácsonyi dömpingre. Örök téma ez, bárkivel el lehet róla beszélgetni, mindenkit érint és mindenki ért hozzá - olyan mint az időjárás, a politika vagy a foci. A szállingózó történetek először idén is a Postáról szóltak, de az elmúlt hetekre végülis minden csomagküldőre kiterjedtek, végül nem egyetlen cég bénázásáról, hanem valami általánosabb j olvass tovább...

- Kazi Sándor

Pár pillanatra feltódult a magyar online médiában a PISA-felméréssel kapcsolatos hírek hada, mondván, hogy Magyarország leszerepelt, stb. Az Index ki is emelt pár feladatot, hogy az olvasók is tesztelhessék, mit is mér a PISA-felmérés, és hogy hogy teljesítenének rajta. Nade a poszt apropója nem is ez, hanem konkrétan az egyik feladat, ami alább olvasható, illetve az Index kiemelt feladatai között is szerepel: De mi is ezzel a probléma?! Tegyük fel, hogy csak a csapadéktől függ a dolog. Mit mond olvass tovább...

- Gáspár Csaba

A napokban sokan megkerestek milyen oktatásokat tartunk a közeljövőben, milyen BME-s előadásokat fogunk megnyitni a külsősök előtt, milyen cégre szabott oktatásokat lehet kérni tőlünk. Hogy ne csak azt mondhassuk, hogy a kövessétek a blogot, arra gondoltam jó ötlet gyűjteni az érdeklődők elérhetőségeti: Ha szeretnél értesítést kapni előzetesen azokról a data science és big data oktatásokról, melyekben részt veszünk, regisztráld magadat az alábbi oldalon: Érdeklődőként való regisztráció A blogon olvass tovább...

- Gáspár Csaba

A Nagy Könyvben az áll, hogy egy valamirevaló adatbányászati / adatelemzési projektet a CRISP-DM (Cross Industry Standard Process for Data Mining) metodika szerint érdemes menedzselni. Eszerint egy projektnek hat fő fázisa van, (1) első lépésben megértjük az üzleti problémát, majd (2) a hozzá kapcsolódó adatokat, (3) adatátalakításokat végzünk, (4) gépi tanulási vagy statisztikai modelleket futtatunk, (5) kiértékeljük a kapott eredményeket üzleti szempontból, és persze ha minden klappol, akkor ( olvass tovább...

- Gáspár Csaba

Az big data megoldásokban rejlő lehetőségek kihasználása nem tekinthető pusztán IT feladatnak. Erre a területre is igaz, hogy akkor tudják hatékonyabbá tenni egy-egy vállalat működését, ha az adatvezérelt gondolkodás vezetői szinten is gyökeret ver. A technológiai oldalról számtalan lehetőség van arra, hogy egy a data science vagy big data téma iránt érdeklődő szakember belekóstoljon ezekbe a témákba, csak gondoljunk arra a rengeteg technológiai meetupra, ami ma Budapesten elérhető a nagyközönsé olvass tovább...