Online data science képzések - Dmlab

Online data science képzések

Mihalkó Barnabás

2021.09.02. • olvasási idő:

Rengeteg olyan emberrel találkozunk nap mint nap, akik maguk is szeretnének megismerkedni a data science egyes részeivel. A kérdéseik fókuszában sokszor az áll, hogy hol induljanak el. Soha nem látott mennyiségben van lehetőségünk online data science képzésekből válogatni. Az alábbi szubjektív gyűjtésben a csapatunk tagjainak személyes ajánlásait olvashatjátok a mi kedvenceinkről.

A Magyarországról elérhető jelenléti oktatásokat korábban már összegyűjtöttük ebben a folyamatosan frissülő blogposztban, most pedig az utóbbi években virágzásnak induló online kurzusok közül szemezgettünk.

Online data science képzések kimeríthetetlen tárházából választhatunk, nehéz kiszűrni, melyik az igazán hasznos, nekünk való alternatíva. Az alábbi lista azokat a képzéseket mutatja be, amelyeket mi is elvégeztünk, így személyes tapasztalatainkkal szeretnénk segíteni neked, hogy megtaláld a számodra leginkább megfelelő opciót.

Saját képzéseink

2020 tavaszán mi is elindítottuk online kurzussorozatainkat data science és adatvizualizáció területén. Fő célunk egy olyan képzés létrehozása volt, ami az elméleti alapok lefektetése mellett hasznos gyakorlati tudás elsajátítását teszi lehetővé a résztvevők számára. Ráadásként az oktatási anyagokhoz (videók, prezentációk, adathalmazok és példaelemzések) korlátlan ideig tartó hozzáférést biztosítunk.

Csapatunknak van hazánkban a legnagyobb tapasztalata az adatelemzés oktatásában. Mi nemcsak tanítjuk, hanem a mindennapokban üzleti projektekben használjuk is ezeket a technológiákat. Tizenöt éve oktatunk egyetemen, egyedi vállalati programokban és üzleti képzéseken egyaránt. Hazai konferenciák gyakori előadóiként tapasztalatainkat és legújabb megoldásainkat a szakmával is rendszeresen megosztjuk. Az érdeklődők szakmai blogunkon is olvashatnak munkáinkról és az adatos világgal kapcsolatos gondolatainkról.

Dataskool – Data Science képzés

Helyszín: Távoktatás, élőben streamelt, visszanézhető közös órákkal

Képzés nyelve: magyar

Időtartam: 6 hét, heti 2×2 óra

Következő képzés indulása: 2022. szeptember

Weboldal: dataskool.hu – Data science képzés

Szerintünk: A képzés megalkotásakor 13 év tapasztalatát használtuk fel és az a gondolat lebegett a szemünk előtt, hogy a data science iránt érdeklődők számára egy olyan képzést nyújtunk, amivel a legfontosabb alapok elsajátíthatók, a leggyakrabban használt gyakorlati skillek megtanulhatók. Valós adatok, valós üzleti problémák vannak a fókuszban, amit gépi tanulási technikákkal oldunk meg. Python alapokon dolgozunk, de a fókusz az adatelemzésen van, így ha most kezdesz el programozni, akkor is remek választás ez a képzés.

Nóri tapasztalatai

Getting Started with Spark 2

Képzés nyelve: angol

Időtartam: 2,5 óra 

Ár: Ingyenes (első 10 nap), utána $29 / hónap

Weboldal: https://www.pluralsight.com/courses/spark-2-getting-started

Nóri szerint: Már korábban is ismerkedtem a big data alapjaival és a Spark architektúrával. A munkám kapcsán egy átfogó, felfrissítő, dolgokat összefoglaló képzésre volt szükségem, amit meg is kaptam. Azoknak ajánlanám, akik elosztott rendszerekkel és big datával szeretnének foglalkozni. A képzéshez jó, ha rendelkezel data science alapokkal, ismered a Pandas könyvtárat és szeretnél megismerkedni a DataFrame-ek big datás megfelelőivel.

SQL for Aspiring Data Scientists (Online Course)

Képzés nyelve: angol

Időtartam: 7 nap

Ár: $97 (+ÁFA)

Weboldal: https://data36.com/sql-for-aspiring-data-scientists-7-day-online-course/

Nóri szerint: A képzés 7 napban szépen összeszed mindent, amit az SQL alapjairól tudni kell. Nagyon részletes, néha már szinte szájbarágós, de nagyon sok önálló feladat van, ahol jól be lehet gyakorolni az SQL alapjait. Sokat segített, hogy a mindennapjaimban gyorsan és hatékonyan tudjak SQL-t használni. Egészen kezdőknek is ajánlom!

Noémi tapasztalatai

DataCamp python bevezető képzései (Introduction to Python, Intermediate Python, Manipulating DataFrames with pandas)

Képzés nyelve: angol

Időtartam: 4 óra (egyenként)

Ár: éves előfizetés $149

Weboldal: www.datacamp.com 

Noémi szerint: Összességében lassúnak éreztem a DataCamp kurzusait. Lehet, hogy azért, mert már volt némi előismeretem pythonból. Nagyon szép az oldal felülete, jól érthetőek a magyarázatok és sok gyakorló feladat van, ami segíti a tanulást. Viszont az volt az érzésem, hogy túlságosan felaprózódnak a feladatok, egy-egy függvény begyakorlására helyezik a hangsúlyt, nem egy nagyobb probléma megoldására. Az alapokat meg lehet belőle tanulni, de nem helyettesíti a saját projekteken való tapasztalatszerzést. Azt gondolom, hogy ezeket az információkat könnyen meg lehet szerezni a python hivatalos dokumentációjából és ingyenesen elérhető segédanyagokból. Ha valaki csak ezeket a kurzusokat végezné el, azért nem éri meg előfizetni.

Introduction to Power BI

Képzés nyelve: angol

Időtartam: 6 óra

Ár: éves előfizetés: $149

Weboldal: https://www.datacamp.com/courses/introduction-to-power-bi

Noémi szerint: Ez egy rövid bevezető a Power BI alkalmazáshoz, így azoknak ajánlom, akik még soha nem találkoztak az eszközzel és szeretnének megismerkedni vele. Nagyon tetszik, hogy a virtuális környezetben ki is tudtam próbálni a tanultakat, nem volt rá szükség, hogy rögtön le is töltsem az applikációt. A tartalom szépen össze van rakva, érthetőek a magyarázatok. Sajnos általános tapasztalatom a DataCamp kurzusaival, hogy egy kicsit lassú a tempó. Örültem volna, ha több fér bele, vagy van folytatása, de az előfizetésem alatt még nem volt. A Dataskool Vizuális adatelemzés tanfolyamából többet tanultam. (Most már van egy Data Modeling in Power BI kurzus 4 órában, erről nem tudok nyilatkozni.)

Intermediate Data Visualization with Seaborn

Képzés nyelve: angol

Időtartam: 4 óra

Ár: éves előfizetés $149

Weboldal: https://www.datacamp.com/courses/intermediate-data-visualization-with-seaborn

Noémi szerint: Ahogy a neve is mutatja, ez egy haladó vizualizációs kurzus. Mindenképp szükség van hozzá matplotlib alapokra. Ha ez megvan, akkor jól követhető és átfogó képet ad a seaborn csomag nyújtotta lehetőségekről.

Feri tapasztalatai

Mivel a programozási, data science és az ezekhez fontos matematikai ismeretek önállóan tanultam meg, ezért felhatalmazva érzem magam, hogy megosszam az ismereteimet a témával kapcsolatban.

Ha nem is egy az online kurzusok világában oly népszerű zero-to-hero, de egy zero-to-adequate practitioner ütemtervvel szolgálhatok a témában.

Általánosságban elmondható, hogy három területen kell az embernek folyamatosan fejleszteni a tudását, hogy egyre több mindent megértsen, és a gyakorlatban egyre jobban használható tudása legyen.

Fontossági sorrendben az első a programozás. Ez kicsit furcsának tűnhet, sokan sorolnák hátrébb, de a mély programozási ismeretek mind a koncepciók megértéséhez, mind pedig a használatához nélkülözhetetlenek. Egyrészt nekem – mint olyan embernek, aki jobban érti a dolgokat, ha a kezében forgatja – nagyon sokat segített egy-egy machine learning algoritmus megértése, ha láttam, megértettem, hogy nulláról, legalábbis pythonból megcsinálva hogyan működik. Másrészt bármilyen probléma gyakorlati megoldásánál elkerülhetetlen hogy kisebb-nagyobb úgymond ‘bug’-okba ne futnánk, és bizony van jó pár, ahol erős programozási tudás nélkül nagyon nehezen fogunk boldogulni.

A második a data science skillek, itt két külön ág fut. Az első az adatok kezelése. Ebbe beletartozik bármilyen formájú adat beolvasása, formázása, értelmezése, tisztítása, mindennemű feldolgozása ahhoz, hogy egyáltalán esélye legyen a később kiválasztott  machine learning algortimusnak feldolgozni. Itt szükségünk lesz főleg általános programozásra, SQL ismeretekre, Pandas ismeretekre. Ezeket fontos lesz alaposan ismerni, mert egy data science projekt nagyobb részében ezeket a folyamatokat fogjuk időnként többször végigjátszani. Továbbá ha nagy adathalmazzal kell dolgoznunk, vagy egy kész, élő terméket állítunk elő, fontos lesz ismerni a cloud technólógiákat, és a nagy adatok mozgatására, működtetésére létrehozott technológiákat, de ez már egy specialista a – data engineer – feladata.

A másik ág a különböző machine learning algoritmusok, rendszerek alapos ismerete. Ez lesz a lelke a projektünknek, mindent azért csináltunk eddig, hogy ide betöltsük az adatainkat, hogy ebből tanulva remélhetőleg megkapjuk az általunk remélt eredményt. Ez egy végeláthatatlan utazás, becslésem szerint nagyjából napi háromszáz publikáció jelenik meg a témában, újabb és újabb utakat keresve, amivel eddigieknél könnyebben, vagy akár más problémákat is képesek lehetünk megtanulni. De ettől senki ne csüggedjen, bár rosszabb közhellyel nem igen élhetnék, de mindenki a nulláról kezdte.

És végül maradtak a matematikai ismeretek. Bár utoljára hagytam, de semmiképp nem nevezném elhanyagolhatónak. Ugyanis lényegében semelyik machine learning algoritmust se fogjuk tudni rendesen megérteni, ha nem rendelkezünk legalább alaptudással a valószínűségszámítás, lineáris algebra és calculus témakörében.

Ezután a rövid általános összefoglaló után a fenti sorrendet követve rátérek, hogy a különböző technikákat, technológiákat, hol érdemes megtanulni, amennyiben képesek vagyunk fegyelmezetten, kitartóan önállóan végigmenni ezen az úton.

Programozás

Valamiért a programozásnál tudok a legkevesebb online kurzussal, vagy megfogható anyaggal szolgálni, itt ha már tudjuk az alapokat, akkor a legjobb, hogy elmélyítjük a tudásunkat gyakorlással, fórumozással, algoritmikus feladatok megoldásával (pl.: leetcode). Azért akad pár dolog, amit tudok ajánlani; online kurzusok mellett néhány meghatározó könyvet gyűjtöttem össze.

Kezdőknek

Ai Sweigart: Automate the Boring Stuff with Python

Lényegében ez az abszolút első számú könyv, ha valaki kezdőként pythont akar tanulni. Gyakorlatias tematikájával, és érthető magyarázatával méltán népszerű, ráadásul ingyenesen elérhető, továbbá videós verziója is van youtube-on.

Weboldal: https://automatetheboringstuff.com/

Gerard Swinnen: Tanuljunk meg programozni python nyelven

Szintén ajánlom ezt a magyarul is megjelent könyvet bárkinek, aki a teljes alapoktól szeretnél kezdeni a python programozást. Hátránya, hogy python 2.x verziót használ a könyvben, de remek a tematika, és nagyon jó feladatok vannak benne.

Weboldal: https://mek.oszk.hu/08400/08435/08435.pdf

Haladóknak:

Már haladóknak ajánlanám a Python Cookbook: Recepies for Mastering Python 3, illetve a Fluent Python című könyveket, ahol hosszú oldalakon mennek végig, hogy különböző területeken felmerülő problémákat hogyan lehet ‘pythonikus’ módon megoldani.

Végül pedig talán a legfontosabb, és legjobb programozós kurzus, amivel találkoztam Dimitri Nesteruk: Design Patterns in Python című kurzusa az Udemyn. Bemutatja részletes és bonyolult példákon keresztül, hogyan lehet különböző komplex feladatoknak a programtervezését megcsinálni, hogy könnyen lehessen a későbbiekben hozzányúlni, továbbfejleszteni, skálázni.Legvégül ajánlok egy oldalt, ami még elő fog jönni. A brilliant.org-on az összes kurzus kiváló arra, hogy valamiben elmélyítsük a gyakorlati tudásunkat, ezen az oldalon végig nehezedő feladatok mentén tanulunk. Erősen ajánlom az összes kurzusukat computer science témában (is).

Data science skillek

Kezdőknek:

Udemy – Jose Portilla: Machine Learning Bootcamp

Képzés nyelve: angol

Időtartam: 25 óra 

Ár: € 84.99

Weboldal: https://www.udemy.com/course/python-for-data-science-and-machine-learning-bootcamp/

Feri szerint: Jose Portilla a bootcampjében ugyan nagyon felszínesen, többnyire intuíciókkal, de végigmegy a teljes data science ökoszisztémán. Nagyon gyakorlatiasak a kurzusai, jó angolsággal, érthetően magyaráz, de nem megy bele igazán mélyen, így elég könnyen emészthető.

Bátran ajánlom Jose Portilla további kurzusait azoknak, akik most ismerkednek a területtel, vagy egy-egy témába egy picit bele akarják ásni magukat. 

 

Josh Starmer: Statquest (Youtube)

Ez egy rettenetesen jó csatorna, ahol szinte az összes machine learning-hez fűződő koncepcióról, algoritmusról, elméletéről van videó, nagyon barátságosan, érthetően, de alaposan. Szinte minden fent van, ami számít!

Link: https://www.youtube.com/user/joshstarmer

Haladóknak:

Nando de Freitas (Youtube)

Nando de Freitas az Oxford Egyetemen előadó, jelenleg a Deepmind kutatója, aki nagyon jó példákon keresztül vett egyetemi előadásait tette közzé csatornáján. Természetesen inkább elméleti tudást tudunk itt felszedni, de ebben jobbat nehéz lenne találni.

Link: https://www.youtube.com/user/ProfNandoDF

Lazyprogrammer Inc. (Udemy)

Itt külön kurzust nem emelnék ki. Az előadó egy híd az akadémia elméleti és az online kurzusok gyakorlati dimenziója között. Olyan előadót nehéz találni, aki nála alaposabban végigmegy a machine learninges módszereken, mindent az alapjaitól leprogramoz numpy-ban, emellett másik nagy előnye, hogy megtaláljuk nála a legfrissebb deep learninges koncepciókat, amikre más kurzusokban nehéz ráakadni. Ha valaki nem bánja, hogy elég sok képlet felkerül a képernyőre, biztosan nem fog csalódni. Messze a kedvenc előadóm.

Weboldal: https://www.udemy.com/user/lazy-programmer/

Matematikai ismeretek
Grant Sanderson: 3Blue1Brown (Youtube)

Itt nem emelnék ki kezdő-haladót, csupán egy csatorna van, ami elképesztő könnyedséggel ismerteti meg a különféle matematikai koncepciókat. Sok mérnöknek a kommentjét láthatjuk a videók alatt, hogy hiába vizsgázott le valamiből, csak az ő videójából világosodott meg, hogy valójában mit is tanult meg.

Link: https://www.youtube.com/channel/UCYO_jab_esuFRV4b17AJtAw

Emellé szintén tudom javasolni a brilliant.org kurzusait probabilty, linear algebra és calculus témában. Ezzel a kettővel együtt el lehet sajátítani a data science alapjaihoz szükséges matematikai ismereteket.

István ajánlása

14 éve oktatom az adatelemzést egyetemi, vállalati, online vagy offline képzéseken egyaránt. Ha valaki engem kérdez akkor azt szoktam ajánlani, hogy tekintsen ezekre a kurzusokra úgy, mint egy olyan képzésre, ahol a kalapács helyes használatát tanítják meg. Ahhoz, hogy belőled igazán jó ács legyen, ennél többre van szükséged: rengeteg gyakorlásra. Minden projekt, minden üzleti probléma, minden adathalmaz különböző hozzáállást igényel, amelyeknél elengedhetetlen az eszközök ismerete, de fontosabb a gyakorlat során megszerzett adatelemzői észjárás.

Valahol azonban el kell kezdeni, ehhez viszont van egy remek tippem. Mint sok más esetben, az adatelemzés szerteágazó területén is az első lépés megtalálása és megtétele a legnehezebb. Mester Tomi több éves data science tapasztalatát sűrítette bele a Junior Data Scientist Akadémia kurzusba, amely ezt a biztos kezdő lépést jelenti. Az itt tanultak minden adatelemzéssel foglalkozó szakértő eszköztárának kötelező elemei. A képzésen nem csupán megtanulhatóak ezek az elméleti és gyakorlati alapok, hanem a napi adatelemzési munkában is azonnal felhasználható készséggé fejleszthetőek. Jó szívvel ajánlom Tomi kurzusát, hiszen ezekre az alapokra biztosan tudsz építkezni a továbbiakban akár milyen irányba szeretnél fejlődni a data science területén.

Összefoglalás

Az online data science képzések rengetegéből összegyűjtöttük azokat, amelyekhez saját tapasztalataink vannak, amiket szakmai szempontból értékelni tudunk. A bejegyzésben leírtak csapatunk tagjainak élményei alapján készültek, az ő megélésüket tükrözik. Reméljük, neked is tudtunk segíteni az választásban az online data science képzések közül.

A data scientistekkel és big data szakemberekkel kapcsolatos munkaerőhiány megoldására azonban egy másik lehetőség is van: a cégen belüli tehetségek képzése és belső adatos csapat építése. Mi a Dmlabnál évente számos alkalommal tartunk egyedi tematika mentén szervezett vállalati képzéseket, ahol a cégek munkavállalói valós problémák – nem ritkán saját on-the-job problémák – megoldása mentén tanulhatják meg a szükséges data science, gépi tanulás, AI vagy big data ismereteket, amelyeket a képzést követően egyből tudnak a napi munkájukban kamatoztatni.

Ha érdekel téged ez a lehetőség, az alábbi oldalon találsz bővebb információt.