Hogy tehetjük adatok alapján jobb hellyé a világot? – Például a kaggle aktuális versenyeivel

Dmlab

2019.04.18. • olvasási idő:

Aki adatokkal foglalkozik, az biztosan találkozott már a Kaggle versenyeivel, és az ott szabadon felhasználható adatkörökkel. Ha szeretnél te is gyakorolni, és próbálkozni úgy, hogy közben valami társadalmilag is hasznosat hozol létre, megmutatjuk, hogy minek érdemes nekivágni.

Aktuális versenyek:

1. Örökbefogadás előrejelzés – mennyire cuki az a kutya?

Még nyitva van az a verseny, ahol a PetFinder.my bocsájtotta adatbányászok rendelkezésére az örökbefogadási adatait, amiket 2008 óta gyűjt, és több, mint 150 ezer kutya adatait tartalmazza.

A cél, hogy olyan algoritmus szülessen, ami előrejelzi, hogy egy adott kép és annak a metaadatai alapján mennyire találják cukinak az adott kutyákat a potenciális örökbefogadók. A cél, hogy mesterséges intelligenciával egy képelemző algoritmus szülessen, ami megjósolja, hogy mennyi ideig fog tartani az adott kutyát örökbeadni.

A legpontosabb predikciót készítő felhasználó 25 ezer dollár díjazásban részesülhet, és akár munkát is kaphat ebben a mesterséges intelligencia projektben.

2. CarreerVillage.org – kinek kellene feltenni a karrierrel kapcsolatos kérdéseket?

A CareerVillage 5 év szöveges adatait tette elérhetővé a Kaggle felhasználói számára, hogy előrejelezzék, hogy milyen típusú karrier kérdéssel melyik önkénteshez érdemes fordulni. A platformon 3,5 millió diák van regisztrálva, akiknek 25 ezer önkéntes segít. Vagyis minden egyes önkéntesre 500 diák jut. A Google és a CareerVillage versenyének célja, hogy egy algoritmus segítségével megjósolja, hogy milyen kérdéssel melyik önkénteshez érdemes fordulni. A verseny díjazása 15 ezer dollár.

3. Földrengés előrejelzés – mikor jön, milyen erős lesz és mekkora területet érint?

Ebben a versenyben valósidejű szeizmikus adatokat bocsájt rendelkezésre a Los Alamos National Laboratory, amik alapján azt kell előrejelzni, hogy mennyi idő van a következő földrengésig. Minél pontosabb az előrejelzés, annál hatékonyabban lehet megelőzni az anyagi és emberi veszteségeket. A verseny győztese 50 ezer dollárt vihet haza.

Lezárt versenyek – ezekkel is érdemes kísérletezni, ha úgy érzed, hogy tét nélkül könnyebb, ráadásul a saját megoldásod össze is tudod hasonlítani a legjobbal.

1. Mérgező kommentek – ki nehezíti meg az online diskurzust?

Az internetes fenyegetések és zaklatások azt eredményezik, hogy sok ember felhagy a véleményének megosztásával, és a sajátjától eltérő vélemények olvasásával. A legtöbb platformnak kihívást jelent, hogy hatékonyabbá tegye a diskurzust, és sok platformon korlátozzák, vagy megszüntetik a kommentelési lehetőséget.

A Conversation AI csapata olyan eszközöket fejleszt, amik javíthatják az online beszélgetések minőségét. A kutatás egy része kifejezetten a negatív kommentekre fókuszál. Ebben a versenyben az a feladat, hogy olyan modellt építs, ami képes kategorizálni a negatív kommenteket, hiszen van olyan platform, amely csak a káromkodást akarja szűrni, míg a másiknak kifejezett célja a fenyegető, gyűlölködő kommentek szűrése. A versenyhez kapcsolódó adatkör a Wikipedia talks kommentjeit tartalmazza.

2. Emberi behatások az Amazon vidékén űrfelvételek alapján – hol, hogyan és miért irtjuk az esőerdőt?

Az emberiség minden egyes percben pusztítja a föld tüdejének is nevezett Amazon menti esőerdőket. Ennek köszönhetően csökken a biodiverzitás, élőhelyek szűnnek meg, és változik az éghajlat is. Pontosabb adatok alapján támogathatjuk a döntéshozókat és a kormányokat abban, hogy gyorsabban és hatékonyabban lépjenek fel akár a kismértékű erdőirtások ellen. A Planet tervezte és építette azokat a képalkotó műhold kombinációkat, amik hamarosan naponta gyűjtenek képeket a teljes földterületről, 3-5 méteres felbontásban. Ebben a versenyben a felhasználók ezeket a képeket elemzik annak érdekében, hogy meg tudják különböztetni az ember által okozott erdőfelület csökkenést a természetestől.

Vissza a blogbejegyzésekhez

Hozzászólások

Kapcsolódó blogbejegyzések

A legnépszerűbb adatvizualizációs eszközök. Mit válasszak?

Az adatelemzés legszexibb része az adatokból kinyert információk és összefüggések vizuális megjelenítése. Sokan ezeken a vizuális eszközökön keresztül...
Balogh Nóra

Elolvasom

Online data science képzések

Rengeteg olyan emberrel találkozunk nap mint nap, akik maguk is szeretnének megismerkedni a data science egyes részeivel. A kérdéseik fókuszában soksz...
Mihalkó Barnabás

Elolvasom

OKR módszer a gyakorlatban

A ti csapatotok milyen stratégiai célokat követ? Hogyan választja ki azokat a végtelen lehetséges irány közül? Hogyan méritek a célok elérése felé tet...
Mihalkó Barnabás

Elolvasom