Hol van dugó Varsóban?
Egy érdekes adatbányászati versenyről szeretnék nektek beszámolni, melynek eredményét a napokban hirdették ki.
Az ICDM konferenciához köthető versenyeket szerintem mondhatjuk a második legrangosabb évente megrendezésre kerülő megmérettetésnek, ezért is örültünk nagyon, mikor nyár elején kiderült, hogy az idei IEEE ICDM Contest feladata a közúti forgalom előrejelzéséhez köthető. Aki rendszeres olvasónk az talán korábbi blogbejegyzéseinkből tudja, hogy az IKTI néhány lelkes kutatójával együtt a BelAmI projekt keretein belül pont egy ilyen problémán dolgozunk a mytraffic.hu oldalhoz köthetően.
A verseny során Varsó úthálózata felett három alfeladatot határoztak meg a szervezők.
- Konkrét útszakaszok forgalmát kellet előrejelezni az alapján, hogy milyen forgalom volt eddig az útvonalon (ez volt a legnépszerűbb feladat).
- Meg kellett mondani, hogy az egyes útszakaszok milyen sorrendben válnak járhatatlanná (szekvenciák előrejelzésére volt visszavezethető a feladat).
- Az utolsó feladatnál GPS adatok alapján figyelhettük, mi történik az egész városban, és ez alapján kellett 100 kiválasztott útszakaszon rövid és középtávú előrejelzést tennünk a várható forgalmi viszonyokra (mekkora lesz az adott útszakaszon az átlagsebesség).
Mindhárom területen idő hiányában nem dolgoztunk, hanem kiválasztottuk egyből a harmadik, egyben legnehezebb feladatot. A nehézségre jellemző, hogy míg az első problémára több mint 100 megoldás érkezett, addig a harmadikra csupán 17. Ennek oka pedig abban keresendő, hogy ennyi adatelőkészítési teherrel még sosem láttunk adatbányászati versenyt.
Először is az autók GPS mozgását rá kellett vetíteni Varsó úthálózati gráfjára. Ez a korántsem triviális feladatra céleljárást kell fejleszteni. Szerencsékre hasonló problémát az IKTI-ben dolgozó kollégák már oldottak meg a mytraffic.hu kapcsán is, ennyi előnyünk már volt a többiekkel szemben. Ezt követően különféle a célba vett 100 útvonalhoz egyenként saját attribútumhalmazt kellett generálni úgy, hogy a bemenetünkön tipikusan gráfinformációk voltak elérhetők. Itt a szokásos 80-20 szabály az adatelőkészítés és modellezés közötti arányra teljesen felborult, sőt a modellezésre igazán nem is maradt elég idő. (Mire nem jó, ha logolja az embere a munkaidejét: szinte leírni is alig merem, de nálam a modellezésre a versennyel kapcsolatos összes munkám alig másfél százaléka jutott, pedig az utolsó éjszaka a modellezés jelentős része rám hárult.)
Mint sok más versenynél, most is jól jött volna, ha egy nappal később van a határidő. Az utolsó 10 percben három olyan megoldást is beküldtünk, ami jelentősen jobb volt az előzőnél.
Végül nagy örömünkre a hetedik helyet sikerült elérnünk a csapatunkkal, ami most speciális módon “BME-TMIT + BAY-IKTI” színekben indult. Köszönet a munkában résztvevő kollégáknak, név szerint:
- Prekopcsák Zoltán – BME-TMIT
- Gáspár-Papanek Csaba – BME-TMIT
- Parisek Zsolt – BAY-IKTI
- Ruzsa Zoltán – BAY-IKTI
- Szigeti János – BAY-IKTI
Még nem tudjuk mi lesz a következő verseny, amire benevezünk, ha valakinek van ötlete, talált egy jó lehetőséget, ne habozzon megosztani velünk.