Társadalmi izoláció egy data scientist szemével | Dmlab

Társadalmi izoláció egy data scientist szemével

Gáspár Csaba

2020.03.17. • olvasási idő:

Epidemiológusok szerint a társadalmi távolságtartás növelése hatékony módszer a COVID-19 vírus terjedésének lassítására a kiterjedtség jelen szakaszában. Az Európa szerte bevezetett intézkedések két cél között próbálnak egyensúlyozni: csökkentsük a lakosok találkozásainak számát, miközben a gazdaság védelme és az ellátórendszer fenntartása miatt valamilyen szintű mozgást meg akarunk még engedni. De honnan tudjuk, hogy az intézkedések hatására olyan szinten van a társadalmi izoláció, amit elvárunk? Hogyan lehet egy-egy intézkedés hatását mérni?

Mint adatelemzőket, minket elsősorban a valós események megfigyelése, az adatokból levonható összefüggések érdekelnek. Ezért mi is nagy érdeklődéssel néztük a hazai internetet bejáró statisztikákat a budapesti Waze felhasználók számának csökkenéséről. De igazán akkor érthetjük meg a hazai számokat, ha össze tudjuk hasonlítani azokat Európa más városainak értékeivel. Készítettünk egy dashboardot, amelyen látható, hogyan változott egy-egy európai nagyváros autóforgalma az elmúlt hetekben.

A hiteles összefüggések feltárása érdekében egy-egy város forgalmát az aktív Waze felhasználók számának maximumával mértük (ebből az adatból tudtunk visszamenőleg is megfelelő mennyiségű adatot gyűjteni a wazestat oldaláról). Arra voltunk kíváncsiak, hogy ha a januári, “békeidőnek” számító adatokat tekintjük egyfajta alapállapotnak, akkor ahhoz képest hogyan változott a forgalom a járvány kitörése óta. Egy hétfőt mindig egy átlagos januári hétfőhöz hasonlítottunk, egy keddet egy átlagos januári keddhez stb. Ezzel a heti szezonalitást elimináltuk, és kezeltük azt a problémát, hogy városonként más-más a mérete a Waze felhasználóbázisának.

A fenti dashboardot te is használhatod, mélyebben bele tudsz merülni az adatokba, kiválaszthatod melyik Európai főváros jelenjen meg a diagramon – az átláthatóság miatt alapból csak néhány várost láthatsz. A bal felső sarokban mind a megjelenítendő városokat, mind a vonaldiagram időtengelyét módosíthatod. Javasoljuk az egész képernyős munkát, ehhez a jobb alsó sarokban levő nyilat érdemes megnyomni. 

A dashboard elkészítésén túl áttekintettük a legfontosabb összefüggéseket is, ez alapján összefoglaljuk, hogy mit láthatunk most, 2020. március 17-én ezekből az adatokból:

Alapvetően négy csoportba lehet sorolni a mai adatok alapján a vizsgált városokat:

  • A leginkább “befagyott” városnak Róma, Madrid és Pozsony számít, ott egy januári keddi nap autós forgalmának alig több, mint 10% van az utakon.
  • 20%-os szint körüli csoportban van  Lisszabon, Bécs, Brüsszel és Amszterdam.
  • Budapest a 36-45% körüli nagy csomóba tartozik, ide esik Berlin, Párizs és Belgrád is. Budapest itt egy tipikus szereplőnek mondható, vannak mind régiósan mind összeurópai szinten néhány százalékkal kisebb, néhány százalékkal nagyobb értékkel fővárosok.
  • Egyetlen nagy lemaradó került a listába, London, ahol ma még egy normál keddi forgalom háromnegyede tapasztalható, Helsinkiben pont most tartanak a felénél a szokásos forgalomnak

 

 

Izgalmas azt is megfigyelni, hogy amikor egy-egy város lépett, mennyire gyorsan ürültek ki az utcák. Gyorsaságban Rómát és Berlint emelném ki, mindkét helyen két nap alatt tudták jelentősen csökkenteni az általunk definiált mutatót, de az elmúlt két nap eseményei Budapesten is a forgalom drasztikus  csökkenését eredményezték.

Milyen következtetést lehet levonni a bemutatott adatokból? Mint majd az internet különböző posztjaiban látni fogjuk, bármilyet. Mi ahhoz vagyunk hozzászokva, hogy a megrendelő döntéshozóival közösen értékeljük ki az eredményeket. Ekkor általában újabb kérdések, újabb elemzési feladatok merülnek fel. Újabb elemzésekre, más adatok bevonására most is nyitottak vagyunk: kommentekben is szívesen fogadjuk az ötleteketet vagy használd elérhetőségeinket (lásd a dmlab.hu oldal alján). 

Azért készítettük ezt a dashboardot a wazestat adatainak felhasználásával, hogy megkönnyítsük az adatok értelmezését, hozzájáruljunk a vírus megfékezéséhez, a tény alapú döntéstámogatás elterjedéséhez. Kérjük felelősen használjátok!

UPDATE:

A következő napokban az új adatok birtokában frissíteni fogjuk a diagramokat. Ha értesítést szeretnél kapni a nagyobb változásokról, vagy érdekes számodra az adat alapú döntéstámogatás, a data science világa, iratkozz fel hírlevelünkre.

Jelentkezés a dmlab hírlevelére