Dopravní analýzy – cvičení 5

Hodnocení dopravní dostupnosti dle dat z Databáze dopravních spojení

Doposud jsme se ve cvičeních zabývali převážně individuální dopravou. V tomto cvičení si představíme možnosti analýz v oblasti veřejné hromadné dopravy a to na příkladě využití dat z jízdních řádů. Nutno podotknout, že tento přístup nebývá ve světě příliš rozšířený a to především z důvodu centralizace jízdních řádů v jiných státech světa.

Databáze dopravních spojení

Jedním z příkladů využití jízdních řádů pro dopravní analýzy je Databáze dopravních spojení. Ta je vyvíjena a aktualizována na Institutu geoinformatiky již od roku 2006 a obsahuje dopravních spojení mezi všemi obcemi ČR ve vzdálenosti do 100 km vzdušnou čarou (více jak 12,5 milionů záznamů). Databáze vznikla pro pro potřeby Integrovaného informačního portálu MPSV ČR a další činnosti MPSV a úřadů práce a byla každoročně třikrát aktualizována v závislosti na největších změnách jízdních řádů v červnu a v prosineci a navíc ještě v průběhu března a to vzhledem k častým drobným úpravám v prvních měsících roku. V rámci portálu byla/je databáze využívána pro možnost definování oblastí, kde může nezaměstnaný najít volné pracovní místo evidované na úřadech práce. Často je totiž právě nedostatečná dopravní dostupnost limitujícím prvkem při možnosti hledání zaměstnání. V roce 2008 byla databáze rozšířena o další údaje, jako je například existence zpátečního spojení po skončení pracovní směny (Fojtík, Horák, Ivan, 2009). Po reformě úřadů práce již nadále nevyplývala povinnost pro zaměstnavatele hlásit volná pracovní místa jednotlivých úřadům práce (1. 1. 2012) a nebylo tak již potřeba databázi pro tyto potřeby aktualizovat. S novými aktualizacemi se začlo zase až v roce 2014, kdy bylo opět navázáno na spolupráci s Ministerstvem práce a sociálních věcí. Existují tak databáze dopravních spojení mezi obcemi ČR za období 2006 – 2014, její struktura je zobrazena v tabulce níže.

Vzhledem k primárnímu cíli databáze, kterým je podpora nalezení vhodných volných pracovních míst, tak rovněž paramatetry dopravních spojení veřejnou hromadnou dopravou byly tomuto cíly podmíněny. Tyto parametry zůstávají stále stejné a umožňují tak hodnotit také vývoj a změny v čase. Aby tak bylo spojení zařazeno jako platné, musí splnit následující parametry (Fojtík, Ivan, Horák, 2011):

  • příjezd do cíle nejpozději v 6:00, 7:00 a 8:00 (ranní směna), ve 14:00 (odpolední směna) nebo ve 22:00 (noční směna),
  • příjezd do cíle nejdříve 60 minut před plánovaným začátkem směny,
  • odjezd z počátku nejdříve 120 minut před plánovaným začátkem směny,
  • doba cestování pro cestu tam či zpět nesmí překročit 90 minut,
  • maximálně 5 přestupů během cesty tam či zpět,
  • zpáteční spojení má odjíždět ideálně 15 minut po skončení pracovní doby,
  • nebyly využívány prostředky městské hromadné dopravy.

databaseDS

Databáze obsahuje více jak 12,5 milionů kombinací obec-obec v jednom směru a pro každou kombinaci se hledají spojení na 5 různých časů, celkem se tedy hledá více jak 125 milionů spojení veřejnou hromadnou dopravou. K tomu se ještě později připojilo hledání zpátečních spojení a tak se počet zdvojnásobil.

S rostoucím počtem hledaných spojení mezi obcemi, způsobené mimo jiné hledáním zpátečních spojení, bylo potřeba vyvinout novou metodu, která celý proces vyhledávání plně automatizuje. Postupně bylo vyvíjeno řešení založené na technologii klient-server, kde serverovou část tvořila databáze MS SQL serveru (nejdříve ve verzi 2005 a aktuálně ve verzi 2008). Databáze obsahuje všechny hledané kombinace obcí a také uchovává všechna nalezená spojení. Klientskou část je tvořena sadou cca 50 počítačů se speciálně vyvinutým softwarem TRAM, jež provádí vlastní vyhledávaní spojů v jízdních řádech. Klientská aplikace je vyvinuta na platformě .NET a naprogramovaná v MS Visual Basic 2008. Vyhledávací algoritmus je optimalizován pro vícenásobné spuštění klientské aplikace a tak je možnost plně využít vícejádrové procesory a tak výrazně znásobit počet klientů. Prakticky bylo vyzkoušeno zapojení celkem 200 klientů, kteří byli schopni vyhledat celou databázi spojení mezi obcemi do 24 hodin. V současnosti je vyvíjena aplikace pro 64bit operační systém a v součinnosti s novou 64 bitovou knihovnou firmy Chaps je možné předpokládat další zkrácení času potřebného pro vyhledání celé databáze na poloviční čas.

ukNaším cílem je hodnotit dostupnost obcí v České republice pro dojížďku na 8. a na 22. hodinu pro situaci z jízdních řádů z prosince 2014. Dostupnost obcí si definujeme jako počet obcí, které jsou dostupné veřejnou hromadnou dopravou z dané obce, ku celkovému počtu obcí do 100 kilometrů vzdušnou čarou od dané obce. Pokud bychom hodnotili jen počet odstupných obcí, tak by výsledky silně ovlivňoval hraniční efekt.

Datové podklady

Využijeme dva datové zdroje. Prvním budou data z Databáze dopravních spojení z prosince 2014. Z dat byly vymazány kombinace obcí, mezi kterými neexistuje žádné spojení a zároveň byly odstraněny záznamy o spojeních pro jiné časy. Druhým zdrojem pak jsou administrativní hranice obcí, které pocházejí z Registru sčítacích obvodů a budov (ČSÚ).

Postup

Analýzu zahájíme výpočtem daného ukazatele pro 8, resp. pro 22 hodin, pro který si musíme vypočítat obě hodnoty – počet dostupných obcí a počet obcí do 100 km. Vzhledem k velkému objemu dat, budeme pracovat v prostředí databáze MS Access. Importujeme si tabulku do nově vytvořené databáze a vytvoříme výběrový dotaz, ve kterém vybereme jen kód počáteční obce a sloupce s délkou spojení na 8 a 22 hodin. Dotaz agregujeme tak, abychom získali počet nenulových záznamů. Tímto postupem získáme počet dostupných obcí na dané dvě hodiny.

Potřebujeme však získat také jmenovatel, tedy počet obcí do 100 km vzdušnou čarou. Tento údaj zjistíme opět v ArcMap a z dat z UIR-ZSJ, který jsme využili již v minulém cvičení. Z tabulky obce.dbf získáme bodovou vrstvu obcí v ČR. K výpočtu vzdálenostní matice (tentokrát ne cestní vzdálenosti, ale přímé vzdálenosti) využijeme funkci Point Distance. Jako počátek i cíl vložíme stejný zdroj dat (obce ČR), definujeme výstupní tabulku a jako prahovou vzdálenost definujeme 100 km. Výsledná tabulka obsahuje tři sloupce, ve dvou je identifikátor obcí a ve třetím pak přímá vzdálenost v metrech.

point_dist

Tuto tabulku importujeme opět do prostředí databáze a s využitím výběrového agregačního dotazu zjistíme počet záznamů (cílových obcí) pro kódy obcí počátku. Tímto postupem tak zjistíme také hodnotu jmenovatele a obě hodnoty v dotazu spojení a vypočteme požadovanou hodnotu výsledného ukazatele podílu dostupných obcí na 8 a 22 hodin. Výslednou tabulku, která by měla obsahovat 6253 záznamů (stejně jako počet obcí), exportujeme a importujeme do programu ArcMap, kde tabulku připojíme k vrstvě obcí. Následně již můžeme výsledky vizualizovat. Vytvoříme mapový výstup se dvěma mapovými okny, kde v jednom zobrazíme údaje pro dojížďku na 8 hodinu a ve druhém pak dojížďku na 22 hodinu.

dostupnost

ukSamostatným úkolem pak je zhodnocení tzv. míry nevratnosti. Což je počet spojení mezi obcemi, kde se dá vrátit z cíle do počátku po 8 hodinové pracovní době. Tedy jedná se o podíl počtu dostupných obcí oběma směry ku počtu dostupných obcí jedním směrem. Oba sloupce o počtu obousměrných spojení na 8 a 22 hodin naleznete v datech.

Data

Z licenčních důvodů jsou veškerá data dostupná na FTP disku v intranetu. Přihlašovací údaje budou předány na daním cvičení.

Cvičení bylo vytvořeno díky finanční podpoře projektu FRVŠ 80/2014, kterému za podporu děkuji.