R package Czechia, Jindra Lacko / GeoBusiness

Pracujete s jazykem R a potřebujete vizualizovat zeměpisná data České republiky? Jindřich Lacko v depozitáři tzv. R balíčků publikoval svůj, který pojmenoval RCzechia.

Důvody pro vytvoření

Jindřich Lacko na svém blogu popisuje důvody, proč balíček vzniknul.

„Při práci s geografickými daty v kontextu České republiky jsem narazil na to, že Rkový svět je hodně stavěný na realitu anglicky hovořících zemí, zejména Ameriky. Je mnoho a mnoho zdrojů pro kreslení územních celků a celečků USA, ale naše obce a okresy aby člověk hledal s Jiráskovo lucernou.

K dispozici sice je Arc500, se kterým se z Rka dá přes rgdal jakž takž pracovat – ale není to ani úplně uživatelsky vstřícné, ani triviální (například použitý způsob kódování češtiny jsem vůbec nepochopil, a souřadnicový systém ing. Křováka je poněkud folklórní téma).

Tak jsem si shapefily upravil a přetvořil do datové package RCzechia, kterou tímto nabízím k použití. Souřadnicový systém je převedený z Křováka na WGS84, které se více kamarádí s google aplikacemi a Rkovými knihovnami.

Z technických příčin (CRAN přijímá balíčky pouze do velikosti 5 MB) nebylo možné objekty uložit v rámci package, a musím je volat externě (technicky jsou uložena na Amazon S3). Práce s packagí tudíž vyžaduje fungující intenetové spojení, a některé objekty – největší potížisté jsou polygony obcí s 36 MB – se mohou stahovat déle. Za zařazení package na CRAN mi to přišlo jako přijatelná cena.“

Obsah R balíčku Czechia

  • republika: hranice České republiky.
  • kraje: 14 krajů České republiky, včetně Hlavního města Prahy.
    Klíč pro připojení dat je KOD_CZNUTS3 (kód kraje).
  • okresy: 76 okresů České republiky + Praha (která technicky není okres).
    Klíč pro připojení dat je KOD_LAU1 (kód okresu).
  • orp_polygony() 206 obcí s rozšířenou působností (trojkové obce).
    Klíč připojení dat je KOD_ORP.
  • obce_polygony: 6.258 obcí a vojenských újezdů České republiky.
    Klíč pro připojení dat je KOD_OBEC, v datech jsou navíc informace o příslušné obci s pověřeným obecním úřadem (tzv. dvojkové obce – KOD_POU, respektive NAZ_POU) a příslušné obci s rozšířenou působností (tzv. trojkové obce – KOD_ORP, respektive NAZ_ORP).
  • obce_body stejné jako obce polygony, ale pouze středy.
  • casti: primárně 57 městských částí Hlavního města Prahy, ale části jsou i pro Brno a další města.
    Klíč pro připojení dat je KOD.
  • reky: Řeky České republiky. Přidáním do mapy pomohou základní orientaci.
  • plochy: Vodní plochy České republiky. Přidáním do mapy pomohou základní orientaci.

Všechny objekty jsou technicky realizovány jako funkce vracející data frame, a volají se proto se se závorkami.

Příklady použití

Jindřich Lacko ukazuje na příkladech, jak se jeho balíček dá použít. Můžete například vizualizovat počet obyvatel po okresech, dohledat body a zakreslit souřadnice na mapě, ukázat nezaměstnanost v jednotlivých obcích České republiky, nebo zjistit vzdálenost z Prahy do Brna.

[převzato se svolením autora z blogu Jla-data.net]

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *