Rubriky
Nástroje a metody datové analytiky

Kontingenční tabulky a grafy

Další hodina s Excelem a další zjištění jak málo o něm vím a asi ještě dlouho vědět budu.

Tentokrát jsme probrali kontingenční tabulky a naťukli jsme vizualizaci. My jsme se u tabulek vyhnuli oblíbenému Covidu a ještě oblíbenějším volbám a vrhli se na pozitivní téma dopravních nehod v Brně. Po „nasosání dat“ do excelu jsme dostali velkou spoustu informací.

Postup byl jednoduchý:

  • Najít volně přístupná data, kde bude hromada údajů (https://data.brno.cz/datasets/298c37feb1064873abdccdc2a10b605f_0/explore?location=49.205381%2C16.584046%2C10.99)
  • Stáhnout je ve formátu CSV a otevřít v Excelu
  • Zjistit, že všechna data jsou napsaná v jednom sloupečku, oddělená čárkou a tím pádem dost nepřehledná
    • Starý postup: dát „Text do sloupců“, využít oddělovat a rozdělit do sloupců
    • Lepší způsob: Data -> Načíst data -> Ze souboru -> Z textu/CSV
      • Načíst a Importovat data -> otevře se Editor Power Query (když tak se tam dá dokliknout přes Dotaz -> Upravit) 

Přes Editor Power Query se dá měnit spousta věcí, měnit formáty, odstraňovat nepotřebné sloupečky, nahrazovat a opravovat text nebo tvořit funkce přes jazyk M.

A pak hurá na kontingenční tabulky. Za mě super věc se kterou se dá fakt hodně vyhrát. Díky nim můžeme zjistit třeba tyto informace:

Děje se nějaké zavinění více v noci? Ano, lesní zvěří, domácím zvířectvem

Je o víkendu průměrně více nehod s vlivem alkoholu nebo drog? Ano

Který měsíc je nejvíce nehod? Nejvíce nehod se stalo v říjnu, ale pokud bychom vypočítali průměr na den, tak nejhorší měsíc vychází červen

A určitě ještě spousta dalších zajímavých dotazů, hrát se s tím dá docela dlouho.

Poté jsme se vrhli na vizualizaci. Prvně jsme měli nějak upravit tabulku a vytvořit pár jednoduchých grafů podle svého nejlepšího svědomí a vědomí. Poté jsem probrali principy správné vizualizace a měli tabulku a grafy vytvořit znovu a lépe. Já jsem na toto asi úplně dutá, ale snad ty grafy po opravě vypadají o trochu lépe.

Základní pravidla:

  • Musí to být jednoduché
  • Zřetelné a lehce k přečtení
  • Přemýšlet jako koncový uživatel
  • 5-10 sekund musí být vše jasné
  • Vše zarovnané do pravého úhlu (vypadají upraveně)
  • Vyvarovat se rušících elementů
  • Použít správnou vizualizaci

Za mě úplně největší objev za celou hodinu jsou „Výstřižky“. Varianta jak si rychle a jednoduše překopírovat nějakou část zobrazených informací či náhled obrázků nebo tabulek a vložit je třeba na blog 😃. Super věc, která mi přijde velmi užitečná a dost mi usnadnila život.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *