Rubriky
Nástroje a metody datové analytiky

Závěrečný projekt – datová analýza

Jak to vypadalo s kriminalitou a zatýkáním v Anglii v letech 2018/19 – 2020/21 z pohledu etnických skupin, věku a pohlaví

Využité nástroje:

 • Excel pro prozkoumání dat a úpravy
 • PowerBI pro vizualizaci a zjištění odpovědí na položené otázky

Data:

Otázky na které chci v datech najít odpověď:

 • Jak se vyvíjel počet zatčených v Anglii v letech 2018/19 – 2020/21? Je zde stoupající nebo klesající tendence?
 • Ve kterém městě proběhlo za toto období nejméně / nejvíce zatčení?
 • Byli častěji zatčeny ženy nebo muži?
 • Má některá z 5-ti hlavních etnických skupin větší počet zatčených v určité věkové kategorii oproti ostatním skupinám?
 • Ve kterých 5-ti policejních oblastech bylo zatčeno nejvíce žen ve věku nad 21 let?
 • Jak se v posledních třech letech měnilo zastoupení zatčených vzhledem k etnické skupině?

Vysvětlení a úprava datasetu:

 • Soubor s daty:
 • Data stažena ve formátu .csv, importována do excelu
 • Při nahrání dat se zobrazilo, že dataset obsahuje 450 chybových řádků. Při bližším zkoumání jsem zjistila, že ve sloupci „Number of arrestes“ chybí na řádcích 9001-9450 informace o počtu zatčených. Zjistila jsem, že tato data zde nejsou zapsána, protože policejní oblast Lancashire v roce 2018/19 nebyla schopná dodat informace o počtu zatčených
 • Vysvětlení nejasných sloupců, doplnění nových:
  • Time – financial year neboli fiskální roky (v Anglii se jedná o období od 6.dubna do 5.dubna následujícího roku
  • Ethnicicty a Ethnicity_type – etnické skupiny zatčených. Tyto sloupečky byly komplikované, protože se zde využívá 4 různých zápisů. Pro rok 2018/2019 se využilo rozdělení na etnické skupiny podle sčítání obyvatel z roku 2001 (16+1, 5+1), v dalších dvou letech se však využilo rozdělení podle sčítání z roku 2011 (18+1, 5+1)
  • Pro zjištění relevantních informací jsem si vytvořila sloupec Ethnicity_subgroup, kde jsem si veškeré etnické skupiny rozdělila do 5+1 skupin (Asian, Black, Mixed, Other, White, All, Unreported). Informace jsem získala z oficiálních stránek
   • Pro převedení informací jsem využila vzorec IF:
   • =IF([@[Ethnicity_type]]=“ONS 2011 5+1″; [@Ethnicity]; (IF([@[Ethnicity_type]]=“ONS 2001 5+1″; [@Ethnicity]; (IF([@Ethnicity]=“Any Other Asian Background“;“Asian“; (IF([@Ethnicity]=“Any Other Black Background“;“Black“;(IF([@Ethnicity]=“Any Other Ethnic Group“;“Other“;(IF([@Ethnicity]=“Any Other Mixed/Multiple Ethnic Background“;“Mixed“;(IF([@Ethnicity]=“Any Other White Background“;“White“;(IF([@Ethnicity]=“Arab“;“Other“;(IF([@Ethnicity]=“Bangladeshi“;“Asian“;(IF([@Ethnicity]=“Black African“;“Black“;(IF([@Ethnicity]=“Black Caribbean“;“Black“;(IF([@Ethnicity]=“Chinese“;“Asian“;(IF([@Ethnicity]=“Gypsy or Irish Traveller“;“White“;(IF([@Ethnicity]=“Indian“;“Asian“;(IF([@Ethnicity]=“Mixed African“;“Mixed“;(IF([@Ethnicity]=“Mixed Asian“;“Mixed“;(IF([@Ethnicity]=“Mixed Caribbean“;“Mixed“;(IF([@Ethnicity]=“Pakistani“;“Asian“;(IF([@Ethnicity]=“White Irish“;“White“;(IF([@Ethnicity]=“White British“;“White“;(IF([@Ethnicity]=“Any other asian“;“Asian“;(IF([@Ethnicity]=“Mixed White and Asian“;“Mixed“;(IF([@Ethnicity]=“Mixed White and Black African“;“Mixed“;(IF([@Ethnicity]=“Mixed White and Black Caribbean“;“Mixed“;(IF([@Ethnicity]=“Unreported“;“Unreported“;(IF([@Ethnicity]=“All“;“All“;“bug“)))))))))))))))))))))))))))))))))))))))))))))))))))
  • Sex a Gender – dva sloupce, které spolu souvisí. Sloupec Sex se využil pro získání informací před rokem 2020/21, kde byly kategorie – Female, Male, N/A for 2020/21 data. Gender se využil v období 2020/21 a rozděluje se na – Female, Male, Other, Unknown, N/A for data before 2020/21.
  • Sex and Gender – vytvořila jsem nový sloupec, kde jsem spojila informace z obou předchozích sloupců, N/A buňky jsem nahradila prázdnými a poté jsem sloupce sloučila
  • Geography – rozdělení na jednotlivé policejní oblasti. Jelikož jsem ve vizualizaci chtěla využít mapu míst, bylo nutné některé názvy upravit a dodat informace, že místo se nachází v Anglii. Například: Cleveland -> Cleveland (England).

Odpovědi na otázky:

 • Jak se vyvíjel počet zatčených v Anglii v letech 2018/19 – 2020/21? Je zde stoupající nebo klesající tendence?

V prvním fiskálním roce tohoto datasetu bylo množství zatčených osob velmi nízké, v dalších letech docházelo k postupnému nárůstu a je pravděpodobné, že počet zatčených bude i nadále růst.

 • Ve kterém městě proběhlo za toto období nejméně / nejvíce zatčení?

Nejvíce zatčení proběhlo v policejní oblasti Metropolitan police, což je Londýnská oblast mimo město Londýn. I přestože se jedná o relativně malou oblast (1 578 km2), proběhlo zde nejvíce zatčení.

Nejméně zatčení proběhlo v oblasti ve městě Londýn.

V rámci vizualizace jsem zpracovala seznam všech oblastí a jejich zobrazení na mapě.

 • Byli častěji zatčeny ženy nebo muži?

Častěji docházelo k zatýkání mužů a to ve všech třech letech.

Celkový přehled
Rok 2018/19
Rok 2019/20
Rok 2020/21
 • Má některá z 5-ti hlavních etnických skupin větší počet zatčených v určité věkové kategorii oproti ostatním skupinám?

Zde jsem využila mnou vytvořený sloupec Ethnicity_subgroup, kde jsem si veškeré zatčení rozdělila do 5-ti hlavních etnických kategorií. Díky tomu můžeme vidět, že věkové zastoupení je téměř ve stejném poměru u všech etnických skupin. Což například znamená, že nejvíce zatčených spadalo do kategorie nad 21 let. Mírný rozdíl je akorát u etnické skupiny Black a Mixed, kde je ve věkové kategorii 10-17 let zatčených více než v kategorii 18-20 let. U ostatních etnických skupin je to naopak.

 • Ve kterých 5-ti policejních oblastech bylo zatčeno nejvíce žen ve věku nad 21 let?

Nejvíce zatčených žen ve věku nad 21 let je v oblasti Metropolitan Police. Na vizuálu můžete vidět další 4 oblasti.

 • Jak se v posledních třech letech měnilo zastoupení zatčených vzhledem k etnické skupině?

Na grafu lze vidět, jak se měnil poměr zatčených, podle základních etnických skupin. Při porovnání těchto třech let můžeme vidět, že u etnických skupin White, Black a Others docházelo k postupnému poklesu. Naopak ke zvýšení došlo u etnických skupin Asian a Mixed.

Celková vizualizace:

PowerBI applikace – není nutné stahovat

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *