Jak to vypadalo s kriminalitou a zatýkáním v Anglii v letech 2018/19 – 2020/21 z pohledu etnických skupin, věku a pohlaví
Využité nástroje:
- Excel pro prozkoumání dat a úpravy
- PowerBI pro vizualizaci a zjištění odpovědí na položené otázky
Data:
- Data jsem získala z data.gov.uk
Otázky na které chci v datech najít odpověď:
- Jak se vyvíjel počet zatčených v Anglii v letech 2018/19 – 2020/21? Je zde stoupající nebo klesající tendence?
- Ve kterém městě proběhlo za toto období nejméně / nejvíce zatčení?
- Byli častěji zatčeny ženy nebo muži?
- Má některá z 5-ti hlavních etnických skupin větší počet zatčených v určité věkové kategorii oproti ostatním skupinám?
- Ve kterých 5-ti policejních oblastech bylo zatčeno nejvíce žen ve věku nad 21 let?
- Jak se v posledních třech letech měnilo zastoupení zatčených vzhledem k etnické skupině?
Vysvětlení a úprava datasetu:
- Soubor s daty:
- Data stažena ve formátu .csv, importována do excelu
- Při nahrání dat se zobrazilo, že dataset obsahuje 450 chybových řádků. Při bližším zkoumání jsem zjistila, že ve sloupci „Number of arrestes“ chybí na řádcích 9001-9450 informace o počtu zatčených. Zjistila jsem, že tato data zde nejsou zapsána, protože policejní oblast Lancashire v roce 2018/19 nebyla schopná dodat informace o počtu zatčených
- Vysvětlení nejasných sloupců, doplnění nových:
- Time – financial year neboli fiskální roky (v Anglii se jedná o období od 6.dubna do 5.dubna následujícího roku
- Ethnicicty a Ethnicity_type – etnické skupiny zatčených. Tyto sloupečky byly komplikované, protože se zde využívá 4 různých zápisů. Pro rok 2018/2019 se využilo rozdělení na etnické skupiny podle sčítání obyvatel z roku 2001 (16+1, 5+1), v dalších dvou letech se však využilo rozdělení podle sčítání z roku 2011 (18+1, 5+1)
- Pro zjištění relevantních informací jsem si vytvořila sloupec Ethnicity_subgroup, kde jsem si veškeré etnické skupiny rozdělila do 5+1 skupin (Asian, Black, Mixed, Other, White, All, Unreported). Informace jsem získala z oficiálních stránek
- Pro převedení informací jsem využila vzorec IF:
- =IF([@[Ethnicity_type]]=“ONS 2011 5+1″; [@Ethnicity]; (IF([@[Ethnicity_type]]=“ONS 2001 5+1″; [@Ethnicity]; (IF([@Ethnicity]=“Any Other Asian Background“;“Asian“; (IF([@Ethnicity]=“Any Other Black Background“;“Black“;(IF([@Ethnicity]=“Any Other Ethnic Group“;“Other“;(IF([@Ethnicity]=“Any Other Mixed/Multiple Ethnic Background“;“Mixed“;(IF([@Ethnicity]=“Any Other White Background“;“White“;(IF([@Ethnicity]=“Arab“;“Other“;(IF([@Ethnicity]=“Bangladeshi“;“Asian“;(IF([@Ethnicity]=“Black African“;“Black“;(IF([@Ethnicity]=“Black Caribbean“;“Black“;(IF([@Ethnicity]=“Chinese“;“Asian“;(IF([@Ethnicity]=“Gypsy or Irish Traveller“;“White“;(IF([@Ethnicity]=“Indian“;“Asian“;(IF([@Ethnicity]=“Mixed African“;“Mixed“;(IF([@Ethnicity]=“Mixed Asian“;“Mixed“;(IF([@Ethnicity]=“Mixed Caribbean“;“Mixed“;(IF([@Ethnicity]=“Pakistani“;“Asian“;(IF([@Ethnicity]=“White Irish“;“White“;(IF([@Ethnicity]=“White British“;“White“;(IF([@Ethnicity]=“Any other asian“;“Asian“;(IF([@Ethnicity]=“Mixed White and Asian“;“Mixed“;(IF([@Ethnicity]=“Mixed White and Black African“;“Mixed“;(IF([@Ethnicity]=“Mixed White and Black Caribbean“;“Mixed“;(IF([@Ethnicity]=“Unreported“;“Unreported“;(IF([@Ethnicity]=“All“;“All“;“bug“)))))))))))))))))))))))))))))))))))))))))))))))))))
- Sex a Gender – dva sloupce, které spolu souvisí. Sloupec Sex se využil pro získání informací před rokem 2020/21, kde byly kategorie – Female, Male, N/A for 2020/21 data. Gender se využil v období 2020/21 a rozděluje se na – Female, Male, Other, Unknown, N/A for data before 2020/21.
- Sex and Gender – vytvořila jsem nový sloupec, kde jsem spojila informace z obou předchozích sloupců, N/A buňky jsem nahradila prázdnými a poté jsem sloupce sloučila
- Geography – rozdělení na jednotlivé policejní oblasti. Jelikož jsem ve vizualizaci chtěla využít mapu míst, bylo nutné některé názvy upravit a dodat informace, že místo se nachází v Anglii. Například: Cleveland -> Cleveland (England).
Odpovědi na otázky:
- Jak se vyvíjel počet zatčených v Anglii v letech 2018/19 – 2020/21? Je zde stoupající nebo klesající tendence?
V prvním fiskálním roce tohoto datasetu bylo množství zatčených osob velmi nízké, v dalších letech docházelo k postupnému nárůstu a je pravděpodobné, že počet zatčených bude i nadále růst.

- Ve kterém městě proběhlo za toto období nejméně / nejvíce zatčení?
Nejvíce zatčení proběhlo v policejní oblasti Metropolitan police, což je Londýnská oblast mimo město Londýn. I přestože se jedná o relativně malou oblast (1 578 km2), proběhlo zde nejvíce zatčení.

Nejméně zatčení proběhlo v oblasti ve městě Londýn.

V rámci vizualizace jsem zpracovala seznam všech oblastí a jejich zobrazení na mapě.

- Byli častěji zatčeny ženy nebo muži?
Častěji docházelo k zatýkání mužů a to ve všech třech letech.




- Má některá z 5-ti hlavních etnických skupin větší počet zatčených v určité věkové kategorii oproti ostatním skupinám?
Zde jsem využila mnou vytvořený sloupec Ethnicity_subgroup, kde jsem si veškeré zatčení rozdělila do 5-ti hlavních etnických kategorií. Díky tomu můžeme vidět, že věkové zastoupení je téměř ve stejném poměru u všech etnických skupin. Což například znamená, že nejvíce zatčených spadalo do kategorie nad 21 let. Mírný rozdíl je akorát u etnické skupiny Black a Mixed, kde je ve věkové kategorii 10-17 let zatčených více než v kategorii 18-20 let. U ostatních etnických skupin je to naopak.

- Ve kterých 5-ti policejních oblastech bylo zatčeno nejvíce žen ve věku nad 21 let?
Nejvíce zatčených žen ve věku nad 21 let je v oblasti Metropolitan Police. Na vizuálu můžete vidět další 4 oblasti.

- Jak se v posledních třech letech měnilo zastoupení zatčených vzhledem k etnické skupině?
Na grafu lze vidět, jak se měnil poměr zatčených, podle základních etnických skupin. Při porovnání těchto třech let můžeme vidět, že u etnických skupin White, Black a Others docházelo k postupnému poklesu. Naopak ke zvýšení došlo u etnických skupin Asian a Mixed.

Celková vizualizace: