library(tidyverse) # ggplot2
library(sf)
library(readxl)
Menggabungkan Data Stunting dan Jumlah Balita per Kecamatan
Package
Data
<- st_read("datasets/KELURAHAN_AR/KELURAHAN_AR.shp")
shp_smg
<- read_csv("datasets/stunting.csv")
stunting_smg
<- read_xlsx("datasets/Jumlah Balita 22.xlsx")
jml_balita_22 <- read_xlsx("datasets/Jumlah Balita23.xlsx") jml_balita_23
Wrangling
# Memilih variabel dari data peta sebagai penggabung antara 2 data
# Data stunting berdasarkan WADMKC dan WADMKD
# Data jml_balita berdasarkan KODE kelurahan
<- shp_smg |>
data_smg as_tibble() |>
select(WADMKC, WADMKD, KDPUMDES)
# Menghapus titik pada variabel kode desa
<- data_smg |>
data_smg mutate(KODE = gsub("\\.", "", KDPUMDES))
<- jml_balita_23 |>
jml_balita_23 mutate(KODE = gsub("\\.", "", KODE))
# Mengganti nama variabel dan memilih variabel yang dipakai
<- jml_balita_22 |>
jml_balita_22 rename(laki_laki_22 = `L 00-04`,
perempuan_22 = `P 00-04`,
total_22 = Total) |>
select(KODE, laki_laki_22, perempuan_22, total_22)
<- jml_balita_23 |>
jml_balita_23 rename(laki_laki_23 = `L 00-04`,
perempuan_23 = `P 00-04`,
total_23 = `JML 00-04`) |>
select(KODE, laki_laki_23, perempuan_23, total_23)
<- stunting_smg |>
stunting_smg select(WADMKC:`2023`) |>
rename(stunting_22 = `2022`,
stunting_23 = `2023`)
# Menggabungkan data
<- left_join(data_smg,
data_smg_1
jml_balita_22,by = "KODE")
<- left_join(data_smg_1,
data_smg_2
jml_balita_23,by = "KODE")
<- left_join(data_smg_2,
data_smg_3
stunting_smg,by = c("WADMKC","WADMKD"))
Data per kecamatan
# Agregat kecamatan
<- data_smg_3 |>
data_smg_3_kec summarise(total_22 = sum(total_22),
total_23 = sum(total_23),
stunting_22 = sum(stunting_22),
stunting_23 = sum(stunting_23),
.by = WADMKC)
# Membuat variabel baru
<- data_smg_3_kec |>
data_smg_3_kec mutate(prev_stu_22 = stunting_22 / total_22,
prev_stu_23 = stunting_23 / total_23)
# Simpan sebagai csv
write_csv(data_smg_3_kec, "datasets/data_smg_3_kec.csv")