library(tidyverse) # ggplot2
library(sf)
library(readxl)Menggabungkan Data Stunting dan Jumlah Balita per Kecamatan
Package
Data
shp_smg <- st_read("datasets/KELURAHAN_AR/KELURAHAN_AR.shp")
stunting_smg <- read_csv("datasets/stunting.csv")
jml_balita_22 <- read_xlsx("datasets/Jumlah Balita 22.xlsx")
jml_balita_23 <- read_xlsx("datasets/Jumlah Balita23.xlsx")Wrangling
# Memilih variabel dari data peta sebagai penggabung antara 2 data
# Data stunting berdasarkan WADMKC dan WADMKD
# Data jml_balita berdasarkan KODE kelurahan
data_smg <- shp_smg |>
as_tibble() |>
select(WADMKC, WADMKD, KDPUMDES)# Menghapus titik pada variabel kode desa
data_smg <- data_smg |>
mutate(KODE = gsub("\\.", "", KDPUMDES))
jml_balita_23 <- jml_balita_23 |>
mutate(KODE = gsub("\\.", "", KODE))# Mengganti nama variabel dan memilih variabel yang dipakai
jml_balita_22 <- jml_balita_22 |>
rename(laki_laki_22 = `L 00-04`,
perempuan_22 = `P 00-04`,
total_22 = Total) |>
select(KODE, laki_laki_22, perempuan_22, total_22)
jml_balita_23 <- jml_balita_23 |>
rename(laki_laki_23 = `L 00-04`,
perempuan_23 = `P 00-04`,
total_23 = `JML 00-04`) |>
select(KODE, laki_laki_23, perempuan_23, total_23)
stunting_smg <- stunting_smg |>
select(WADMKC:`2023`) |>
rename(stunting_22 = `2022`,
stunting_23 = `2023`)# Menggabungkan data
data_smg_1 <- left_join(data_smg,
jml_balita_22,
by = "KODE")
data_smg_2 <- left_join(data_smg_1,
jml_balita_23,
by = "KODE")
data_smg_3 <- left_join(data_smg_2,
stunting_smg,
by = c("WADMKC","WADMKD"))Data per kecamatan
# Agregat kecamatan
data_smg_3_kec <- data_smg_3 |>
summarise(total_22 = sum(total_22),
total_23 = sum(total_23),
stunting_22 = sum(stunting_22),
stunting_23 = sum(stunting_23),
.by = WADMKC)# Membuat variabel baru
data_smg_3_kec <- data_smg_3_kec |>
mutate(prev_stu_22 = stunting_22 / total_22,
prev_stu_23 = stunting_23 / total_23)# Simpan sebagai csv
write_csv(data_smg_3_kec, "datasets/data_smg_3_kec.csv")