Menentukan seberapa jauh tingkat akurasi dan ketepatan data statistik yang dihasilkan
Mendeskripsikan persiapan data sebelum data tersebut dianalisis dan didiseminasikan sebagai output kegiatan statistik
Meliputi integrasi data, penyuntingan (editing dan imputasi), penyahihan (validation), serta menghitung penimbang
Workflow proses pengolahan data:
Mengintegrasikan data dari satu atau beberapa sumber.
Integrasi data dapat mencakup:
Integrasi data bertujuan untuk menggabungkan data yang berasal dari dua atau lebih sumber data, baik bersumber dari internal maupun eksternal.
Data internal adalah data yang diperoleh dari dalam, sedangkan data eksternal adalah data yang diperoleh dari luar organisasi penyelenggara kegiatan statistik.
Data masukan dapat berasal dari campuran sumber data eksternal atau internal, dan berbagai mode pengumpulan, termasuk ekstrak data administratif.
Hasil integrasi data adalah sekumpulan data yang terhubung.
Integrasi data dapat dilakukan kapan saja dalam fase ini, sebelum atau sesudah sub-proses lainnya.
Setelah integrasi, data dapat dianonimkan untuk membantu melindungi kerahasiaan.
Mengklasifikasikan dan memberi kode pada data masukan.
Melakukan coding dan klasifikasi data
Melakukan verifikasi/pemeriksaan terhadap coding & klasifikasi yang telah dilakukan
Menerjemahkan data ke dalam konsep SNA (System of National Accounts)
Sebagai contoh, rutinitas pengkodean otomatis (atau klerikal) dapat menetapkan kode numerik untuk respons teks sesuai dengan skema klasifikasi yang telah ditentukan sebelumnya.
Memeriksa data untuk mencoba mengidentifikasi potensi masalah, kesalahan dan ketidaksesuaian seperti outlier, item yang tidak merespons, dan kesalahan pengkodean.
Melakukan validasi data.
Proses ini dapat dijalankan secara berulang dan biasanya dalam urutan yang ditetapkan.
Proses ini dapat menandai data untuk pemeriksaan atau pengeditan otomatis atau manual.
Peninjauan dan validasi dapat diterapkan pada data dari semua jenis sumber, sebelum dan sesudah integrasi.
Meskipun validasi diperlakukan sebagai bagian dari fase “Proses”, dalam praktiknya, beberapa elemen validasi dapat terjadi bersamaan dengan kegiatan pengumpulan, terutama untuk mode seperti pengumpulan web.
Meskipun subproses ini berkaitan dengan deteksi kesalahan aktual atau potensial, setiap kegiatan koreksi yang benar-benar mengubah data dilakukan di subproses 5.4.
Menyusun laporan tentang data error.
Proses ini terdiri dari:
Melakukan edit/perbaikan data
Melakukan imputasi data
Mendapatkan persetujuan terhadap perbaikan & imputasi data yang telah dilakukan
Proses editing meliputi pemeriksaan:
kelengkapan pengisian
kejelasan isian
kesalahan isian
konsistensi isian dan relevansi jawaban
kewajaran isian
Ketika data dianggap salah, hilang atau tidak dapat diandalkan, nilai baru dapat dimasukkan dalam subproses ini.
Proses pemeriksaan dan memperbaiki penulisan yang salah/kurang jelas dan pemberian kode pada isian dokumen hasil pencacahan dengan memperhatikan kaidah-kaidah editing dan coding (penyuntingan/ penyandian) yang telah ditetapkan.
Hasil editing dan coding sangat mempengaruhi kualitas data dan proses pengolahan selanjutnya.
Istilah pengeditan dan imputasi mencakup berbagai metode untuk melakukan hal ini, yang sering kali menggunakan pendekatan berbasis aturan. Langkah-langkah spesifik biasanya meliputi:
Sebagai contoh: Survei kepuasan masyarakat (SKM) yang diselenggarakan dengan cara swacacah bisanya akan didapatkan dokumen(kuesioner) survei yang berisi tulisan tangan baik itu pilihan ataupun pertanyaan terbuka dari responden, dalam hal ini yang paling sering dilakukan untuk mempermudah pengolahan adalah mengubah pilihan (centang/ silang) pada pertanyaan tertutup menjadi kode(angka/ huruf).