Gawat…! bisa terjadi mis-interpretasi data, yang berlanjut pada kesalahan analisis dan kesalahan pengambilan keputusan. Bahaya khan? Karenanya kita perlu sedikit paham mengenai seluk beluk format data ini, terutama format data apa yang sedang berlaku di komputer/laptop kita dan format data (eksternal) yang kita dapat dari sumber luar (misalnya: website, portal data dll).
Hal ini, bagi saya, hanya terjadi pada program MS Excel pada saat mengimpor data dari format (ekstensi) yang berbeda misalnya: CSV, TXT, dll.
Seperti biasa, kita mulai dari daftar istilah dulu supaya kita yang membaca tidak salah mis-interpretasi juga.
Mis-interpretasi format data MS Excel Ekstensi CSV TXT
Sebelumnya saya cerita dulu sedikit pengalaman yang membuat catatan ini dibuat. Untuk menyelesaikan suatu pekerjaan, saya baru saya mendownload data dari sumber eksternal, yaitu data rekaman gempa bumi di suatu wilayah yang bersumber dari website pemerintah US yaitu USGS. Data yang saya download berupa ekstensi .CSV. Data rekaman gempa bumi selama 20 tahun berhasil saya download, sekarang saatnya untuk membaca data tersebut.
Dalam kondisi normal, laptop yang saya gunakan untuk bekerja menyelesaikan laporan-laporan dalam Bahasa Indonesia memiliki format data dan sistem Bahasa Indonesia. Saya menggunakan koma (,) sebagai penanda desimal dan titik (.) sebagai penanda kelompok angka seperti ribuan. Contoh: seratus ribu ditulis dengan format data 100.000, dua koma sembilan ditulis dengan format data 2,9. Ini yang berlaku sehari-hari dalam kondisi normal di laptop saya, dan ini jugalah format data yang berlaku dalam tata Bahasa Indonesia.
Data yang saya download dari USGS tersebut memiliki format data dari negara asalnya yaitu United States data format, dimana penanda decimal menggunakan titik/point (.) sedangkan penanda kelompok angka menggunakan koma (,). Ini berkebalikan dengan format data Bahasa Indonesia. Contoh: seratus ribu dalam format data US ditulis sebagai 100,000 dan dua poin sembilan ditulis sebagai 2.9.
Karena saya tidak terlalu biasa dengan ekstensi .csv ini maka saya buka saja dengan cara biasa, yaitu klik dua kali pada file yang ingin dibuka. Secara otomatis komputer membuka file tersebut dengan program MS Excel. Yang saya temukan saat program MS Excel ini membuka data adalah satu kolom sheet excel yang berisi tumpukan data, sulit sekali membaca data tersebut. Kemudian saya baru tersadar bahwa data ini adalah .csv yang merupakan singkatan dari Comma Separated Values. Maksudnya adalah nilai-nilai dalam file tersebut dipisahkan dengan menggunakan koma, diantara tanda koma ada nilai atau data tertentu. Buat orang awam (seperti saya) sulit sekali membaca nilai yang dipisahkan dengan koma, apalagi jika data tersebut berseri (series), susunan dengan pemisah koma ini tidak bisa dibaca secara manual. Saya sebagai end-user hanya bisa membaca data jika data-data itu dikelompokkan dalam kolom dan baris data. Tapi, ya tidak bisa disalahkan juga, CSV itu adalah format data komputer, maka komputer jugalah yang bisa membacanya dengan mudah. Kemudian, karena pada periode-periode yang lalu saya juga sudah pernah membaca mengolah data-data dari format .csv seperti ini, maka baru teringat untuk membukanya dengan cara yang berbeda (tidak langsung double click untuk membuka file). Langkah-langkahnya kira-kira sebagai berkut:
- Klik kanan pada file .csv tersebut pilih open with notepad
- Setelah terbuka di notepad, save as menjadi file dengan ekstensi .TXT simpan pada folder yang diinginkan
- Buka program MS Excell (khusus untuk MS Office 2016) new workbook.
- Klik pada Tab “Data” lanjutkan ke “Get External Data” terus ke “From Text”, akan terbuka jendela Windows Explorer, temukan file .TXT yang tadi disimpan (no. 2), terakhir klik “Import”
- Setelah tombol import diklik akan terbuka jendela “Text Import Wizard – Step 1 of 3)”
- Klik pada pilihan “Delimited” lanjutkan centang “My data has headers” jika data tersebut terdapat header (baris judul), kemudian lanjutkan dengan klik “Next”
- Pilih delimiters “Comma” centang bagian “Comma” tersebut, lanjutkan dengan klik “Next”
- Pada jendela berikutnya “Column data format” centang saja pada bagian “General” untuk format datanya, akhiri dengan Klik “Finish”
- Akan muncul jendela terakhir yang menanyakan dimana data akan ditampilkan “Where do you want to put the data?”, klik saja pada Exsisting Worksheet karena tadi kan kita buka new workbook, ya disana aja ditampilkan.
- Selamat! Datanya sudah muncul dengan tampilan yang bisa dibaca dan dimengerti.
Untuk
mengatasi hal ini caranya cukup mudah. Hanya perlu mengganti format data pada
sistem laptop/komputer. Langkahnya sebagai berikut:
- Buka Control Panel (ketikan “Control Panel”saja pada kolom pencarian di toolbar);
- Pilih “Clock and Region” klik yang bagian bawahnya “change date, time, or number formats”;
- Akan muncul jendela “Region” pada Tab “format” ganti “Indonesian (Indonesia)” menjadi “English (United States)”;
- Akhiri dengan mengklik “OK” di bagian bawah;
- Selesai, sekarang format data di komputer atau laptop sudah menjadi format English (US).
Demikian
catatan saya untuk kasus import data dengan format berbeda antara format sumber
data dengan format data di komputer/laptop. Catatan ini sebenarnya untuk saya
sendiri sebagai pengingat apa yang sudah dipahami dan dijalani semoga
dikemudian hari ketika saya terlupa saya punya pengingatnya ini. Namun, karena
ini saya share terbuka dalam Blog saya ini maka siapapun dapat mengambil
manfaatnya.
Semoga bermanfaat juga untuk para pembaca.
Komentar
Posting Komentar
Terima kasih atas komentarnya..