Banner Uhamka
Selasa, September 29, 2020
Banner Uhamka

Menata-nata Kekurangan Big Data

Husni Kamil Manik yang Saya Kenal

Malam itu, Kamis, 7 Juli 2016, saya baru saja sampai di rumah seorang sahabat karib di Batusangkar, Sumatera Barat, untuk silaturahmi Lebaran. Waktu di...

Kelas Menengah Ngehe dan Pembangunan Kota

Ini lagi-lagi kisah kelas menengah ngehe di Jakarta dan sekitarnya. Mereka yang teramat politis karena perasaan "mabuk cinta" terhadap seorang gubernur pujaan membuatnya merasa...

Donald Trump dan Fenomena Politik Anomali

Pemilihan Presiden yang baru saja berlangsung di Amerika Serikat memberi kita pelajaran penting. Kemenangan Donald Trump telah "memukul" para pengamat politik dan juga para...

Risma dan Pembangunan Berkelanjutan

Seiring mendekatnya Pemilihan Kepala Daerah DKI Jakarta 2017, perhatian publik yang digiring media terhadap topik ini juga semakin meningkat. Tak cuma partai, aliansi masyarakat...
Avatar
Khairil Anwar Notodiputro
Guru Besar Statistika IPB

Kehadiran data besar (big data) tidak dapat dipungkiri sangat membantu peneliti, pebisnis, dan pengambil keputusan dalam melaksanakan tugasnya. Data besar kini semakin banyak tersedia. Namun demikian, selain memiliki keuntungan, data besar juga memiliki kekurangan yang harus diwaspadai.

Cukup banyak kekurangan dari data besar ini yang kalau tidak ditangani dengan baik dapat memberikan hasil yang tidak tepat. Kita masih ingat bagaimana data besar dari Twitter sudah digunakan untuk memprediksi hasil Pemilihan Presiden 2019 dan ternyata prediksinya meleset. Memahami kekurangan dari data besar ini penting agar kita dapat memanfaatkan keunggulannya secara optimal.

Ada beberapa kekurangan dari data besar dan pada kesempatan ini serta kesempatan berikutnya akan saya jelaskan kekurangannya satu per satu. Untuk hari ini saya akan mulai dengan kekurangan data besar yaitu “tidak tertata” dengan baik.

Salah satu sifat data besar adalah mudah berubah-ubah. Data besar merupakan kumpulan data dari berbagai sumber serta berbagai bentuk. Ada bagian data yang terstruktur, tapi ada pula yang tidak terstruktur. Ada data yang berasal dari sumber online, ada pula yang dari sumbee offline. Dan ini terus terkumpul setiap hari secara otomatis. Jadi, data besar itu pada umumnya tidak tertata.

Kondisi data yang tidak tertata ini tentu sangat berbeda dengan data hasil survei maupun data hasil percobaan yang relatif seragam bentuknya dan dari sumber yang sudah dirancang dengan jelas. Akibatnya, data percobaan maupun survei bisa langsung dimodelkan dan dianalisis setelah sedikit mengalami proses penyuntingan dan penataan.

Di pihak lain, data besar memerlukan upaya ekstrakeras untuk melakukan proses penyuntingan dan penataan agar dapat dianalisis dan dimanfaatkan secara optimal. Ini sebagai akibat bahwa terkumpulnya data besar BUKAN merupakan hasil dari perancangan pengumpulan data yang sahih seperti halnya survei atau perancangan percobaan.

Jadi, tidak berlebihan jika untuk memanfaatkan data besar, maka proses akuisisi data dan penyiapan data yang mencakup pembakuan, penggabungan, penyuntingan, dan penataannya dapat menguras energi besar. Dalam praktik tidak jarang kita kewalahan untuk menyelesaikan masalah ketidak-teraturan dan keberlimpahan data ini secara efektif dan efisien. Untuk itu, diperlukan strategi khusus yang memungkinkan kita dapat keluar dari gelapnya data besar sehingga data yang diperoleh menjadi bermakna dan masuk akal.

Sekian dulu, sampai jumpa pada penjelasan tentang kekurangan data besar yang berikutnya. Itu pun kalau ada yang berminat untuk mengetahui kekurangan itu. Kalau tidak ada yang berminat, maka akan saya cukupkan sampai di sini.

Baca juga

Big Data dan Manfaatnya bagi E-Commerce

Teror Big Data

Meramu Kebenaran dengan Sistem Big Data

Avatar
Khairil Anwar Notodiputro
Guru Besar Statistika IPB
Facebook Comment

POLIKLITIK

ARTIKEL TERBARU

Miskonsepsi Seks dengan Persetujuan

Pada 13 September 2020 lalu, terunggah sebuah kiriman di Instagram yang berjudul “Kupas Tuntas Pakta Integritas UI dan Pendidikan Sex dengan Persetujuan” yang di...

Jika Cantik Hanya Mengikuti Standar Industri

Belakangan ini perbincangan mengenai bagaimana diri kita maupun bagaimana industri mendefinisikan standart kecantikan kembali ramai diperdebatkan. Mulai dari gerakan perempuan dukung perempuan yang dianggap...

Civil Society, Pariwisata Nasional, dan Dikotomi Ekonomi Vs Kesehatan

Dalam beberapa tahun terakhir, pariwisata telah menjadi sumber pendapatan devisa terbesar nomor dua (280 triliun Rupiah pada 2019) di Indonesia untuk kategori non-migas. Ini...

PKI dan Narasi Sejarah Indonesia

Bagaimanakah kita menyikapi narasi PKI dalam sejarah Indonesia? Sejarah resmi mencatat PKI adalah organisasi politik yang telah menorehkan “tinta hitam” dalam lembaran sejarah nasional,...

Janji Manis Penyelesaian HAM

Setiap memasuki bulan September, negeri ini selalu dibangkitkan dengan memori tentang sebuah tragedi kelam yang terjadi sekiranya 55 tahun silam. Peristiwa diawali dengan terbunuhnya enam...

ARTIKEL TERPOPULER

Log In

Forgot password?

Don't have an account? Register

Forgot password?

Enter your account data and we will send you a link to reset your password.

Your password reset link appears to be invalid or expired.

Log in

Privacy Policy

Add to Collection

No Collections

Here you'll find all collections you've created before.