Knowledge Speak Youthack

Statistik dan Kebohongan

Statistik dan Kebohongan stats graphs

“There are three kinds of lies: lies, damned lies, and statistics.” – Benjamin Disraeli (1804 – 1881)

Statistik. Merupakan hal yang sekarang ini sangat sering kita temukan. Kamu bisa bertemu dengan data statistik lewat iklan dan berita di televisi, artikel di internet, koran dan majalah, buku-buku, atau konten apapun yang memuat data didalamnya, itu merupakan bagian dari statistik. Kira-kira, apa sih pandangan kamu ketika melihat sebuah atau sederetan informasi yang didalamnya mengandung data-data statistik? Kenapa pula orang-orang cenderung mencantumkan data statistik kedalam konten informasi yang ingin mereka sampaikan?

Kebanyakan orang memandang bahwa mereka yang mencantumkan data statistik kedalam tulisan, video, presentasi, debat, atau bentuk penyampaian informasi lainnya, merupakan orang yang kredibel dan berpendidikan. Mereka mencantumkan data statistik sebagai bukti pendukung yang kuat agar maksud dan tujuan utama dari informasi yang ingin disampaikan bisa tercapai. Statistik sering juga dijadikan payung dalam membantah argumen lawan, dan orang yang berbicara menggunakan data statistik seakan-akan terlihat expert dalam bidang yang sedang diisukan.

Sebenarnya, tidak ada satu hal pun yang salah dalam penyampaian data statistik, terlebih lagi data statistik dihitung dengan ilmu matematika yang selalu memiliki jawaban yang pasti. Namun sadarkah kamu, kalau ada beberapa orang, yang ketika mereka memasukan data statistik kedalam informasi yang disampaikan, sebenarnya bukan hanya ingin dianggap benar dan kredibel oleh kamu, tapi lebih jauh dari itu : mereka ingin mempengaruhi kamu agar percaya dengan ide/opini yang disampaikan.

Padahal, tidak semua data statistik bisa dikatakan akurat –terlebih dalam meramal suatu hal– serta berkorelasi langsung dengan topik yang sedang dibahas.

‘Statistics are persuasive’ – Mark Liddell

Statistik merupakan sebuah produk buatan manusia. Dimana didalamnya belum tentu dapat secara langsung menggambarkan persis apa yang terjadi karena setiap data statistik memiliki nilai margin of error-nya masing-masing. Namun kenyataannya, statistik sering dijadikan data pendukung layaknya fakta konkret suatu peristiwa yang mana sebenarnya kita perlu tahu bahwa data yang digunakan dapat berupa data primer (data yang sampelnya diambil dan diolah langsung) dan data sekunder (data yang diambil dari sumber lain yang telah melakukan pengolahan data primer). Kedua data ini tentunya memiliki kelebihan dan kekurangannya masing-masing. Namun manakah data yang lebih baik dipakai agar lebih merepresentasikan kebenaran?

Kalau kamu berpandangan bahwa data primer adalah data yang lebih baik, bisa dibilang kamu masih keliru. Karena berbicara data statistik, tidak hanya sebatas menarik kesimpulan. Tetapi proses pengolahan data dari awal hingga akhir juga memberikan sumbangsih yang besar dalam keakuratan pengambilan kesimpulan. Contoh kecilnya, apabila sampel yang diambil pada data primer hanya sedikit, tidak random, dan hanya dilakukan oleh perorangan, maka dapat dikatakan bahwa data tersebut masih memiliki tingkat kesalahan yang cukup besar. Belum lagi apabila kita ingin menilisik metode apakah yang dipakai dalam mengolah data tersebut, variabel apa saja yang terkait, apakah sampel yang diambil benar-benar representatif, dll? Begitu pula dengan data sekunder. Sekalipun data yang diambil sangat kredibel dan bersumber dari lembaga khusus tertentu, kita perlu menganalisis apakah data tersebut memang memiliki korelasi dengan apa yang sedang dibahas, atau hanya dicocok-cocokkan oleh pembawa materi?

Untuk itulah, lewat artikel ini Revoluside mau sharing sama kamu seputar bagaimana cara agar kita tidak dibohongi dengan data statistik. Harapannya sih, artikel ini akan membuat kamu lebih bijak dalam menerima informasi atau mengambil keputusan. Tapi sebelumnya, Revoluside mau menyampaikan terlebih dahulu tentang urgency dari topik kebohongan statistik ini. Kenapa sih memangnya kita harus menghindari  ‘kebohongan statistik’?

Melihat kenyataan bahwa semakin banyak orang-orang, organisasi, perusahaan, bahkan semua negara didunia yang mendasarkan keputusan penting mereka diatas data-data statistik, maka tentunya kejelian dalam melihat akurasi data statistik sangat dibutuhkan. Karena dengan melihat data statistik, perubahan dimulai.

Namun apa jadinya apabila data statistik yang kita pakai ternyata memiliki kesalahan dalam pengolahan datanya? Atau, bagaimana apabila ada variabel statistik yang sengaja atau tidak sengaja disembunyikan demi mendapatkan kesimpulan yang diinginkan? Tentunya itu akan menghadirkan malapetaka bagi kita, bukan? Dan ini merupakan hal yang krusial yang bisa jadi, akan berpengaruh besar terhadap hidup kita sendiri ataupun masyarakat luas.

Sebagai contoh, bayangkan kalau kamu harus memilih diantara dua rumah sakit dalam penanganan penyakit kanker. Berdasarkan data statistik yang ada, dari 1000 pasien yang berobat pada masing-masing rumah sakit, 900 orang berhasil terselamatkan pada rumah sakit A, sedangkan pada rumah sakit B hanya 800 orang yang terselamatkan. Sebagai orang awam, tentunya kamu akan lebih memilih rumah sakit A dengan harapan penyakit yang diderita memiliki kemungkinan lebih besar untuk disembuhkan.

Statistik dan Kebohongan decide 1

Namun sadarkah kamu, bahwa sebenarnya tidak semua pasien pada kedua rumah sakit datang pada waktu yang bersamaan dan dengan kondisi kesehatan yang sama? Misalnya saja, fakta yang ada menunjukkan pada rumah sakit A terdapat 100 pasien kanker yang datang dengan kondisi parah/kiritis, dan dari jumlah tersebut terdapat 30 orang yang berhasil diselamatkan. Sedangkan pada rumah sakit B, terdapat 400 orang yang datang dengan kondisi parah/kritis dan dari jumlah tersebut sebanyak 210 orang berhasil terselamatkan. Itu artinya, rumah sakit B merupakan pilihan yang lebih baik bagi penderita yang sudah parah dengan tingkat kesembuhannya mencapai 52,5%. Lalu bagaimana apabila ada penderita yang ingin berobat namun masih dalam kondisi kesehatan yang cukup baik? Strangely, rumah sakit B tetap menjadi pilihan yang lebih baik dengan tingkat kesembuhan mencapai 98%.

Sekarang bagaimana mungkin rumah sakit A dapat memiliki tingkat kesembuhan yang lebih besar seperti data yang disajikan diawal padahal sebenarnya rumah sakit B-lah yang memiliki tingkat kesembuhan yang lebih besar terhadap penderita kanker, baik yang masih ringan ataupun yang sudah kritis?

Hal ini dikarenakan sebuah fenomena yang biasa disebut dengan Simpson’s Paradox. Dimana terdapat sebuah rangkaian data yang sama namun muncul dan menghasilkan kesimpulan yang berkebalikan, apabila kita membaginya kedalam grup-grup tertentu. Hal ini sering terjadi ketika data agregat (data keseluruhan) secara sengaja atau tidak sengaja menutupi beberapa variabel kondisional (conditional variable/lurking variable) yang sebenarnya memiliki pengaruh besar terhadap pengambilan hasil/kesimpulan. Sehingga pada akhirnya, menuntun kita pada keputusan yang sangat merugikan.

Statistik dan Kebohongan Simpson Paradox 1

Simpson’s Paradox bukanlah hipotesis belaka karena fenomena ini selalu muncul dari waktu ke waktu bahkan pada kasus yang sangat penting. Contoh terkenal yang pernah terjadi adalah salah satu studi di United Kindgdom, yang menyebutkan bahwa perokok memiliki tingkat taraf hidup yang lebih tinggi dibanding bukan perokok pada periode 20 tahun penelitian. Namun setelah data yang dipakai pada penelitian tersebut ditelusuri dan dibagi kedalam kelompok-kelompok, ditemukan bahwa sampel yang diambil pada non-perokok, significantly lebih tua dari sampel rata-rata yang diambil. Yang artinya, sudah jelaslah bahwa orang yang lebih muda memiliki peluang yang lebih besar untuk hidup –meskipun mereka perokok–, dibandingkan dengan orang-orang yang sudah berumur dan bukan perokok. Didalam kasus ini, umur menjadi the lurking variable yang dapat membuat orang-orang salah dalam menginterpretasi data statistik.

Sekarang bayangkan, apabila studi tersebut diterima mentah-mentah sehingga menjadi benar dan dipercaya semua orang, mungkin jumlah perokok akan jauh lebih besar dari saat ini, bukan?

Atau selanjutnya mengenai data yang kurang representatif. Revoluside sebenarnya agak kesulitan mencari kasus terkenal yang spesifik, tapi disadari atau tidak, kamu pun pernah mendengar atau mungkin menjadi korban, atau bisa jadi pelaku, dari kebohongan statistik yang satu ini. Misalnya saja ada sekelompok orang yang mengatasnamakan equality untuk mengambil benefit dari sebuah mosi, yang sengaja melakukan survey mengenai pendapatan rata-rata penduduk pada suatu kota (misal kota A). Untuk membandingkan hasil survey pendapatan rata-rata penduduk di kota A, kelompok ini juga melakukan survey di kota-kota lain. Seperti yang kita tahu, dalam statistik, beberapa karakteristik pengambilan sampel yang baik adalah dengan cara acak dan transparan. Dikarenakan motif equality/kesetaraan, pada tiap 10 karyawan pada kota A yang disurvey, 7 diantaranya yang sengaja dipilih sebagai sampel adalah karyawan biasa, tidak termasuk office boy atau direktur dan manajernya. Sedangkan pada survey yang dilakukan didaerah lain, sampel yang diambil benar-benar acak seperti halnya prosedur pengambilan sampel statistik pada umumnya. Eventually, hasil pengolahan data pada kota A menjadi tidak representatif karena memang dibuat berdasarkan tujuan tertentu dengan harapan kenaikan gaji, penambahan subsidi, dan bantuan lain yang harus segera pemerintah tambahkan untuk kota A.

Sekilas, melihat penjabaran dan contoh-contoh diatas, mungkin membuat kita mengernyitkan dahi yang sekarang membawa kita pada pola pikir skeptis terhadap data statistik. Hal ini bukanlah sebuah kesalahan, karena memang tujuan Revoluside menulis intermezzo diatas adalah untuk membuat kamu menjadi lebih skeptis dalam melihat suatu hal terlebih dahulu. Menjadi skeptis, adalah modal awal untuk membongkar sebuah kebohongan dan mendeteksi kejelekan data statistik. Namun skeptis yang bagaimanakah yang Revoluside maksud? Jangan sampai juga, ketika kita melihat data statistik, kita kembali lagi pada 2 kekhilafan klasik : menyalahkan apa yang benar, membenarkan apa yang salah.

Okedeh, berikut ini sudah Revoluside rangkum 5 kiat-kiat untuk menghindari kebohongan statistik agar kamu menjadi pihak yang tidak lagi dirugikan.

#1 Be Wary of Stats in Promotions

Pertama, kamu harus berhati-hati dengan data statistik yang ditujukan untuk mempromosikan suatu produk. Hal ini dikarenakan tujuan utama mereka (advertisers) adalah mencari cara untuk meyakinkan kamu atas nilai suatu produk dan menjelaskan seberapa besar manfaat produk tersebut bagi kamu. Dan seperti yang kita tahu, advertisers do not hold the same standard as reasearcher. Sehingga menjadi skeptis terhadap uraian statistik suatu promosi produk adalah saran yang baik untuk kamu lakukan.

#2 Be Wary of Stats that Cannot be Verified

Poin kedua ini sudah jelas. Ketika narasumber yang mempresentasikan data statistik tidak dapat memberikan verifikasi tentang kebenaran suatu data dan kamu sendiri pun tidak bisa memastikan hal tersebut, maka kemungkinan data tersebut palsu itu ada. Cobalah gunakan kalimat, ‘How do you know that?‘ ketika seseorang memasukkan data statistik kedalam argumennya.

#3 Be Wary of The Sample Size and Characteristic

Secara logika, hasil pengolahan data statistik pada sampel yang lebih banyak dan lebih acak tentunya akan menghasilkan kesimpulan yang lebih akurat. Pengambilan sampel yang representatif tentunya juga berpengaruh besar terhadap hasil data statistik yang sudah diolah. Melakukan analisis terhadap sampel merupakan langkah yang tepat untuk menghindari Simpson’s Paradox seperti yang sudah disinggung diawal paragraf. Namun tentunya, langkah ini tidak dapat dengan mudah dilakukan karena kita harus mengetahui seluruh input data yang diolah dan digunakan untuk mendapatkan hasil/kesimpulan.

#4 Be Wary of The Stats that Do Not Line Up with The Truth

If you feel like it’s too good to be true, then yes, probably it’s not true. – James H Baird (How Statistics Can Lie : 2003)

Kemungkinan besar, kamu pasti pernah memiliki pengalaman melihat/mendengar data statistik yang membuat kamu terkejut. Pasalnya, kesimpulan dari data statistik yang kamu dengar seakan bertentangan dengan apa yang kamu lihat atau kamu alami sendiri. Jika memang itu yang terjadi, maka ada kemungkinan bahwa data statistik tersebut memang ngawur atau memiliki kesalahan.

#5 Be Wary of How The Stats Are Being Presented

Kehebatan seorang komunikator dalam menyampaikan informasi yang disampaikan, tidak hanya sebatas kalimat yang ia katakan. Namun juga dari ilusi yang ia ciptakan. Pernahkah kamu memperhatikan skala pada grafik suatu data statistik yang disajikan dalam sebuah presentasi?

Statistik dan Kebohongan stats lies

Jika kamu perhatikan, 2 gambar diatas akan memberikan kesan dan penilaian yang berbeda saat kamu lihat. Grafik 1 (sebelah kiri) adalah grafik sebenarnya dimana perbedaan kompetitor dan kontrol sebenarnya tidak terlalu signifikan. Namun akan berbeda cerita apabila grafik yang disajikan adalah grafik yang berada disebelahnya.

Tidak hanya itu, kebohongan statistik ketika data ditampilkan tidak hanya sebatas pada grafik, namun juga dapat berupa angka. Jika kamu menemukan angka fractions (pecahan) dalam sebuah hasil data statistik namun menurut alam sadar kamu tidak sesuai dengan data yang diolah, maka hal tersebut patut kamu tanyakan. Misal, terdapat sebanyak 7,8 orang yang setuju terhadap pernikahan sejenis di desa A. People, cannot be divided into fractions.

**

Nah.. Bagaimana sekarang pandangan kamu terhadap data statistik yang kini semakin bertambah setiap harinya dan sering kita gunakan terhadap pengambilan keputusan? Meskipun begitu, statistik adalah bidang kompleks yang tetap tidak mudah kita tentukan nilai kebenarannya hanya dalam sekilas. Terlebih lagi apabila kita ingin menganalisa metode statistik yang dipakai oleh pengolah data statistik.

Namun, mudah-mudahan artikel ini bisa cukup membantu kamu untuk lebih hati-hati dalam menggunakan atau mengkonsumsi data statistik. Karena tak bisa disangkal, kini statistik telah menjadi bagian fundamental dari perekonomian dan budaya kita sehingga orang-orang,  kebanyakan dari mereka, melihat itu sebagai kebenaran yang absolut.

Source :

[1] http://gsrpdf.lib.msu.edu/ticpdf.py?file=/2000s/2003/030521.pdf (How Statistics can lie, by James H Baird)

[2] http://www.christianitytoday.com/edstetzer/2014/march/3-ways-to-recognize-bad-stats.html (3 Ways to Recognize Bad Stats, by Ed Stetzer)

[3] https://www.ted.com/talks/mona_chalabi_3_ways_to_spot_a_bad_statistic/transcript?language=en (TED Talks : 3 ways to spot a bad statistic, by Mona Chalabi)

[4] https://www.youtube.com/watch?v=TiaVGBEFiZs (How statistics can lie, Nathan Leslie)

[5] http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddellhttps://www.youtube.com/watch?v=sxYrzzy3cq8 (TED Ed : How statistics can be misleading, Mark Liddell)

About the author

Rizky Zulkarnaen

Speaker, Writer, Engineer

Leave a Comment