Beberapa minggu terakhir ini sering dapat jargon spt “mari bicara data” atau “data tak pernah berbohong”.
Memang benar bahwa bicara menggunakan data akan lebih baik dibandingkan dengan bicara tanpa data. Dan memang benar juga bahwa data tak pernah berbohong.
Namun sepertinya kita lupa bahwa kita juga bisa mempresentasikan data untuk memberikan kesimpulan yg salah. Ambil contoh data lengkap penjualan mobil dan sepeda motor pada 4 periode, tahun 2000, 2005, 2010, dan 2015 berikut:
Tahun | 2000 | 2005 | 2010 | 2015 |
Mobil | 100 | 300 | 200 | 1000 |
Motor | 2000 | 2500 | 4000 | 1500 |
Jika tabel di atas dicuplik dan dipresentasikan dalam 2 tabel berikut:
Tabel 1:
Tahun | 2005 | 2010 |
Mobil | 300 | 200 |
Motor | 2500 | 4000 |
Tabel 2:
Tahun | 2000 | 2015 |
Mobil | 100 | 1000 |
Motor | 2000 | 1500 |
Maka tabel 1 akan memperlihatkan keunggulan team sales sepeda motor karena bisa meningkatkan penjualan sepeda motor sampai 60%, dan secara implisit juga menunjukkan keburukan team sales mobil yg tingkat salesnya menurun 33%.
Sementara jika menggunakan tabel 2 akan memperlihatkan keunggulan team sales mobil karena bisa meningkatkan penjualan sampai 1000%, dan juga kali ini secara implisit menunjukkan keburukan team sales sepeda motor yg tingkat salesnya menurun 25%.
Bagaimana mungkin dari 1 tabel yg sama bisa didapat 2 kesimpulan yg bertolak belakang?
Jadi sebelum mengambil kesimpulan dari suatu data, tolong jangan lupa untuk melihat data keseluruhannya. Dan ini adalah peran data analyst lah yg bertanggung jawab untuk melakukan presentasi dari suatu data, dan itu berarti data analyst lah yg dapat menentukan apakah pimpinan dapat mengambil keputusan yg tepat atau tidak.
Apa beda data analyst, data engineer, dan data scientist?
berikutnya ya kita bahas ini 🙂