Bisa dikatakan bahwa buku karya Foster Provost dan Tom Fawcett ini merupakan buku non fiksi paling berdampak dalam jejak karir saya khususnya tentang manajemen data. Saya mengetahui buku ini atas rekomendasi oleh beberapa trainer yang saya temui saat saya mencoba memperluas cakrawala pemahaman saya dari sebelumnya di pemetaan ke hal yang lebih general yakni pengelolaan data secara umum. Buku ini bukanlah buku yang memberikan kita berbagai hal yang sangat canggih dan teknis tetapi justru memberikan kita wawasan yang lebih mendasar tentang konsep sains data.
Dengan cara pembawaan yang ringan tetapi tetap memberikan beberapa contoh teknis, buku ini menurut saya bisa dijadikan salah satu bacaan awal bagi kita untuk memasuki dunia sains data. Tujuan utama yang menurut saya cukup terpenuhi dari buku ini adalah memberikan pemahaman dasar dan memperkaya kosa kata dan logika saya tentang data yang harapannya dapat saya manfaatkan untuk dapat menjadi jembatan antara praktisi penangan kebencanan (Dunia kerja saya) dengan praktisi sains data maupun programer.
Hal inilah yang juga ditawarkan penulis pada bagian awal bukunya yang juga disertai pernyataan bahwa dalam membaca buku ini tidak harus secara runut dan utuh semuanya. Buku inibisa dibaca perbagian saja yang diangap dibutuhkan. Sama seperti kita membaca kamus yang tidak perlu kita secara runut dari A sampai Z tetapi cukup langsung saja ke bagian yang ingin kita pahami saja.
Kerangka Kerja Dasar Pengelolaan Data
Ini salah satu topik yang diawal sekali dibahas dan menurut saya menjadi dasar dan perlu kita baca dari buku ini. Topik tentang kerangka kerja Cross-Industry Standard Process for Data Mining atau yang sering disingkat menjadi CrISP – DM seperti yang ditunjukkan pada gambar di bawah ini.

Melalui kerangka kerja ini kita diajak untuk merunutkan alur kerja kita saat berhadapan dengan data yang terdiri dari 6 tahapan utama. Yang saya sukai dari kerangka kerja ini, kita tidak serta merta disuruh mengolah data tetapi lebih dari itu kita diajak untuk lebih memahami “Urusan” atau “Business” yang kita sedang hadapi. Justru pada poin inilah yang biasanya terlewat atau justru banyak pakar suatu bidang tertentu hanya melemparkan tugas saja pada tim data tanpa adanya pemahaman yang mendalam tentang ‘Urusan” yang sedang dihadapi. Hal inilah yang kemudian banyak aplikasi (khususnya” pemerintahan yang sekedar jadi saja tetapi tidak menghasilkan insight yang mendalam.
Dari pengalaman yang saya hadapi saat ini di dunia kerja tahapan ini bisa jadi merupakan salah satu tahapan yang sangat krusial. Kesalahan pemahaman sedikit saja pada awal, akan berakibat kesalahan yang besar untuk project data yang akan kita kerjakan. Bila kita tidak memahami definisi dari satu variabel, bisa saja kita salah menanganinya, apalagi setiap proses bisnis biasanya akan berbeda beda juga variabel yang berperan. Business understanding ini masih belum masuk pada pengelolaan data secara teknis dan lebih banyak dibutuhkan pemahaman konsep dan cara kerja sebuah bisnis atau urusan. Penjelasan lebih detil tentang CRIPS DM pernah saya ulas dalam tulisan di tautan ini.
Perangkat Analisis Dasar untuk Pengolahan Data
Buku ini juga selain memberikan kita pemahaman mendasar terkait alur standar pengelolaan data juga memberikan kita beberapa perangkat analisis data. Dari perangkat “yang digunakan untuk membedakan antar data “Penambahan Informasi” dan Entropi informasi, hingga berbagai model korelasi dan Segmentasi terbimbing, Hingga pada modeling regresi. dan berbagai perangkat analisis lainnya. Termasuk pemahaman bagi kita untuk memastikan agar model yang kita kembangkan tidak over fitting.
Sudah memasuki materi materi tersebut harus saya akui kian menjemukan dan cukup membuat alis saya berkerut berkali kali. 😂 Karena saat memasuki bagian ini kita juga dihadapkan pada persamaan matematis yang mendasari semua perangkat tersebut. Untungnya selain rumus rumus yang diberikan, kita juga di sampaikan berbagai logika dibaliknya dan berbagai macam implikasi dari rumus rumus tersebut.
Mungkin hanya itu yang saya dapat jelaskan pada bagian ini. Untuk banyak hal saya rasa memang perlu lebih banyak lagi saya coba baca dan pelajari lebih mendalam. Sesulit itu memang 😂. Inipun dalam buku ini penulis memberikan penjelasan bahwa yang disampaikan hanyalah perangkat standar yang ada dalam data sains, yang untuk penerapannya membutuhkan skill berpikir kritis.
A critical skill in data science is the ability to decompose a data-analytics problem into pieces such that each piece matches a known task for which tools are available.
- Foster Provost-



![[Buku] Bu, Tidak Ada Teman Menangis Malam Ini](https://dewaputuam.com/wp-content/uploads/2025/05/IMG_5783_jpg-scaled.jpg)




