Belajar Data Mining, Big Data dan Machine Learning (Data Science)

Blog ini tentang perjalanan dan pengalaman saya dalam mempelajari topik Penggalian Data (Data Mining), Data Besar (Big Data), Pembelajaran Mesin (Machine Learning), Internet of Things (IoT) sebagai bagian dari Data Sains (Data Science), bidang teknologi informasi yang sedang trend saat ini. Semoga tulisan ini dapat membantu teman-teman dalam mempelajari topik-topik tersebut.

Apa itu Data Sains (Data Science)

Posted on

Data Science Diagram
Drew Conway's Data Science Venn Diagram
Apa itu data sains? Data Sains (data science) adalah ekstrasi/penggalian pengetahuan dari data. Kata kuncinya ‘sains’, yang maknanya adalah mengekstrak/menggali pengetahuan tentang data dan menghasilkan produk data. Proses ekstraksi/penggalian ini menerapkan teknik dan teori-teori yang diambil dari berbagai bidang seperti matematika, statistik, dan teknologi informasi, termasuk diantaranya teknik pemrosesan sinyal, model probabilitas, pembelajaran mesin (machine learning), pembelajaran statistik (statistical learning), pemrograman komputer, rekayasa data, pengenalan pola dan pembelajaran (pattern recognition and learning), visualisasi data (data visualization), pemodelan ketidakpastian (uncertainty modeling), gudang data (data warehouse), dan komputasi kinerja tinggi (high performance computing).

Praktisi data science dikenal sebagai ahli data sains (data scientist). Mengutip Josh Wills, data scientist adalah seorang pengembang (software engineer) yang memilliki pengetahuan tentang statistik dan juga sekaligus statisti yang memiliki pengetahuan lebih tentang pengembangan perangkat lunak (software engineer) dibandingkan dengan teman seprofesinya.

Blog ini didedikasikan bagi teman-teman yang ingin mempelajari lebih lanjut mengenai data science dan topik-topik terkait lainnya seperti big data, machine leaarning, business analytics, business intelligence, internet of things (IoT), data mining, data warehouse, data visualization, bahasa pemrograman seperti CSS, d3.js, HTML 5, Javascript, Python, R, atau perangkat lunak seperti Hadoop, Mongo DB, SAS, Tableau, Qlikview, dll, dengan beberapa contoh kasus sederhana berdasarkan pengalaman dan pengetahuan saya dan rekan-rekan lain selama mempelajari topik ini. Blog ini juga terbuka bagi teman-teman yang ingin menyumbangkan pengalaman dan pengetahuannya di bidang Data Mining, Big Data dan Machine Learning (Data Science).