Pengenalan Data Science
Definisi Data Science ?
Data science adalah ilmu yang menggabungkan matematika, statistika dan ilmu computer dengan tujuan Analisa data (data analysis) dari suatu himpunan data baik skala kecil maupun besar dengan mengaplikasikan algoritma tertentu untuk tujuan menggali data (Data Mining) dan mendapatkan pola data serta dapat melakukan prediksi data dengan cukup akurat yang dapat membantu dalam pengambilan keputusan dan dapat digunakan untuk membuat sistem yang cerdas (AI) yang memiliki kemampuan belajar dengan sendirinya (Machine Learning).
Kemampuan apa yang dibutuhkan dalam Data Science ?
- Kemampuan matematika dan statistika
- Kemampuan pemerograman (R, Python, dll)
- Kemampuan database dan query (SQL) dan pengolahan data
- Kemampuan Analisa data dan visualisasi data
- Kemampuan pemahaman masalah terkait bisnis atau suatu bidang lainnya
Perbedaan Data Science, Data Mining, dan Machine Learning
Data science melibatkan proses berikut :
- Data mining adalah proses pengambilan informasi dari pola pada himpunan data yang sebelumnya tidak diketahui, kadang disebut juga Data Discobey. Data mining focus pada ekstraksi pola menggunakan metode statistic untuk dianalisa dan dapat juga melakukan prediksi
- Machine learning adalah bidang yang merupakan bagian dari Artificial Intelligence (AI) yang digunakan agar sistem computer secara otomatis dapat belajar dengan sendirinya tanpa diberi instruksi pemerograman dan dapat meningkatkan prediksi yang akurat dan pengunaannya biasanya bersifat realtime
Data Mining dan Machine Learning merupakan bagian dari Data Science
Tujuan Data Science
Menggali data dan memberikan informasi seakurat mungkin yang digunakan untuk :
- Deskripsi : menampilkan pola data untuk dianalisa dan penemuan masalah
- Prediksi : melakukan prediksi berupa nilai, probabilitas, maupun data dan kemudian merekomendasikan hasilnya untuk digunakan sebagai alat bantu pengambilan keputusan maupu secara langsung digunakan otomatis oleh sistem
Biasanya digunakan untuk apa ?
Data Science biasa digunakan untuk banyak hal, seperti : prediksi populasi, cuaca, kondisi pasar, iklan, deteksi fraud, klasifikasi gambar, pola kebiasaan pelanggan, jenis atau karakteristik pelanggan, marketing yang lebih terarah, rekomendasi produk, AI Game, deteksi anomaly, dan masih banyak lagi.