Tahukah Anda bagaimana komputer belajar melindungi Anda dari orang jahat? Komputer menyaring lebih dari 60% email Anda dan dapat belajar melakukan pekerjaan yang lebih baik dalam melindungi Anda dari waktu ke waktu.

Bisakah Anda secara eksplisit mengajarkan komputer untuk mengenali orang dalam gambar? Mungkin tetapi tidak praktis untuk mengkodekan semua cara yang mungkin untuk mengenali seseorang, tetapi Anda akan segera melihat bahwa kemungkinannya hampir tidak terbatas. Agar berhasil, Anda perlu menambahkan keterampilan baru ke perangkat Anda, pembelajaran mesin.

Apa itu machine learning dan mengapa Anda harus mempedulikannya?

“machine learning adalah bidang studi yang memberikan komputer kemampuan untuk belajar tanpa diprogram secara eksplisit.” — Arthur Samuel, 1959

Definisi machine learning yang diciptakan oleh Arthur Samuel sering dikutip dan jenius dalam luasnya, tetapi itu membuat Anda bertanya-tanya tentang bagaimana komputer belajar. Untuk mencapai machine learning, para ahli mengembangkan algoritme tujuan umum yang dapat digunakan pada kelas besar masalah pembelajaran.

Saat Anda ingin menyelesaikan tugas tertentu, Anda hanya perlu memasukkan data yang lebih spesifik ke algoritme. Di satu sisi, Anda memprogram dengan memberi contoh. Dalam kebanyakan kasus, komputer akan menggunakan data sebagai sumber informasinya dan membandingkan outputnya dengan output yang diinginkan dan kemudian mengoreksinya. Semakin banyak data atau “pengalaman” yang didapat komputer, semakin baik komputer tersebut melakukan tugasnya, seperti yang dilakukan manusia.

Ketika machine learning dilihat sebagai sebuah proses, definisi berikut ini sangat masuk akal:
“machine learning adalah proses di mana komputer dapat bekerja lebih akurat saat mengumpulkan dan belajar dari data yang diberikan.” — Mike Roberts

Misalnya, saat pengguna menulis lebih banyak pesan teks di telepon, telepon belajar lebih banyak tentang kosakata umum pesan dan dapat memprediksi (pelengkapan otomatis) kata-kata mereka lebih cepat dan lebih akurat.

Dalam bidang sains yang lebih luas, machine learning adalah subbidang kecerdasan buatan dan terkait erat dengan matematika dan statistik terapan. Semua ini mungkin terdengar agak abstrak, tetapi pembelajaran mesin memiliki banyak aplikasi dalam kehidupan sehari-hari.

Aplikasi untuk machine learning dalam ilmu data

Regresi dan klasifikasi sangat penting bagi seorang ilmuwan data. Untuk mencapai tujuan ini, salah satu alat utama yang digunakan ilmuwan data adalah machine learning. Penggunaan regresi dan klasifikasi otomatis sangat luas, seperti berikut ini:

  1. Menemukan ladang minyak, tambang emas, atau situs arkeologi berdasarkan situs yang ada (klasifikasi dan regresi)
  2. Menemukan nama tempat atau orang dalam teks (klasifikasi)
  3. Mengidentifikasi orang berdasarkan gambar atau rekaman suara (klasifikasi)
  4. Mengenal burung berdasarkan peluitnya (klasifikasi)
  5. Mengidentifikasi pelanggan yang menguntungkan (regresi dan klasifikasi)
  6. Secara proaktif mengidentifikasi bagian-bagian mobil yang cenderung gagal (regresi)
  7. Mengidentifikasi tumor dan penyakit (klasifikasi)
  8. Memprediksi jumlah uang yang akan dibelanjakan seseorang untuk produk X (regresi)
  9. Memperkirakan jumlah letusan gunung berapi dalam suatu periode (regresi)
  10. Memprediksi pendapatan tahunan perusahaan Anda (regresi)
  11. Memperkirakan tim mana yang akan memenangkan Liga Champions dalam sepak bola (klasifikasi)

Kadang-kadang ilmuwan data membangun model (abstraksi realitas) yang memberikan wawasan tentang proses yang mendasari suatu fenomena. Ketika tujuan suatu model bukanlah prediksi tetapi interpretasi, itu disebut analisis akar penyebab. Berikut adalah beberapa contoh:

  1. Memahami dan mengoptimalkan proses bisnis, seperti menentukan produk mana yang menambah nilai pada lini produk
  2. Menemukan apa yang menyebabkan diabetes
  3. Menentukan penyebab kemacetan lalu lintas

Daftar aplikasi machine learning ini hanya dapat dilihat sebagai hidangan pembuka karena ada di mana-mana dalam ilmu data. Regresi dan klasifikasi adalah dua teknik penting, tetapi repertoar dan aplikasi tidak berakhir, dengan pengelompokan sebagai salah satu contoh lain dari teknik yang berharga. Teknik machine learning dapat digunakan di seluruh proses ilmu data.

Di mana machine learning digunakan dalam proses ilmu data

Meskipun machine learning terutama terkait dengan langkah pemodelan data dari proses ilmu data, ini dapat digunakan di hampir setiap langkah. Untuk menyegarkan ingatan Anda dari bab-bab sebelumnya, proses ilmu data ditunjukkan pada gambar di bawah ini.

Fase pemodelan data tidak dapat dimulai sampai Anda memiliki data mentah kualitatif yang dapat Anda pahami. Namun sebelum itu, fase persiapan data dapat memanfaatkan penggunaan machine learning. Contohnya adalah membersihkan daftar string teks; machine learning dapat mengelompokkan string yang serupa bersama-sama sehingga menjadi lebih mudah untuk memperbaiki kesalahan ejaan.

machine learning juga berguna saat menjelajahi data. Algoritme dapat membasmi pola di bawah data yang sulit ditemukan hanya dengan grafik.

Mengingat bahwa machine learning berguna selama proses ilmu data, seharusnya tidak mengejutkan bahwa sejumlah besar Python Library dikembangkan untuk membuat hidup Anda sedikit lebih mudah.

Sumber: Cielen, D., A.D.B. Meysman, and M. Ali, 2016. Introducing Data Science: Big Data, Machine Learning, and more, Using Python Tools. Manning Publications Co. Shelter Island, NY

Related Posts

Leave a Reply

Your email address will not be published. Required fields are marked *