Dari kursus: Pengantar Kecerdasan Buatan

Data berlabel dan tidak berlabel

- Ketika Anda berpikir tentang pembelajaran mesin, kuncinya adalah fokus pada istilah pembelajaran. Apa artinya bagi mesin Anda untuk belajar? Strategi apa yang dapat Anda gunakan untuk mempelajari sesuatu yang baru? Bagaimana Anda bisa mengambil strategi dan menerapkannya pada mesin? Bayangkan Anda ingin belajar cara bermain catur. Anda dapat melakukan ini dengan beberapa cara berbeda. Anda dapat menyewa tutor catur, kemudian mereka akan memperkenalkan Anda pada beberapa bidak catur yang berbeda. Kemudian mereka akan menunjukkan kepada Anda cara memindahkannya di sekitar papan. Anda bisa berlatih dengan bermain melawan tutor Anda. Kemudian mereka akan mengawasi gerakan Anda dan membantu Anda ketika Anda melakukan kesalahan. Jika Anda tidak dapat menemukan tutor, Anda juga bisa pergi ke taman umum. Di sana Anda akan melihat orang-orang bermain. Anda tidak bisa mengajukan pertanyaan kepada mereka. Anda hanya akan diam-diam menonton dan belajar. Anda harus mencari tahu catur hanya dengan menonton pertandingan sendiri. Jika Anda melakukan ini cukup lama, Anda mungkin akan mengerti permainannya. Anda mungkin tidak tahu nama-nama bidak catur tetapi Anda akan memahami gerakan dan strategi setelah ratusan jam pengamatan. Kedua strategi ini sangat mirip dengan bagaimana mesin belajar. Sistem dapat melakukan sesuatu yang disebut pembelajaran yang diawasi. Di sini, seorang ilmuwan data bertindak seperti tutor untuk mesin. Mereka menunjukkan kepada mesin jawaban yang benar dan kemudian membiarkan sistem melatih dirinya sendiri untuk menjadi lebih baik dalam permainan. Sistem ini juga dapat melakukan pembelajaran tanpa pengawasan. Di sini Anda hanya meminta mesin membuat semua pengamatan sendiri. Sistem mungkin tidak mengetahui semua nama dan label yang berbeda, tetapi akan menemukan cara mereka untuk belajar dari data. Seperti yang dapat Anda bayangkan, kedua pendekatan ini memiliki kekuatan dan kelemahan masing-masing. Untuk pembelajaran yang diawasi, sistem perlu memiliki tutor yang berpengetahuan. Pasti ada seseorang yang tahu banyak tentang catur yang dapat menunjukkan kepada sistem cara bermain game. Dengan pembelajaran tanpa pengawasan, sistem perlu memiliki akses ke banyak data. Itulah satu-satunya cara untuk melihat polanya. Sistem mungkin tidak dapat pergi ke taman umum dan menonton ratusan orang bermain. Itu juga sedikit tergantung pada siapa yang ditontonnya. Anda membutuhkannya untuk menonton orang-orang yang merupakan pemain bagus. Seperti yang dapat Anda bayangkan, teknik ini digunakan lebih dari sekadar bermain catur. Perusahaan menggunakan teknik ini untuk mendapatkan wawasan berharga tentang pelanggan mereka. Dengan pembelajaran yang diawasi, perusahaan seperti Amazon mungkin mengidentifikasi seribu pelanggan yang menghabiskan banyak waktu berbelanja di situs web mereka. Perusahaan kemudian dapat melabeli pelanggan ini sebagai pembelanja tinggi. Kemudian sistem pembelajaran mesin akan melihat melalui pelanggan untuk menemukan pola yang membuat mereka berbelanja tinggi. Sekarang, untuk pembelajaran tanpa pengawasan, sistem pembelajaran mesin dapat diberikan akses ke semua data pelanggan Amazon. Di sini, sistem mungkin menemukan polanya sendiri dalam data. Mungkin seseorang yang membeli papan catur jauh lebih mungkin untuk membeli peralatan dapur yang mahal. Kemudian Amazon dapat menggunakan data itu untuk beriklan. Jika Anda menggunakan Amazon, Anda mungkin telah memperhatikan bahwa terkadang mereka mengiklankan produk yang tampaknya sama sekali tidak terkait dengan apa yang Anda cari tetapi itu masih sesuatu yang Anda minati untuk dibeli. Kedua teknik memiliki kekuatannya sendiri namun masing-masing dapat memberi Anda wawasan yang sangat berguna.

Konten