Lompat ke isi

Pemelajaran mesin: Perbedaan antara revisi

Konten dihapus Konten ditambahkan
LabdajiwaBot (bicara | kontrib)
k Bot: Mengganti kategori Pembelajaran mesin dengan Pemelajaran mesin
RianHS (bicara | kontrib)
Merapikan subjudul
Baris 8: Baris 8:
Pada tahun 1951, [[John McCarthy]] yang baru saja mendapatkan gelar PhD meyakinkan Minsky, [[Claude Shannon]], dan [[Nathaniel Rochester]] untuk membantunya membawa peneliti Amerika Serikat yang memiliki ketertarikan pada teori automata, jaring saraf, dan studi mengenai kecerdasan menjadi satu. Mereka mengorganisir sebuah lokakarya di [[Dartmouth College]] di Hanover, New Hampshire pada tahun 1956. Pada saat itulah dianggap menjadi tahun lahirnya kecerdasan buatan. Sejak awal, para peneliti kecerdasan buatan tidak segan membuat prediksi mengenai keberhasilan dari kecerdasan buatan ini. Pada awalnya kecerdasan buatan berkembang cukup pesat, hal ini disebabkan karena ekspektasi yang terlalu tinggi dari para peneliti di bidang ini. Hingga pada tahun 1974, bidang kecerdasan buatan mulai kurang diminati. Sampai pada tahun 1980, ketertarikan terhadap kecerdasan buatan sebagai bidang penelitian mulai bangkit kembali. Salah satu yang mendukung hal ini adalah hasil kerja Yarowsky (1995), ia melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil diatas 96% untuk ke akuratan dari percobaannya. Setelah Yarowsky banyak orang-orang yang melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil yang memuaskan, dari sinilah pemelajaran mesin dapat semakin berkembang hingga hari ini <ref name=":0">S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, ''Artificial'' ''Intelligence: A Modern Approach'', vol. 2. Prentice hall Englewood Cliffs'','' 1995.</ref>.
Pada tahun 1951, [[John McCarthy]] yang baru saja mendapatkan gelar PhD meyakinkan Minsky, [[Claude Shannon]], dan [[Nathaniel Rochester]] untuk membantunya membawa peneliti Amerika Serikat yang memiliki ketertarikan pada teori automata, jaring saraf, dan studi mengenai kecerdasan menjadi satu. Mereka mengorganisir sebuah lokakarya di [[Dartmouth College]] di Hanover, New Hampshire pada tahun 1956. Pada saat itulah dianggap menjadi tahun lahirnya kecerdasan buatan. Sejak awal, para peneliti kecerdasan buatan tidak segan membuat prediksi mengenai keberhasilan dari kecerdasan buatan ini. Pada awalnya kecerdasan buatan berkembang cukup pesat, hal ini disebabkan karena ekspektasi yang terlalu tinggi dari para peneliti di bidang ini. Hingga pada tahun 1974, bidang kecerdasan buatan mulai kurang diminati. Sampai pada tahun 1980, ketertarikan terhadap kecerdasan buatan sebagai bidang penelitian mulai bangkit kembali. Salah satu yang mendukung hal ini adalah hasil kerja Yarowsky (1995), ia melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil diatas 96% untuk ke akuratan dari percobaannya. Setelah Yarowsky banyak orang-orang yang melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil yang memuaskan, dari sinilah pemelajaran mesin dapat semakin berkembang hingga hari ini <ref name=":0">S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, ''Artificial'' ''Intelligence: A Modern Approach'', vol. 2. Prentice hall Englewood Cliffs'','' 1995.</ref>.


== Perbedaan dengan ''Data Mining'' / Penggalian Data ==
== Perbedaan dengan penggalian data ==
[[Penggalian data]] (''data mining'') adalah sebuah proses untuk menemukan pengetahuan, ketertarikan, dan pola baru dalam bentuk model yang deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar <ref>M. J. Zaki, W. Meira Jr., ''Data Mining and Analysis: Fundamental Concepts and Algorithms'', Cambridge University Press, 2014.</ref>. Dengan kata lain ''data mining'' merupakan ekstraksi atau penggalian pengetahuan yang diinginkan dari data dalam jumlah yang sangat besar <ref>J. Han, M. Kamber, ''Data Mining: Concepts and Techniques'', Morgan Kaufmann, 2006.</ref>.
[[Penggalian data]] (''data mining'') adalah sebuah proses untuk menemukan pengetahuan, ketertarikan, dan pola baru dalam bentuk model yang deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar <ref>M. J. Zaki, W. Meira Jr., ''Data Mining and Analysis: Fundamental Concepts and Algorithms'', Cambridge University Press, 2014.</ref>. Dengan kata lain ''data mining'' merupakan ekstraksi atau penggalian pengetahuan yang diinginkan dari data dalam jumlah yang sangat besar <ref>J. Han, M. Kamber, ''Data Mining: Concepts and Techniques'', Morgan Kaufmann, 2006.</ref>.


Baris 34: Baris 34:
* Learning to learn: Tipe ini menggunakan algoritme untuk mempelajari yang sebelumnya.
* Learning to learn: Tipe ini menggunakan algoritme untuk mempelajari yang sebelumnya.


== Contoh Pendekatan ==
== Contoh pendekatan ==


=== ''Decision Tree ''/ Pohon keputusan ===
=== Pohon keputusan ===
Pemelajaran pohon keputusan bisa dijadikan sebagai model prediktif yang dapat memetakan pengamatan sebuah pilihan ke kesimpulan target dari pilihan tersebut. Pohon keputusan memiliki pendekatan pemodelan prediksi menggunakan statistik, ''data mining'', dan pemelajaran mesin. Pada pohon keputusan ini ''node''-''node'' daunnya akan merepresentasikan label kelas, sedangkan cabangnya merepresentasikan kaitan dari fitur-fitur yang dapat menuntun menuju label kelas yang ada. Pemelajaran pohon keputusan merupakan representasi sederhana untuk contoh pengklasifikasian. Pemelajaran pohon keputusan merupakan salah satu teknik dari ''supervised learning''. Terdapat banyak algoritme pohon keputusan, diantaranya adalah id3 (''iterative'' ''dichotomiser'' 3), c4.5, ''cart'' (''classification'' ''and'' ''regression'' ''tree''), CHAID (''CHi''-''squared'' ''Automatic'' ''Interaction'' ''Detector''), MARS, dan lain-lain.
Pemelajaran pohon keputusan bisa dijadikan sebagai model prediktif yang dapat memetakan pengamatan sebuah pilihan ke kesimpulan target dari pilihan tersebut. Pohon keputusan memiliki pendekatan pemodelan prediksi menggunakan statistik, ''data mining'', dan pemelajaran mesin. Pada pohon keputusan ini ''node''-''node'' daunnya akan merepresentasikan label kelas, sedangkan cabangnya merepresentasikan kaitan dari fitur-fitur yang dapat menuntun menuju label kelas yang ada. Pemelajaran pohon keputusan merupakan representasi sederhana untuk contoh pengklasifikasian. Pemelajaran pohon keputusan merupakan salah satu teknik dari ''supervised learning''. Terdapat banyak algoritme pohon keputusan, diantaranya adalah id3 (''iterative'' ''dichotomiser'' 3), c4.5, ''cart'' (''classification'' ''and'' ''regression'' ''tree''), CHAID (''CHi''-''squared'' ''Automatic'' ''Interaction'' ''Detector''), MARS, dan lain-lain.


Sebagai contoh pohon keputusan dapat digunakan untuk penyaringan ''email''. Dengan memasukan fitur-fitur dari ''email'' yang telah ditentukan menjadi cabangnya, dan nantinya cabang-cabang tersebut memiliki daun yang dapat menentukan ''email'' tersebut masuk ke label yang mana yang telah tersedia.
Sebagai contoh pohon keputusan dapat digunakan untuk penyaringan ''email''. Dengan memasukan fitur-fitur dari ''email'' yang telah ditentukan menjadi cabangnya, dan nantinya cabang-cabang tersebut memiliki daun yang dapat menentukan ''email'' tersebut masuk ke label yang mana yang telah tersedia.


=== ''Artificial Neural Network ''/ Jaringan Saraf Tiruan (JST) ===
=== Jaringan saraf tiruan ===
JST adalah sebuah algoritme yang didesain untuk memodelkan cara kerja jaringan saraf dalam melakukan suatu pekerjaan atau fungsi tertentu. Jaringan ini biasanya diimplementasikan dengan menggunakan komponen elektronik atau disimulasikan dalam sebuah perangkat lunak di dalam komputer digital <ref>S. Hayken, ''Neural'' ''Networks: A Comprehensive Foundation'', Macmillan College Publishing Company, 1994.</ref>.
Jaringan saraf tiruan (''artificial neural network'') adalah sebuah algoritme yang didesain untuk memodelkan cara kerja jaringan saraf dalam melakukan suatu pekerjaan atau fungsi tertentu. Jaringan ini biasanya diimplementasikan dengan menggunakan komponen elektronik atau disimulasikan dalam sebuah perangkat lunak di dalam komputer digital <ref>S. Hayken, ''Neural'' ''Networks: A Comprehensive Foundation'', Macmillan College Publishing Company, 1994.</ref>.


=== ''Clustering ''/ Pengelompokan ===
=== Pengelompokan ===
Pengelompokan merupakan salah satu pemelajaran yang tergolong dalam pemelajaran yang tidak memerlukan contoh (''unsupervised learning''). Definisi sederhana dari pengelompokan adalah sebuah proses untuk mengorganisasikan objek menjadi beberapa kelompok yang memiliki anggota yang mirip dalam hal tertentu <ref>B. R. Jipkate, V. V. Gohokar, ''A Comparative Analysis of Fuzzy C-Means Clustering and K Means Clustering Algorithms'', International Journal of Computational Engineering Research, ISSN: 2250-3005.</ref>. Algoritme pengelompokan menerima sekumpulan masukan dan kemudian membuat sebuah pembagian (kelompok-kelompok) dari masukan tersebut. Dua masukan yang berada pada kelompok yang sama seharusnya memiliki banyak kesamaan dibandingkan dengan dua masukan yang berada pada kelompok yang berbeda <ref>T. Finley, T. Joachims, ''Supervised Clustering with Support Vector Machine'', Department of Computer Science, Cornell University, Ithaca, NY 14853 USA.</ref>.
Pengelompokan (''clustering'') merupakan salah satu pemelajaran yang tergolong dalam pemelajaran yang tidak memerlukan contoh (''unsupervised learning''). Definisi sederhana dari pengelompokan adalah sebuah proses untuk mengorganisasikan objek menjadi beberapa kelompok yang memiliki anggota yang mirip dalam hal tertentu <ref>B. R. Jipkate, V. V. Gohokar, ''A Comparative Analysis of Fuzzy C-Means Clustering and K Means Clustering Algorithms'', International Journal of Computational Engineering Research, ISSN: 2250-3005.</ref>. Algoritme pengelompokan menerima sekumpulan masukan dan kemudian membuat sebuah pembagian (kelompok-kelompok) dari masukan tersebut. Dua masukan yang berada pada kelompok yang sama seharusnya memiliki banyak kesamaan dibandingkan dengan dua masukan yang berada pada kelompok yang berbeda <ref>T. Finley, T. Joachims, ''Supervised Clustering with Support Vector Machine'', Department of Computer Science, Cornell University, Ithaca, NY 14853 USA.</ref>.


Sebagai contoh, para astronom harus melakukan pengelompokan untuk menentukan tipe dari bintang-bintang berdasarkan data spektrum dari ratusan ribu bintang sehingga pada akhirnya mendapatkan istilah seperti “''red giant''” dan “''white dwarf''” <ref name=":0" />.
Sebagai contoh, para astronom harus melakukan pengelompokan untuk menentukan tipe dari bintang-bintang berdasarkan data spektrum dari ratusan ribu bintang sehingga pada akhirnya mendapatkan istilah seperti “''red giant''” dan “''white dwarf''” <ref name=":0" />.


=== ''Bayesian Network ''/ Jaringan Bayes ===
=== Jaringan Bayes ===
''Bayesian network'' diciptakan karena adanya penelitian 'Alasan Probabilistik dalam Kecerdasan Sistem oleh Judea Pearl (1988) yang menuntun pada diterimanya probabilitas dan teori keputusan dalam kecerdasan buatan. ''Bayesian'' ''Network'' secara formal diciptakan untuk memungkinkan representasi yang efisien, dan penalaran yang teliti dengan, pengetahuan pasti. ''Bayesian'' ''network'' memungkinkan untuk dapat belajar dari pengalaman serta menggabungkan kecerdasan buatan yang terbaik dan jaringan saraf. ''Bayesian network'' merupakan keluarga dari model graf probabilistik. Struktur graf ini digunakan untuk merepresentasikan pengetahuan dari suatu domain yang belum pasti. Nantinya setiap ''node'' yang ada pada graf merepresentasikan variabel acak, dimana sisi-sisi antar ''node'' tersebut merepresentasikan probabilitas ketergantungan antar variabel yang acak tersebut <ref>Ben-Gal I., ''Bayesian Networks'', in Ruggeri F., Faltin F. & Kenett R., Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons (2007).</ref>.
''Bayesian network'' diciptakan karena adanya penelitian 'Alasan Probabilistik dalam Kecerdasan Sistem oleh Judea Pearl (1988) yang menuntun pada diterimanya probabilitas dan teori keputusan dalam kecerdasan buatan. ''Bayesian'' ''Network'' secara formal diciptakan untuk memungkinkan representasi yang efisien, dan penalaran yang teliti dengan, pengetahuan pasti. ''Bayesian'' ''network'' memungkinkan untuk dapat belajar dari pengalaman serta menggabungkan kecerdasan buatan yang terbaik dan jaringan saraf. ''Bayesian network'' merupakan keluarga dari model graf probabilistik. Struktur graf ini digunakan untuk merepresentasikan pengetahuan dari suatu domain yang belum pasti. Nantinya setiap ''node'' yang ada pada graf merepresentasikan variabel acak, dimana sisi-sisi antar ''node'' tersebut merepresentasikan probabilitas ketergantungan antar variabel yang acak tersebut <ref>Ben-Gal I., ''Bayesian Networks'', in Ruggeri F., Faltin F. & Kenett R., Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons (2007).</ref>.


=== ''Inductive logic programming'' / Pemrograman logika induktif ===
=== Pemrograman logika induktif ===
Pemrograman logika induksi merupakan salah satu pendekatan pemelajaran mesin yang mempelajari konstruksi induktif dalam bentuk ''first-order'' berdasarkan contoh dan latar belakang pengetahuan yang ada <ref>S. Muggleton, L. D. Raedt, ''Inductive Logic Programming: Theory and Methods'', Journal of Logic Programming, 1994: 19, 20: 629-679.</ref>. Pendekatan ini menekankan pada representasi dari hipotesis sebagai program logika.
Pemrograman logika induksi (''inductive logic programming'') merupakan salah satu pendekatan pemelajaran mesin yang mempelajari konstruksi induktif dalam bentuk ''first-order'' berdasarkan contoh dan latar belakang pengetahuan yang ada <ref>S. Muggleton, L. D. Raedt, ''Inductive Logic Programming: Theory and Methods'', Journal of Logic Programming, 1994: 19, 20: 629-679.</ref>. Pendekatan ini menekankan pada representasi dari hipotesis sebagai program logika.


Contohnya pada pemelajaran relasi keluarga dari data yang diberikan. Proses klasifikasi dilakukan dengan memproses latar belakang pengetahuan, hipotesis, dan deskripsi yang diberikan. Deskripsi akan terdiri dari istilah seperti ''Father(Philip, Charles)'', ''Mother(Mum, Margaret)'', dan lainnya. Pada awalnya, belum latar belakang pengetahuan yang dapat digunakan. Sehingga memunculkan beberapa hipotesis seperti ''Grandparent(x,y)''. Seiring berjalannya waktu, latar belakang pengetahuan akan terus meningkat dan menemukan bahwa ''Parent(x,y) ''⟺'' ''[''Mother(x,y) ''V'' Father(x,y)'']. Dengan demikian, definisi dari ''Grandparent'' dapat dikurangi menjadi ''Grandparent(x,y)'' ⟺ [∃''z Parent(x,z)'' ∧ ''Parent(z,y)''] <ref name=":0" />.
Contohnya pada pemelajaran relasi keluarga dari data yang diberikan. Proses klasifikasi dilakukan dengan memproses latar belakang pengetahuan, hipotesis, dan deskripsi yang diberikan. Deskripsi akan terdiri dari istilah seperti ''Father(Philip, Charles)'', ''Mother(Mum, Margaret)'', dan lainnya. Pada awalnya, belum latar belakang pengetahuan yang dapat digunakan. Sehingga memunculkan beberapa hipotesis seperti ''Grandparent(x,y)''. Seiring berjalannya waktu, latar belakang pengetahuan akan terus meningkat dan menemukan bahwa ''Parent(x,y) ''⟺'' ''[''Mother(x,y) ''V'' Father(x,y)'']. Dengan demikian, definisi dari ''Grandparent'' dapat dikurangi menjadi ''Grandparent(x,y)'' ⟺ [∃''z Parent(x,z)'' ∧ ''Parent(z,y)''] <ref name=":0" />.


== Manfaat dan Contoh Implementasi ==
== Manfaat dan implementasi ==
Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritme dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritme untuk tujuan tertentu.
Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritme dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritme untuk tujuan tertentu.
Aplikasi untuk pemelajaran mesin termasuk:
Aplikasi untuk pemelajaran mesin termasuk:
Baris 86: Baris 86:
* Recommender systems
* Recommender systems


== Future Works ==
== Penerapan pada masa depan ==
Meskipun Machine Learning tidak dapat secara efektif memprediksi jengkel pengguna, kita masih percaya bahwa masih banyak yang bisa dilakukan untuk mencapai hasil yang lebih baik pada proyek ini. Pertama-tama, kumpulan data kami adalah kecil untuk metode pemelajaran mesin, kami ingin mengumpulkan lebih banyak data untuk melihat apakah meningkatkan hasil kami sama sekali.
Meskipun Machine Learning tidak dapat secara efektif memprediksi jengkel pengguna, kita masih percaya bahwa masih banyak yang bisa dilakukan untuk mencapai hasil yang lebih baik pada proyek ini. Pertama-tama, kumpulan data kami adalah kecil untuk metode pemelajaran mesin, kami ingin mengumpulkan lebih banyak data untuk melihat apakah meningkatkan hasil kami sama sekali.
Hal lain yang kita ingin mencoba adalah mengubah permainan yang memainkan pengguna . Karena kita menggunakan jenis permainan penembak, banyak " menumbuk tombol " adalah terlibat. Sesuatu yang lebih seperti permainan balap dapat bekerja lebih baik untuk mendeteksi gangguan dengan sensor gaya, karena ada lebih banyak tombol memegang terlibat daripada dengan game jenis shooter. Sebuah permainan balap juga dapat memperkenalkan lebih terkait game stres dari sebuah permainan yang melibatkan menembak.
Hal lain yang kita ingin mencoba adalah mengubah permainan yang memainkan pengguna . Karena kita menggunakan jenis permainan penembak, banyak " menumbuk tombol " adalah terlibat. Sesuatu yang lebih seperti permainan balap dapat bekerja lebih baik untuk mendeteksi gangguan dengan sensor gaya, karena ada lebih banyak tombol memegang terlibat daripada dengan game jenis shooter. Sebuah permainan balap juga dapat memperkenalkan lebih terkait game stres dari sebuah permainan yang melibatkan menembak.