Pemelajaran mesin: Perbedaan antara revisi
k r2.7.3) (bot Menambah: az:Machine learning |
Memperbaiki galat sitasi |
||
(60 revisi perantara oleh 25 pengguna tidak ditampilkan) | |||
Baris 1: | Baris 1: | ||
{{Pemelajaran mesin}} |
|||
'''Pembelajaran mesin''', cabang dari [[kecerdasan buatan]], adalah disiplin ilmu yang mencakup perancangan dan pengembangan [[algoritme]] yang memungkinkan komputer untuk mengembangkan peri laku yang didasarkan kepada [[data]] empiris, seperti dari sensor datau [[basis data]]. Sistem pembelajar dapat memanfaatkan contoh (data) untuk menangkap ciri yang diperlukan dari agihan probabilitas yang mendasarinya (yang tidak diketahui). Data dapt dilihat sebagai contoh yang mengilustrasikan hubungan antara variabel yang diamati. Fokus besar penelitian pembelajaran mesin adalah bagaimana mengenali secara otomatis pola kompleks dan membuat keputusan cerdas berdasarkan data. Kesukarannya terjadi karena himpunan semua peri laku yang mungkin, dari semua masukan yang dimungkinkan, terlalu besar untuk diliput oleh himpunan contoh pengamatan (data pelatihan). Karena itu pembelajar harus merampatkan (generalisasi) peri laku dari contoh yang ada untuk menghasilkan keluaran yang berguna dalam kasus-kasus baru. |
|||
'''Pemelajaran mesin''' ([[bahasa Inggris]]: ''machine learning'' atau disingkat dengan ML) adalah sub-bidang [[kecerdasan buatan]] yang berkaitan dengan pengembangan dan studi [[Statistika komputasi|algoritma statistik]] yang dirancang untuk dapat belajar secara mandiri dari data, kemudian menggunakan pembelajaran tersebut untuk [[Generalisasi|menggeneralisasi]] dan menangani data baru yang belum pernah ditemui sebelumnya, sehingga sistem ML dapat menjalankan tugas-tugas tertentu tanpa memerlukan instruksi eksplisit yang terprogram sebelumnya.{{refn|Definisi "tanpa harus diprogram secara eksplisit" sering dikaitkan dengan [[Arthur Samuel]], pencipta istilah "machine learning" pada tahun 1959. Namun, frasa ini tidak ditemukan secara harfiah dalam publikasi tersebut dan mungkin merupakan parafrase yang muncul kemudian. Rujuk "Parafrase Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" dalam {{Cite conference |chapter=Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming |conference=Artificial Intelligence in Design '96 |last1=Koza |first1=John R. |last2=Bennett |first2=Forrest H. |last3=Andre |first3=David |last4=Keane |first4=Martin A. |title=Artificial Intelligence in Design '96 |date=1996 |publisher=Springer, Dordrecht |pages=151–170 |language=en |doi=10.1007/978-94-009-0279-4_9 |isbn=978-94-010-6610-5 }}}} Belakangan, [[jaringan syaraf tiruan]] generatif telah menunjukkan performa yang mengungguli berbagai pendekatan konvensional dalam berbagai bidang.<ref name="ibm">{{Cite web |title=What is Machine Learning? |url=https://www.ibm.com/topics/machine-learning |access-date=2023-06-27 |website=IBM |language=en-us}}</ref><ref name=":6">{{Cite web |last=Zhou |first=Victor |date=2019-12-20 |title=Machine Learning for Beginners: An Introduction to Neural Networks |url=https://towardsdatascience.com/machine-learning-for-beginners-an-introduction-to-neural-networks-d49f22d238f9 |url-status=live |access-date=2021-08-15 |website=Medium |language=en |archive-date=2022-03-09 |archive-url=https://web.archive.org/web/20220309053518/https://towardsdatascience.com/machine-learning-for-beginners-an-introduction-to-neural-networks-d49f22d238f9 }}</ref> |
|||
Pendekatan pemelajaran mesin telah diimplementasikan di banyak bidang, seperti [[model bahasa besar|model bahasa besar]] (''large language model'' (LLM)), [[penglihatan komputer|visi komputer]], [[pengenalan ucapan]], [[penyaringan email]], [[agrikultur]], dan [[kedokteran]]. Bidang-bidang ini membutuhkan kemampuan untuk menangani tugas-tugas kompleks yang sulit dan mahal jika dikembangkan dengan algoritma tradisional.<ref name="tvt">{{Cite journal |last1=Hu |first1=Junyan |last2=Niu |first2=Hanlin |last3=Carrasco |first3=Joaquin |last4=Lennox |first4=Barry |last5=Arvin |first5=Farshad |date=2020 |title=Voronoi-Based Multi-Robot Autonomous Exploration in Unknown Environments via Deep Reinforcement Learning |journal=IEEE Transactions on Vehicular Technology |volume=69 |issue=12 |pages=14413–14423 |doi=10.1109/tvt.2020.3034800 |s2cid=228989788 |issn=0018-9545 |doi-access=free }}</ref><ref name=":7">{{cite journal |last1=Yoosefzadeh-Najafabadi|first1=Mohsen |last2=Hugh |first2=Earl |last3=Tulpan |first3=Dan |last4=Sulik |first4=John |last5=Eskandari |first5=Milad |title=Application of Machine Learning Algorithms in Plant Breeding: Predicting Yield From Hyperspectral Reflectance in Soybean? |journal=Front. Plant Sci. |volume=11 |year=2021 |pages=624273|doi=10.3389/fpls.2020.624273 |pmid=33510761 |pmc=7835636 |doi-access=free }}</ref> Pemelajaran mesin dikenal dalam aplikasinya dalam menyelesaikan masalah bisnis dengan nama [[analisis prediktif]]. Meskipun tidak semua algoritma pemelajaran mesin didasarkan pada statistik, [[statistik komputasional]] adalah sumber penting dari metode-metode di bidang ini. |
|||
{{komputer-stub}} |
|||
Landasan matematis dari pemelajaran mesin diambil dari metode [[Optimisasi|optimisasi matematis]] (pemrograman matematis). [[Penggalian data]] (''data mining''), bidang studi paralel yang erat kaitannya, berfokus pada [[analisis data eksploratif]] melalui [[pemelajaran tak terarah]].{{refn|Machine learning dan pengenalan pola "dapat dilihat sebagai dua aspek dari satu bidang yang sama".<ref name="bishop2006">{{citation|first= C. M. |last= Bishop |author-link=Christopher M. Bishop |year=2006 |title=Pattern Recognition and Machine Learning |publisher=Springer |isbn=978-0-387-31073-2}}</ref>{{rp|vii}}}}<ref>{{cite journal |last=Friedman |first=Jerome H. |author-link = Jerome H. Friedman|title=Data Mining and Statistics: What's the connection? |journal=Computing Science and Statistics |volume=29 |issue=1 |year=1998 |pages=3–9}}</ref> Dari perspektif teoretis, kerangka PAC (''Probably Approximately Correct'') ''learning'' memberikan model untuk mendeskripsikan ML. |
|||
[[Kategori:Pembelajaran mesin|Pembelajaran mesin]] |
|||
== Definisi == |
|||
Mesin yang dimaksud di sini adalah mesin dalam pengertian lebih mendekati kepada ‘sistem’, bukan mesin 'mekanik'. Istilah pemelajaran pertama kali muncul dalam disiplin ilmu [[kecerdasan buatan]]. Pemelajaran berarti menambah pengetahuan, memahami dengan belajar, dan mengikuti perintah. Pemelajaran mesin merupakan salah satu cabang dari kecerdasan buatan yang membahas mengenai pembangunan sistem yang didapat berdasarkan pada pemelajaran data, atau sebuah studi yang mempelajari cara untuk memprogram sebuah komputer untuk belajar. Inti dari pemelajaran mesin adalah representasi dan generalisasi. Pada tahun 1959, Arthur Samuel mendefinisikan bahwa pemelajaran mesin adalah bidang studi yang memberikan kemampuan untuk belajar tanpa diprogram secara eksplisit. Kemampuan belajar yang menjadi dominan ditentukan oleh kemampuan [[perangkat lunak]] atau alogaritmanya. Implementasi kemampuan belajar dapat dicapai dengan berbagai teknik, ada yang menggunakan kaidah (''rule''), ada yang menggunakan [[statistika]], ada yang menggunakan pendekatan [[fisiologi]] yaitu sistem saraf manusia atau disebut dengan ANN ([[artificial neural network]]) atau [[jaringan saraf tiruan]]. Pemelajaran mesin dapat berfungsi untuk beradaptasi dengan suatu keadaan yang baru, serta untuk mendeteksi dan memperkirakan suatu pola. |
|||
== Sejarah == |
|||
{{See also|Garis waktu pemelajaran mesin}} |
|||
Pada tahun 1951, [[John McCarthy]] yang baru saja mendapatkan gelar PhD meyakinkan Minsky, [[Claude Shannon]], dan [[Nathaniel Rochester]] untuk membantunya membawa peneliti [[Amerika Serikat]] yang memiliki ketertarikan pada teori automata, jaring saraf, dan studi mengenai kecerdasan menjadi satu. Mereka mengorganisir sebuah lokakarya di [[Dartmouth College]] di Hanover, New [[Hampshire]] pada tahun 1956. Pada saat itulah dianggap menjadi tahun lahirnya kecerdasan buatan. Sejak awal, para peneliti kecerdasan buatan tidak segan membuat prediksi mengenai keberhasilan dari kecerdasan buatan ini. Pada awalnya kecerdasan buatan berkembang cukup pesat, hal ini disebabkan karena ekspektasi yang terlalu tinggi dari para peneliti di bidang ini. Hingga pada tahun 1974, bidang kecerdasan buatan mulai kurang diminati. Sampai pada tahun 1980, ketertarikan terhadap kecerdasan buatan sebagai bidang penelitian mulai bangkit kembali. Salah satu yang mendukung hal ini adalah hasil kerja Yarowsky (1995), ia melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil diatas 96% untuk ke akuratan dari percobaannya. Setelah Yarowsky banyak orang-orang yang melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil yang memuaskan, dari sinilah pemelajaran mesin dapat semakin berkembang hingga hari ini.<ref name=":0">S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, ''Artificial'' ''Intelligence: A Modern Approach'', vol. 2. Prentice hall Englewood Cliffs'','' 1995.</ref> |
|||
== Hubungan dengan bidang lainnya == |
|||
=== Kecerdasan buatan === |
|||
[[File:AI hierarchy.svg|thumb|Pemelajaran mesin sebagai subbidang dari kecerdasan buatan<ref name="journalimcms.org">{{cite journal |vauthors=Sindhu V, Nivedha S, Prakash M |date=February 2020|title=An Empirical Science Research on Bioinformatics in Machine Learning |journal=Journal of Mechanics of Continua and Mathematical Sciences |issue=7 |doi=10.26782/jmcms.spl.7/2020.02.00006 |doi-access=free}}</ref>]] |
|||
Sebagai hasil dari upaya ilmiah, pemelajaran mesin berkembang dari penelitian tentang [[kecerdasan buatan]] (AI). Pada masa-masa awal AI sebagai suatu [[disiplin ilmu]], beberapa peneliti tertarik untuk menjadikan mesin belajar dari data. Mereka berusaha melakukan pendekatan dengan berbagai metode simbolis, serta apa yang kemudian disebut sebagai ''[[jaringan syaraf tiruan]]'' yang kebanyakannya berupa [[perseptron]] dan [[ADALINE]], yang kemudian dikenal sebagai penemuan ulang (''reinvention'') dari [[model linear umum]] statistik.<ref>{{cite book |last1=Sarle |first1=Warren S. |chapter=Neural Networks and statistical models |pages=1538-50 |year=1994 |title=SUGI 19: proceedings of the Nineteenth Annual SAS Users Group International Conference |publisher=SAS Institute |isbn=9781555446116 |oclc=35546178}}</ref> [[Penalaran probabilistik]] juga digunakan, terutama dalam [[diagnosis medis otomatis]].<ref name="aima">{{cite AIMA|edition=2}}</ref>{{rp|488}} |
|||
Meskipun begitu, peningkatan fokus pada pendekatan [[Kecerdasan buatan simbolis|logis, berbasis pengetahuan]], menyebabkan terjadinya kesenjangan antara kecerdasan buatan dan pemelajaran mesin. Sistem penalaran probabilistik terkendala oleh masalah teoritis dan praktik dari akuisisi dan representasi data.<ref name="aima" />{{rp|488}} Pada tahun 1980, [[sistem pakar]] telah mendominasi AI, dan statistik tidak lagi disukai dan ditinggalkan.<ref name="changing">{{Cite journal | last1 = Langley | first1 = Pat | title = The changing science of machine learning | doi = 10. 1007/s10994-011-5242-y | journal = [[Machine Learning (journal)|Machine Learning]] | volume = 82 | issue = 3 | pages = 275-9 | year = 2011 | doi-access = free }}</ref> Penelitian pada pemelajaran berbasis simbolik/pengetahuan memang terus berlanjut di dalam AI, yang mengarah pada [[pemrograman logika induktif]], tetapi jalur penelitian yang lebih statistik sekarang berada di luar bidang AI yang sebenarnya, yaitu di bidang [[pengenalan pola]] dan [[pencarian informasi]]. <ref name="aima" />{{rp|708-710; 755}} Selain itu, riset jaringan syaraf telah ditinggalkan oleh AI dan [[ilmu komputer]] pada waktu yang sama. Bidang ini kemudian dilanjutkan di luar bidang AI/Ilmu komputer, sebagai "[[koneksionisme]]", oleh para peneliti dari disiplin ilmu lain, termasuk [[John Hopfield|Hopfield]], [[David Rumelhart|Rumelhart]], dan [[Geoff Hinton|Hinton]]. Keberhasilan utama mereka datang pada pertengahan tahun 1980-an dengan ditemukannya kembali [[backpropagation]].<ref name="aima" />{{rp|25}} |
|||
Pemelajaran mesin (''machine learning''/ML) kemudian ditata ulang dan diakui sebagai bidang tersendiri, dan mulai berkembang pada tahun 1990-an. Mulai saat itu, bidang ini berubah tujuannya dari yang awalnya untuk mencapai ''kecerdasan buatan'', menjadi untuk menyelesaikan masalah-masalah yang dapat dipecahkan yang bersifat praktis. Kejadian ini menyebabkan pergeseran fokus dari [[kecerdasan buatan simbolik|pendekatan simbolik]] yang diwarisi dari AI, ke arah metode dan pemodelan yang diambil dari statistika, yaitu [[logika fuzzy]], dan [[teori probabilitas]].<ref name="changing" /> |
|||
=== Penggalian data === |
|||
Pembelajaran mesin dan [[penggalian data]] sering menggunakan metode yang sama dan saling tumpang tindih. Sementara pemelajaran mesin berfokus pada prediksi berdasarkan properti "yang sudah diketahui" yang diperoleh dari data pelatihan, [[penggalian data]] berfokus pada [[penemuan (observasi)]] properti "yang tidak diketahui" sebelumnya dalam data (ini merupakan langkah analisis dari [[penemuan pengetahuan]] dalam basis data). [[Penggalian data]] menggunakan banyak metode pemelajaran mesin, tetapi dengan tujuan yang berbeda; di sisi lain, pemelajaran mesin juga menggunakan metode penggalian data sebagai [[pemelajaran tak terarah|pemelajaran tak terawasi]] atau sebagai langkah prapemrosesan untuk meningkatkan akurasi pemelajar. Sebagian besar kerancuan antara dua komunitas penelitian ini (yang sering memiliki konferensi dan jurnal terpisah, [[ECML PKDD]] menjadi pengecualian utama) berasal dari asumsi dasar yang mereka gunakan, yaitu dalam pemelajaran mesin, performa biasanya dievaluasi dengan mempertimbangkan kemampuan untuk "mereproduksi" pengetahuan yang sudah diketahui, sedangkan penemuan pengetahuan dan penggalian data (KDD) memiliki tugas utama untuk menemukan pengetahuan yang sebelumnya "tidak diketahui". Jika dibandingkan dengan pengetahuan yang sudah diketahui, suatu metode yang tidak terinformasi (''unsupervised'') akan dengan mudah dikalahkan oleh metode lain yang terawasi, sedangkan dalam tugas KDD, metode yang terawasi tidak dapat digunakan karena tidak tersedianya data pelatihan. |
|||
Pemelajaran mesin juga memiliki hubungan yang erat dengan [[Optimasi matematis]]: banyak masalah pemelajaran yang dirumuskan sebagai minimalisasi dari beberapa [[fungsi kerugian]] dalam satu set pelatihan. Fungsi kerugian mengekspresikan selisih antara prediksi model yang sedang dilatih dan contoh masalah yang sebenarnya (misalnya, dalam klasifikasi, seseorang ingin memberikan label pada contoh, dan model dilatih untuk memprediksi dengan benar label yang telah ditetapkan sebelumnya dari sekumpulan contoh).<ref>{{cite encyclopedia |last1=Le Roux |first1=Nicolas |first2=Yoshua |last2=Bengio |first3=Andrew |last3=Fitzgibbon |title=Improving First and Second-Order Methods by Modeling Uncertainty |encyclopedia=Optimization for Machine Learning |year=2012 |page=404 |editor1-last=Sra |editor1-first=Suvrit |editor2-first=Sebastian |editor2-last=Nowozin |editor3-first=Stephen J. |editor3-last=Wright |publisher=MIT Press |url=https://books.google.com/books?id=JPQx7s2L1A8C&q=%22Improving+First+and+Second-Order+Methods+by+Modeling+Uncertainty&pg=PA403 |isbn=9780262016469 |access-date=2020-11-12 |archive-date=2023-01-17 |archive-url=https://web.archive.org/web/20230117053335/https://books.google.com/books?id=JPQx7s2L1A8C&q=%22Improving+First+and+Second-Order+Methods+by+Modeling+Uncertainty&pg=PA403 |url-status=live }}</ref> |
|||
=== Generalisasi === |
|||
Perbedaan antara pengoptimalan dan pemelajaran mesin muncul dari tujuan [[generalisasi (pemelajaran)]]. Sementara algoritma pengoptimalan dapat meminimalkan kerugian pada kumpulan data pelatihan, pemelajaran mesin berkaitan dengan meminimalkan kerugian pada sampel yang tidak terlihat. Karakterisasi generalisasi berbagai algoritma pembelajaran adalah topik aktif penelitian saat ini, terutama untuk algoritma [[pemelajaran dalam]]. |
|||
=== Statistik === |
|||
Pemelajaran mesin dan [[statistika]] adalah bidang yang berkaitan erat dari segi metode, tetapi memiliki tujuan utama yang berbeda, yaitu statistika mengambil [[kesimpulan statistik]] dari [[sampel (statistika)|sampel]], sedangkan pemelajaran mesin menemukan pola prediksi yang dapat digeneralisasi.<ref>{{cite journal |first1=Danilo |last1=Bzdok |first2=Naomi |last2=Altman |author-link2=Naomi Altman |first3=Martin |last3=Krzywinski |title=Statistics versus Machine Learning |journal=[[Nature Methods]] |volume=15 |issue=4 |pages=233–234 |year=2018 |doi=10.1038/nmeth.4642 |pmid=30100822 |pmc=6082636 }}</ref> Menurut [[Michael I. Jordan]], ide-ide pemelajaran mesin, mulai dari prinsip-prinsip metodologis hingga alat-alat teoritis, memiliki pra-sejarah yang panjang di bidang statistika.<ref name="mi jordan ama">{{cite web|url=https://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/ckelmtt?context=3|title=statistics and machine learning|publisher=reddit|date=2014-09-10|access-date=2014-10-01|author=Michael I. Jordan|author-link=Michael I. Jordan|archive-date=2017-10-18|archive-url=https://web.archive.org/web/20171018192328/https://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/ckelmtt/?context=3|url-status=live}}</ref> Ia juga mengusulkan istilah [[ilmu data]] sebagai tempat penampung (placeholder) untuk menyebut keseluruhan bidang tersebut.<ref name="mi jordan ama" /> |
|||
Analisis statistik konvensional memerlukan pemilihan model yang paling cocok untuk kumpulan data penelitian secara priori. Selain itu, hanya variabel yang penting atau relevan berdasarkan pengalaman sebelumnya yang disertakan untuk dianalisis. Sebaliknya, pemelajaran mesin tidak dibangun di atas model yang sudah terstruktur sebelumnya, melainkan menggunakan data untuk membentuk model yang ada untuk mendeteksi pola-pola yang ada. Semakin banyak variabel (input) yang digunakan untuk melatih model, semakin akurat model akhir yang dihasilkan.<ref>Hung et al. Algorithms to Measure Surgeon Performance and Anticipate Clinical Outcomes in Robotic Surgery. JAMA Surg. 2018</ref> |
|||
[[Leo Breiman]] membedakan dua paradigma pemodelan statistik: model data dan model algoritmik,<ref name=":4">{{cite journal|url=http://projecteuclid.org/download/pdf_1/euclid.ss/1009213726|title=Breiman: Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)|author=Cornell University Library|journal=Statistical Science|date=August 2001|volume=16|issue=3|doi=10.1214/ss/1009213726|s2cid=62729017|access-date=8 August 2015|archive-date=26 June 2017|archive-url=https://web.archive.org/web/20170626042637/http://projecteuclid.org/download/pdf_1/euclid.ss/1009213726|url-status=live|doi-access=free}}</ref> dengan "model algoritmik" kurang lebih berarti algoritma pemelajaran mesin seperti [[Random Forest]]. |
|||
Beberapa ahli statistik mengadopsi metode dari pemelajaran mesin, yang mengarah pada bidang gabungan yang mereka sebut sebagai ''pemelajaran statistik''.<ref name="islr">{{cite book |author1=Gareth James |author2=Daniela Witten |author3=Trevor Hastie |author4=Robert Tibshirani |title=An Introduction to Statistical Learning |publisher=Springer |year=2013 |url=http://www-bcf.usc.edu/~gareth/ISL/ |page=vii |access-date=2014-10-25 |archive-date=2019-06-23 |archive-url=https://web.archive.org/web/20190623150237/http://www-bcf.usc.edu/~gareth/ISL/ |url-status=live }}</ref> |
|||
=== Fisika === |
|||
Teknik analitis dan komputasi yang diturunkan dari ilmu fisika yang mengakar pada sistem yang tidak teratur dapat diperluas ke permasalahan berskala besar, termasuk pemelajaran mesin, misalnya, untuk menganalisis ruang bobot [[jaringan syaraf tiruan dalam]].<ref>[Ramezanpour, A.; Beam, A.L.; Chen, J.H.; Mashaghi, A. Statistical Physics for Medical Diagnostics: Learning, Inference, and Optimization Algorithms. Diagnostics 2020, 10, 972. ]</ref> Dengan demikian, fisika statistik dimaksudkan untuk menemukan aplikasi dalam bidang [[diagnostik medis]].<ref>[Mashaghi, A.; Ramezanpour, A. Statistical physics of medical diagnostics: Study of a probabilistic model. Phys. Rev. E 97, 032118 (2018)]</ref> |
|||
== Perbedaan dengan penggalian data == |
|||
[[Penggalian data]] (''data mining'') adalah sebuah proses untuk menemukan pengetahuan, ketertarikan, dan pola baru dalam bentuk model yang deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar.<ref>M. J. Zaki, W. Meira Jr., ''Data Mining and Analysis: Fundamental Concepts and Algorithms'', Cambridge University Press, 2014.</ref> Dengan kata lain ''data mining'' merupakan ekstraksi atau penggalian pengetahuan yang diinginkan dari data dalam jumlah yang sangat besar.<ref>J. Han, M. Kamber, ''Data Mining: Concepts and Techniques'', Morgan Kaufmann, 2006.</ref> |
|||
Dari definisi diatas dapat disimpulkan bahwa pada pemelajaran mesin berkaitan dengan studi, desain dan pengembangan dari suatu algoritma yang dapat memungkinkan sebuah komputer dapat belajar tanpa harus diprogram secara eksplisit. Sedangkan pada ''data mining'' dilakukan proses yang dimulai dari data yang tidak terstruktur lalu diekstrak agar mendapatkan suatu pengetahuan ataupun sebuah pola yang belum diketahui. Selama proses ''data mining'' itulah algoritma dari pemelajaran mesin digunakan. |
|||
== Tipe algoritma == |
|||
[[Algoritme|algoritma]] dalam pemelajaran mesin dapat dikelompokkan berdasarkan masukan dan keluaran yang diharapkan dari algoritma. |
|||
* [[Pemelajaran terarah|Pemelajaran terarah]] (''supervised learning'') membuat fungsi yang memetakan masukan ke keluaran yang dikehendaki, misalnya pada pengelompokan (klasifikasi). |
|||
:Pemelajaran terarah merupakan algoritma yang mempelajari sekumpulan contoh pasangan masukan-keluaran yang diinginkan dalam jumlah yang cukup besar. algoritma ini menggunakan data latih (''data train''), yaitu data-data yang sudah diberi label untuk melakukan pemelajaran. Metode ini bertujuan agar mesin mampu mengidentifikasi label input baru dengan menggunakan fitur yang ada untuk melakukan prediksi maupun klasifikasi. Dengan mengamati data-data tersebut, metode ini akan menghasilkan sebuah model yang mampu memetakan masukan yang baru menjadi keluaran yang tepat.<ref name=":0" /> |
|||
:Salah satu contoh yang paling sederhana adalah terdapat sekumpulan contoh masukan berupa umur seseorang dan contoh keluaran yang berupa tinggi badan orang tersebut. algoritma pemelajaran melalui contoh mengamati contoh-contoh tersebut dan kemudian mempelajari sebuah fungsi yang pada akhirnya dapat "memperkirakan" tinggi badan seseorang berdasarkan masukan umur orang tersebut. |
|||
:Contoh implementasi dengan metode ini adalah pada kasus deteksi spam pada surel. Data latih yang digunakan akan diberi label berupa spam dan bukan spam. Mesin akan mempelajari data-data tersebut melalui proses ''learning'' sehingga dapat menghasilkan keluaran berupa mesin yang sudah terlatih untuk mengelompokkan surel yang spam dan bukan spam. |
|||
* [[Pemelajaran tak terarah|Pemelajaran tak terarah]] (''unsupervised learning'') memodelkan himpunan masukan, seperti penggolongan (''clustering''). |
|||
:Algoritma ini mempunyai tujuan untuk mempelajari dan mencari pola-pola menarik pada masukan yang diberikan.<ref>K. P. Murphy, ''Machine Learning: A Probabilistic Perspective'', The MIT Press, Cambridge, Massachusetts, London, England.</ref> Meskipun tidak disediakan keluaran yang tepat secara eksplisit. Salah satu algoritma ''unsupervised learning'' yang paling umum digunakan adalah ''clustering'' atau pengelompokan.<ref name=":0" /> |
|||
:Berbeda dengan metode sebelumnya, metode ini tidak menggunakan data latih dalam melakukan pemelajaran. Dengan kata lain, data-data yang diberikan kepada mesin adalah data-data yang tidak berlabel sehingga mesin dapat mempelajari data-data tersebut berdasarkan fitur-fiturnya. algoritma ini tidak memiliki variabel target dan bertujuan untuk mengelompokkan objek yang serupa dalam suatu area tertentu. |
|||
:Contoh ''unsupervised learning'' dalam dunia nyata, misalnya seorang supir taksi yang secara perlahan-lahan menciptakan konsep "macet" dan "tidak macet" tanpa pernah diberikan contoh oleh siapapun.<ref name=":0" /> |
|||
* Pemelajaran semi terarah (''semi-supervised learning''), yakni tipe yang menggabungkan antara ''supervised'' dan ''unsupervised'' untuk menghasilkan suatu fungsi. |
|||
:Algoritma pemelajaran semi terarah menggabungkan kedua tipe algoritma di atas, di mana diberikan contoh masukan-keluaran yang tepat dalam jumlah sedikit dan sekumpulan masukan yang keluarannya belum diketahui. algoritma ini harus membuat sebuah rangkaian kesatuan antara dua tipe algoritma di atas untuk dapat menutupi kelemahan pada masing-masing algoritma.<ref name=":0" /> |
|||
:Misalnya sebuah sistem yang dapat menebak umur seseorang berdasarkan foto orang tersebut. Sistem tersebut membutuhkan beberapa contoh, misalnya yang didapatkan dengan mengambil foto seseorang dan menanyakan umurnya (pemelajaran terarah). Akan tetapi, pada kenyataannya beberapa orang sering kali berbohong tentang umur mereka sehingga menimbulkan ''noise'' pada data. Oleh karena itu, digunakan juga pemelajaran tak terarah agar dapat saling menutupi kelemahan masing-masing, yaitu ''noise'' pada data dan ketiadaan contoh masukan-keluaran.<ref name=":0" /> |
|||
* Reinforcement learning: Tipe ini mengajarkan bagaimana cara bertindak untuk menghadapi suatu masalah, yang suatu tindakan itu mempunyai dampak. Adalah sebuah algoritma pemelajaran yang diterapkan pada agen cerdas agar ia dapat menyesuaikan dengan kondisi dilingkungannya, hal ini dicapai dengan cara memaksimalkan nilai dari hadiah ‘''reward''’ yang dapat dicapai. Suatu hadiah didefinisikan sebuah tanggapan balik ‘''feedback''’ dari tindakan agen bahwa sesuatu baik terjadi <ref name=":0" />.Sebagai contoh, sangatlah sulit untuk memrogram sebuah agen untuk menerbangkan sebuah helikopter, tetapi dengan memberikan beberapa nilai negatif untuk menabrak, bergoyang-goyang, serta melenceng dari jalur tujuan perlahan-lahan agen tersebut dapat belajar menerbangkan helikopter dengan lebih baik.<ref name=":0" /> |
|||
* Pemelajaran berkembang (''developmental learning algorithm'') adalah sebuah bidang yang bertujuan untuk mempelajari mekanisme pengembangan, arsiterktur, dan batasan yang memungkinkan dibuatnya metode pemelajaran yang berlaku seumur hidup, serta bersifat terbuka terhadap kemampuan dan pengetahuan untuk dipasangkan kepada mesin.<ref>https://en.wiki-indonesia.club/wiki/Machine_learning</ref> |
|||
* Transduction: Tipe ini hampir mirip dengan Supervised Learning, tapi tidak secara jelas untuk membangun suatu fungsi melainkan mencoba memprediksi output baru yang berdasarkan dari input baru, masukan pelatihan input dan output |
|||
* Learning to learn: Tipe ini menggunakan algoritma untuk mempelajari yang sebelumnya. |
|||
== Contoh pendekatan == |
|||
=== Pohon keputusan === |
|||
Pemelajaran pohon keputusan bisa dijadikan sebagai model prediktif yang dapat memetakan pengamatan sebuah pilihan ke kesimpulan target dari pilihan tersebut. Pohon keputusan memiliki pendekatan pemodelan prediksi menggunakan statistik, ''data mining'', dan pemelajaran mesin. Pada pohon keputusan ini ''node''-''node'' daunnya akan merepresentasikan label kelas, sedangkan cabangnya merepresentasikan kaitan dari fitur-fitur yang dapat menuntun menuju label kelas yang ada. Pemelajaran pohon keputusan merupakan representasi sederhana untuk contoh pengklasifikasian. pemelajaran pohon keputusan merupakan salah satu teknik dari ''supervised learning''. Terdapat banyak algoritma pohon keputusan, diantaranya adalah id3 (''iterative'' ''dichotomiser'' 3), c4.5, ''cart'' (''classification'' ''and'' ''regression'' ''tree''), CHAID (''CHi''-''squared'' ''Automatic'' ''Interaction'' ''Detector''), MARS, dan lain-lain. |
|||
Sebagai contoh pohon keputusan dapat digunakan untuk penyaringan ''email''. Dengan memasukan fitur-fitur dari ''email'' yang telah ditentukan menjadi cabangnya, dan nantinya cabang-cabang tersebut memiliki daun yang dapat menentukan ''email'' tersebut masuk ke label yang mana yang telah tersedia. |
|||
=== Jaringan saraf tiruan === |
|||
Jaringan saraf tiruan (''artificial neural network'') adalah sebuah algoritma yang didesain untuk memodelkan cara kerja jaringan saraf dalam melakukan suatu pekerjaan atau fungsi tertentu. Jaringan ini biasanya diimplementasikan dengan menggunakan komponen elektronik atau disimulasikan dalam sebuah perangkat lunak di dalam komputer digital.<ref>S. Hayken, ''Neural'' ''Networks: A Comprehensive Foundation'', Macmillan College Publishing Company, 1994.</ref> |
|||
=== Pengelompokan === |
|||
Pengelompokan (''clustering'') merupakan salah satu pemelajaran yang tergolong dalam pemelajaran yang tidak memerlukan contoh (''unsupervised learning''). Definisi sederhana dari pengelompokan adalah sebuah proses untuk mengorganisasikan objek menjadi beberapa kelompok yang memiliki anggota yang mirip dalam hal tertentu.<ref>B. R. Jipkate, V. V. Gohokar, ''A Comparative Analysis of Fuzzy C-Means Clustering and K Means Clustering Algorithms'', International Journal of Computational Engineering Research, ISSN: 2250-3005.</ref> algoritma pengelompokan menerima sekumpulan masukan dan kemudian membuat sebuah pembagian (kelompok-kelompok) dari masukan tersebut. Dua masukan yang berada pada kelompok yang sama seharusnya memiliki banyak kesamaan dibandingkan dengan dua masukan yang berada pada kelompok yang berbeda.<ref>T. Finley, T. Joachims, ''Supervised Clustering with Support Vector Machine'', Department of Computer Science, Cornell University, Ithaca, NY 14853 USA.</ref> |
|||
Sebagai contoh, para astronom harus melakukan pengelompokan untuk menentukan tipe dari bintang-bintang berdasarkan data spektrum dari ratusan ribu bintang sehingga pada akhirnya mendapatkan istilah seperti “''red giant''” dan “''white dwarf''”.<ref name=":0" /> |
|||
=== Jaringan Bayes === |
|||
''Bayesian network'' diciptakan karena adanya penelitian 'Alasan Probabilistik dalam Kecerdasan Sistem oleh Judea Pearl (1988) yang menuntun pada diterimanya probabilitas dan teori keputusan dalam kecerdasan buatan. ''Bayesian'' ''Network'' secara formal diciptakan untuk memungkinkan representasi yang efisien, dan penalaran yang teliti dengan, pengetahuan pasti. ''Bayesian'' ''network'' memungkinkan untuk dapat belajar dari pengalaman serta menggabungkan kecerdasan buatan yang terbaik dan jaringan saraf. ''Bayesian network'' merupakan keluarga dari model graf probabilistik. Struktur graf ini digunakan untuk merepresentasikan pengetahuan dari suatu domain yang belum pasti. Nantinya setiap ''node'' yang ada pada graf merepresentasikan variabel acak, dimana sisi-sisi antar ''node'' tersebut merepresentasikan probabilitas ketergantungan antar variabel yang acak tersebut.<ref>Ben-Gal I., ''Bayesian Networks'', in Ruggeri F., Faltin F. & Kenett R., Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons (2007).</ref> |
|||
=== Pemrograman logika induktif === |
|||
Pemrograman logika induksi (''inductive logic programming'') merupakan salah satu pendekatan pemelajaran mesin yang mempelajari konstruksi induktif dalam bentuk ''first-order'' berdasarkan contoh dan latar belakang pengetahuan yang ada.<ref>S. Muggleton, L. D. Raedt, ''Inductive Logic Programming: Theory and Methods'', Journal of Logic Programming, 1994: 19, 20: 629-679.</ref> Pendekatan ini menekankan pada representasi dari hipotesis sebagai program logika. |
|||
Contohnya pada pemelajaran relasi keluarga dari data yang diberikan. Proses klasifikasi dilakukan dengan memproses latar belakang pengetahuan, hipotesis, dan deskripsi yang diberikan. Deskripsi akan terdiri dari istilah seperti ''Father(Philip, Charles)'', ''Mother(Mum, Margaret)'', dan lainnya. Pada awalnya, belum latar belakang pengetahuan yang dapat digunakan. Sehingga memunculkan beberapa hipotesis seperti ''Grandparent(x,y)''. Seiring berjalannya waktu, latar belakang pengetahuan akan terus meningkat dan menemukan bahwa ''Parent(x,y) ''⟺'' ''[''Mother(x,y) ''V'' Father(x,y)'']. Dengan demikian, definisi dari ''Grandparent'' dapat dikurangi menjadi ''Grandparent(x,y)'' ⟺ [∃''z Parent(x,z)'' ∧ ''Parent(z,y)''].<ref name=":0" /> |
|||
== Manfaat dan implementasi == |
|||
Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritma dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritma untuk tujuan tertentu. |
|||
Aplikasi untuk pemelajaran mesin termasuk: |
|||
* Machine perception |
|||
* Computer vision, including object recognition |
|||
* Natural language processing |
|||
* Syntactic pattern recognition |
|||
* Machine learning |
|||
* Medical diagnosis |
|||
* Bioinformatics |
|||
* Brain-machine interfaces |
|||
* Cheminformatics |
|||
* Detecting credit card fraud |
|||
* Stock market analysis |
|||
* Classifying DNA sequences |
|||
* Sequence mining |
|||
* Speech and handwriting recognition |
|||
* Games |
|||
* Software engineering |
|||
* Adaptive websites |
|||
* Robot locomotion |
|||
* Computational advertising |
|||
* Computational finance |
|||
* Structural health monitoring |
|||
* Sentiment analysis (or opinion mining) |
|||
* Affective computing |
|||
* Menerima Informasi |
|||
* Recommender systems |
|||
== Penerapan pada masa depan == |
|||
Meskipun Machine Learning tidak dapat secara efektif memprediksi jengkel pengguna, kita masih percaya bahwa masih banyak yang bisa dilakukan untuk mencapai hasil yang lebih baik pada proyek ini. Pertama-tama, kumpulan data kami adalah kecil untuk metode pemelajaran mesin, kami ingin mengumpulkan lebih banyak data untuk melihat apakah meningkatkan hasil kami sama sekali. |
|||
Hal lain yang kita ingin mencoba adalah mengubah permainan yang memainkan pengguna . Karena kita menggunakan jenis permainan penembak, banyak " menumbuk tombol " adalah terlibat. Sesuatu yang lebih seperti permainan balap dapat bekerja lebih baik untuk mendeteksi gangguan dengan sensor gaya, karena ada lebih banyak tombol memegang terlibat daripada dengan game jenis shooter. Sebuah permainan balap juga dapat memperkenalkan lebih terkait game stres dari sebuah permainan yang melibatkan menembak. |
|||
== Lihat pula == |
|||
* [[Pengenalan pola]] |
|||
* [[Pemelajaran dalam|Pemelajaran dalam]] |
|||
== Referensi == |
|||
<references /> |
|||
== Bacaan lanjutan == |
|||
{{refbegin|30em}} |
|||
* Nils J. Nilsson, ''[https://ai.stanford.edu/people/nilsson/mlbook.html Introduction to Machine Learning] {{Webarchive|url=https://web.archive.org/web/20190816182600/http://ai.stanford.edu/people/nilsson/mlbook.html |date=2019-08-16 }}''. |
|||
* [[Trevor Hastie]], [[Robert Tibshirani]] and [[Jerome H. Friedman]] (2001). ''[https://web.stanford.edu/~hastie/ElemStatLearn/ The Elements of Statistical Learning] {{Webarchive|url=https://web.archive.org/web/20131027220938/http://www-stat.stanford.edu/%7Etibs/ElemStatLearn// |date=2013-10-27 }}'', Springer. {{ISBN|0-387-95284-5}}. |
|||
* [[Pedro Domingos]] (September 2015), ''[[The Master Algorithm]]'', Basic Books, {{ISBN|978-0-465-06570-7}} |
|||
* Ian H. Witten and Eibe Frank (2011). ''Data Mining: Practical machine learning tools and techniques'' Morgan Kaufmann, 664pp., {{ISBN|978-0-12-374856-0}}. |
|||
* Ethem Alpaydin (2004). ''Introduction to Machine Learning'', MIT Press, {{ISBN|978-0-262-01243-0}}. |
|||
* [[David J. C. MacKay]]. ''[http://www.inference.phy.cam.ac.uk/mackay/itila/book.html Information Theory, Inference, and Learning Algorithms] {{Webarchive|url=https://web.archive.org/web/20160217105359/http://www.inference.phy.cam.ac.uk/mackay/itila/book.html |date=2016-02-17 }}'' Cambridge: Cambridge University Press, 2003. {{ISBN|0-521-64298-1}} |
|||
* [[Richard O. Duda]], [[Peter E. Hart]], David G. Stork (2001) ''Pattern classification'' (2nd edition), Wiley, New York, {{ISBN|0-471-05669-3}}. |
|||
* [[Christopher Bishop]] (1995). ''Neural Networks for Pattern Recognition'', Oxford University Press. {{ISBN|0-19-853864-2}}. |
|||
* Stuart Russell & Peter Norvig, (2009). ''[http://aima.cs.berkeley.edu/ Artificial Intelligence – A Modern Approach] {{Webarchive|url=https://web.archive.org/web/20110228023805/http://aima.cs.berkeley.edu/ |date=2011-02-28 }}''. Pearson, {{ISBN|9789332543515}}. |
|||
* [[Ray Solomonoff]], ''An Inductive Inference Machine'', IRE Convention Record, Section on Information Theory, Part 2, pp., 56–62, 1957. |
|||
* [[Ray Solomonoff]], ''[http://world.std.com/~rjs/indinf56.pdf An Inductive Inference Machine] {{Webarchive|url=https://web.archive.org/web/20110426161749/http://world.std.com/~rjs/indinf56.pdf |date=2011-04-26 }}'' A privately circulated report from the 1956 [[Dartmouth workshop|Dartmouth Summer Research Conference on AI]]. |
|||
* Kevin P. Murphy (2021). ''[https://probml.github.io/pml-book/book1.html Probabilistic Machine Learning: An Introduction] {{Webarchive|url=https://web.archive.org/web/20210411153246/https://probml.github.io/pml-book/book1.html |date=2021-04-11 }}'', MIT Press. |
|||
{{Refend}} |
|||
{{komputer-stub}} |
|||
[[Kategori:Pemelajaran mesin]] |
|||
[[ar:تعلم آلي]] |
|||
[[az:Machine learning]] |
|||
[[bg:Машинно обучение]] |
|||
[[ca:Aprenentatge automàtic]] |
|||
[[cs:Strojové učení]] |
|||
[[de:Maschinelles Lernen]] |
|||
[[el:Μηχανική μάθηση]] |
|||
[[en:Machine learning]] |
|||
[[es:Aprendizaje automático]] |
|||
[[et:Masinõppimine]] |
|||
[[fa:یادگیری ماشینی]] |
|||
[[fi:Koneoppiminen]] |
|||
[[fr:Apprentissage automatique]] |
|||
[[he:למידה חישובית]] |
|||
[[it:Apprendimento automatico]] |
|||
[[ja:機械学習]] |
|||
[[kn:ಯಂತ್ರ ಕಲಿಕೆ]] |
|||
[[ko:기계 학습]] |
|||
[[lt:Sistemos mokymasis]] |
|||
[[lv:Mašīnmācīšanās]] |
|||
[[mk:Машинско учење]] |
|||
[[nl:Machinaal leren]] |
|||
[[nn:Maskinlæring]] |
|||
[[no:Maskinlæring]] |
|||
[[pl:Uczenie maszynowe]] |
|||
[[pt:Aprendizagem de máquina]] |
|||
[[ru:Машинное обучение]] |
|||
[[sl:Strojno učenje]] |
|||
[[sq:Automati nxënës]] |
|||
[[sr:Машинско учење]] |
|||
[[sv:Maskininlärning]] |
|||
[[ta:இயந்திர கற்றல்]] |
|||
[[th:การเรียนรู้ของเครื่อง]] |
|||
[[tl:Pagkatuto ng makina]] |
|||
[[tr:Makine öğrenimi]] |
|||
[[uk:Машинне навчання]] |
|||
[[vi:Học máy]] |
|||
[[zh:机器学习]] |
Revisi terkini sejak 24 Februari 2024 08.44
Bagian dari seri |
Pemelajaran mesin dan Penggalian Data |
---|
Pemelajaran mesin (bahasa Inggris: machine learning atau disingkat dengan ML) adalah sub-bidang kecerdasan buatan yang berkaitan dengan pengembangan dan studi algoritma statistik yang dirancang untuk dapat belajar secara mandiri dari data, kemudian menggunakan pembelajaran tersebut untuk menggeneralisasi dan menangani data baru yang belum pernah ditemui sebelumnya, sehingga sistem ML dapat menjalankan tugas-tugas tertentu tanpa memerlukan instruksi eksplisit yang terprogram sebelumnya.[1] Belakangan, jaringan syaraf tiruan generatif telah menunjukkan performa yang mengungguli berbagai pendekatan konvensional dalam berbagai bidang.[2][3]
Pendekatan pemelajaran mesin telah diimplementasikan di banyak bidang, seperti model bahasa besar (large language model (LLM)), visi komputer, pengenalan ucapan, penyaringan email, agrikultur, dan kedokteran. Bidang-bidang ini membutuhkan kemampuan untuk menangani tugas-tugas kompleks yang sulit dan mahal jika dikembangkan dengan algoritma tradisional.[4][5] Pemelajaran mesin dikenal dalam aplikasinya dalam menyelesaikan masalah bisnis dengan nama analisis prediktif. Meskipun tidak semua algoritma pemelajaran mesin didasarkan pada statistik, statistik komputasional adalah sumber penting dari metode-metode di bidang ini.
Landasan matematis dari pemelajaran mesin diambil dari metode optimisasi matematis (pemrograman matematis). Penggalian data (data mining), bidang studi paralel yang erat kaitannya, berfokus pada analisis data eksploratif melalui pemelajaran tak terarah.[7][8] Dari perspektif teoretis, kerangka PAC (Probably Approximately Correct) learning memberikan model untuk mendeskripsikan ML.
Definisi
[sunting | sunting sumber]Mesin yang dimaksud di sini adalah mesin dalam pengertian lebih mendekati kepada ‘sistem’, bukan mesin 'mekanik'. Istilah pemelajaran pertama kali muncul dalam disiplin ilmu kecerdasan buatan. Pemelajaran berarti menambah pengetahuan, memahami dengan belajar, dan mengikuti perintah. Pemelajaran mesin merupakan salah satu cabang dari kecerdasan buatan yang membahas mengenai pembangunan sistem yang didapat berdasarkan pada pemelajaran data, atau sebuah studi yang mempelajari cara untuk memprogram sebuah komputer untuk belajar. Inti dari pemelajaran mesin adalah representasi dan generalisasi. Pada tahun 1959, Arthur Samuel mendefinisikan bahwa pemelajaran mesin adalah bidang studi yang memberikan kemampuan untuk belajar tanpa diprogram secara eksplisit. Kemampuan belajar yang menjadi dominan ditentukan oleh kemampuan perangkat lunak atau alogaritmanya. Implementasi kemampuan belajar dapat dicapai dengan berbagai teknik, ada yang menggunakan kaidah (rule), ada yang menggunakan statistika, ada yang menggunakan pendekatan fisiologi yaitu sistem saraf manusia atau disebut dengan ANN (artificial neural network) atau jaringan saraf tiruan. Pemelajaran mesin dapat berfungsi untuk beradaptasi dengan suatu keadaan yang baru, serta untuk mendeteksi dan memperkirakan suatu pola.
Sejarah
[sunting | sunting sumber]Pada tahun 1951, John McCarthy yang baru saja mendapatkan gelar PhD meyakinkan Minsky, Claude Shannon, dan Nathaniel Rochester untuk membantunya membawa peneliti Amerika Serikat yang memiliki ketertarikan pada teori automata, jaring saraf, dan studi mengenai kecerdasan menjadi satu. Mereka mengorganisir sebuah lokakarya di Dartmouth College di Hanover, New Hampshire pada tahun 1956. Pada saat itulah dianggap menjadi tahun lahirnya kecerdasan buatan. Sejak awal, para peneliti kecerdasan buatan tidak segan membuat prediksi mengenai keberhasilan dari kecerdasan buatan ini. Pada awalnya kecerdasan buatan berkembang cukup pesat, hal ini disebabkan karena ekspektasi yang terlalu tinggi dari para peneliti di bidang ini. Hingga pada tahun 1974, bidang kecerdasan buatan mulai kurang diminati. Sampai pada tahun 1980, ketertarikan terhadap kecerdasan buatan sebagai bidang penelitian mulai bangkit kembali. Salah satu yang mendukung hal ini adalah hasil kerja Yarowsky (1995), ia melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil diatas 96% untuk ke akuratan dari percobaannya. Setelah Yarowsky banyak orang-orang yang melakukan percobaan menggunakan pemelajaran mesin dan mendapatkan hasil yang memuaskan, dari sinilah pemelajaran mesin dapat semakin berkembang hingga hari ini.[9]
Hubungan dengan bidang lainnya
[sunting | sunting sumber]Kecerdasan buatan
[sunting | sunting sumber]Sebagai hasil dari upaya ilmiah, pemelajaran mesin berkembang dari penelitian tentang kecerdasan buatan (AI). Pada masa-masa awal AI sebagai suatu disiplin ilmu, beberapa peneliti tertarik untuk menjadikan mesin belajar dari data. Mereka berusaha melakukan pendekatan dengan berbagai metode simbolis, serta apa yang kemudian disebut sebagai jaringan syaraf tiruan yang kebanyakannya berupa perseptron dan ADALINE, yang kemudian dikenal sebagai penemuan ulang (reinvention) dari model linear umum statistik.[11] Penalaran probabilistik juga digunakan, terutama dalam diagnosis medis otomatis.[12]
Meskipun begitu, peningkatan fokus pada pendekatan logis, berbasis pengetahuan, menyebabkan terjadinya kesenjangan antara kecerdasan buatan dan pemelajaran mesin. Sistem penalaran probabilistik terkendala oleh masalah teoritis dan praktik dari akuisisi dan representasi data.[12] Pada tahun 1980, sistem pakar telah mendominasi AI, dan statistik tidak lagi disukai dan ditinggalkan.[13] Penelitian pada pemelajaran berbasis simbolik/pengetahuan memang terus berlanjut di dalam AI, yang mengarah pada pemrograman logika induktif, tetapi jalur penelitian yang lebih statistik sekarang berada di luar bidang AI yang sebenarnya, yaitu di bidang pengenalan pola dan pencarian informasi. [12] Selain itu, riset jaringan syaraf telah ditinggalkan oleh AI dan ilmu komputer pada waktu yang sama. Bidang ini kemudian dilanjutkan di luar bidang AI/Ilmu komputer, sebagai "koneksionisme", oleh para peneliti dari disiplin ilmu lain, termasuk Hopfield, Rumelhart, dan Hinton. Keberhasilan utama mereka datang pada pertengahan tahun 1980-an dengan ditemukannya kembali backpropagation.[12]
Pemelajaran mesin (machine learning/ML) kemudian ditata ulang dan diakui sebagai bidang tersendiri, dan mulai berkembang pada tahun 1990-an. Mulai saat itu, bidang ini berubah tujuannya dari yang awalnya untuk mencapai kecerdasan buatan, menjadi untuk menyelesaikan masalah-masalah yang dapat dipecahkan yang bersifat praktis. Kejadian ini menyebabkan pergeseran fokus dari pendekatan simbolik yang diwarisi dari AI, ke arah metode dan pemodelan yang diambil dari statistika, yaitu logika fuzzy, dan teori probabilitas.[13]
Penggalian data
[sunting | sunting sumber]Pembelajaran mesin dan penggalian data sering menggunakan metode yang sama dan saling tumpang tindih. Sementara pemelajaran mesin berfokus pada prediksi berdasarkan properti "yang sudah diketahui" yang diperoleh dari data pelatihan, penggalian data berfokus pada penemuan (observasi) properti "yang tidak diketahui" sebelumnya dalam data (ini merupakan langkah analisis dari penemuan pengetahuan dalam basis data). Penggalian data menggunakan banyak metode pemelajaran mesin, tetapi dengan tujuan yang berbeda; di sisi lain, pemelajaran mesin juga menggunakan metode penggalian data sebagai pemelajaran tak terawasi atau sebagai langkah prapemrosesan untuk meningkatkan akurasi pemelajar. Sebagian besar kerancuan antara dua komunitas penelitian ini (yang sering memiliki konferensi dan jurnal terpisah, ECML PKDD menjadi pengecualian utama) berasal dari asumsi dasar yang mereka gunakan, yaitu dalam pemelajaran mesin, performa biasanya dievaluasi dengan mempertimbangkan kemampuan untuk "mereproduksi" pengetahuan yang sudah diketahui, sedangkan penemuan pengetahuan dan penggalian data (KDD) memiliki tugas utama untuk menemukan pengetahuan yang sebelumnya "tidak diketahui". Jika dibandingkan dengan pengetahuan yang sudah diketahui, suatu metode yang tidak terinformasi (unsupervised) akan dengan mudah dikalahkan oleh metode lain yang terawasi, sedangkan dalam tugas KDD, metode yang terawasi tidak dapat digunakan karena tidak tersedianya data pelatihan.
Pemelajaran mesin juga memiliki hubungan yang erat dengan Optimasi matematis: banyak masalah pemelajaran yang dirumuskan sebagai minimalisasi dari beberapa fungsi kerugian dalam satu set pelatihan. Fungsi kerugian mengekspresikan selisih antara prediksi model yang sedang dilatih dan contoh masalah yang sebenarnya (misalnya, dalam klasifikasi, seseorang ingin memberikan label pada contoh, dan model dilatih untuk memprediksi dengan benar label yang telah ditetapkan sebelumnya dari sekumpulan contoh).[14]
Generalisasi
[sunting | sunting sumber]Perbedaan antara pengoptimalan dan pemelajaran mesin muncul dari tujuan generalisasi (pemelajaran). Sementara algoritma pengoptimalan dapat meminimalkan kerugian pada kumpulan data pelatihan, pemelajaran mesin berkaitan dengan meminimalkan kerugian pada sampel yang tidak terlihat. Karakterisasi generalisasi berbagai algoritma pembelajaran adalah topik aktif penelitian saat ini, terutama untuk algoritma pemelajaran dalam.
Statistik
[sunting | sunting sumber]Pemelajaran mesin dan statistika adalah bidang yang berkaitan erat dari segi metode, tetapi memiliki tujuan utama yang berbeda, yaitu statistika mengambil kesimpulan statistik dari sampel, sedangkan pemelajaran mesin menemukan pola prediksi yang dapat digeneralisasi.[15] Menurut Michael I. Jordan, ide-ide pemelajaran mesin, mulai dari prinsip-prinsip metodologis hingga alat-alat teoritis, memiliki pra-sejarah yang panjang di bidang statistika.[16] Ia juga mengusulkan istilah ilmu data sebagai tempat penampung (placeholder) untuk menyebut keseluruhan bidang tersebut.[16]
Analisis statistik konvensional memerlukan pemilihan model yang paling cocok untuk kumpulan data penelitian secara priori. Selain itu, hanya variabel yang penting atau relevan berdasarkan pengalaman sebelumnya yang disertakan untuk dianalisis. Sebaliknya, pemelajaran mesin tidak dibangun di atas model yang sudah terstruktur sebelumnya, melainkan menggunakan data untuk membentuk model yang ada untuk mendeteksi pola-pola yang ada. Semakin banyak variabel (input) yang digunakan untuk melatih model, semakin akurat model akhir yang dihasilkan.[17]
Leo Breiman membedakan dua paradigma pemodelan statistik: model data dan model algoritmik,[18] dengan "model algoritmik" kurang lebih berarti algoritma pemelajaran mesin seperti Random Forest.
Beberapa ahli statistik mengadopsi metode dari pemelajaran mesin, yang mengarah pada bidang gabungan yang mereka sebut sebagai pemelajaran statistik.[19]
Fisika
[sunting | sunting sumber]Teknik analitis dan komputasi yang diturunkan dari ilmu fisika yang mengakar pada sistem yang tidak teratur dapat diperluas ke permasalahan berskala besar, termasuk pemelajaran mesin, misalnya, untuk menganalisis ruang bobot jaringan syaraf tiruan dalam.[20] Dengan demikian, fisika statistik dimaksudkan untuk menemukan aplikasi dalam bidang diagnostik medis.[21]
Perbedaan dengan penggalian data
[sunting | sunting sumber]Penggalian data (data mining) adalah sebuah proses untuk menemukan pengetahuan, ketertarikan, dan pola baru dalam bentuk model yang deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar.[22] Dengan kata lain data mining merupakan ekstraksi atau penggalian pengetahuan yang diinginkan dari data dalam jumlah yang sangat besar.[23]
Dari definisi diatas dapat disimpulkan bahwa pada pemelajaran mesin berkaitan dengan studi, desain dan pengembangan dari suatu algoritma yang dapat memungkinkan sebuah komputer dapat belajar tanpa harus diprogram secara eksplisit. Sedangkan pada data mining dilakukan proses yang dimulai dari data yang tidak terstruktur lalu diekstrak agar mendapatkan suatu pengetahuan ataupun sebuah pola yang belum diketahui. Selama proses data mining itulah algoritma dari pemelajaran mesin digunakan.
Tipe algoritma
[sunting | sunting sumber]algoritma dalam pemelajaran mesin dapat dikelompokkan berdasarkan masukan dan keluaran yang diharapkan dari algoritma.
- Pemelajaran terarah (supervised learning) membuat fungsi yang memetakan masukan ke keluaran yang dikehendaki, misalnya pada pengelompokan (klasifikasi).
- Pemelajaran terarah merupakan algoritma yang mempelajari sekumpulan contoh pasangan masukan-keluaran yang diinginkan dalam jumlah yang cukup besar. algoritma ini menggunakan data latih (data train), yaitu data-data yang sudah diberi label untuk melakukan pemelajaran. Metode ini bertujuan agar mesin mampu mengidentifikasi label input baru dengan menggunakan fitur yang ada untuk melakukan prediksi maupun klasifikasi. Dengan mengamati data-data tersebut, metode ini akan menghasilkan sebuah model yang mampu memetakan masukan yang baru menjadi keluaran yang tepat.[9]
- Salah satu contoh yang paling sederhana adalah terdapat sekumpulan contoh masukan berupa umur seseorang dan contoh keluaran yang berupa tinggi badan orang tersebut. algoritma pemelajaran melalui contoh mengamati contoh-contoh tersebut dan kemudian mempelajari sebuah fungsi yang pada akhirnya dapat "memperkirakan" tinggi badan seseorang berdasarkan masukan umur orang tersebut.
- Contoh implementasi dengan metode ini adalah pada kasus deteksi spam pada surel. Data latih yang digunakan akan diberi label berupa spam dan bukan spam. Mesin akan mempelajari data-data tersebut melalui proses learning sehingga dapat menghasilkan keluaran berupa mesin yang sudah terlatih untuk mengelompokkan surel yang spam dan bukan spam.
- Pemelajaran tak terarah (unsupervised learning) memodelkan himpunan masukan, seperti penggolongan (clustering).
- Algoritma ini mempunyai tujuan untuk mempelajari dan mencari pola-pola menarik pada masukan yang diberikan.[24] Meskipun tidak disediakan keluaran yang tepat secara eksplisit. Salah satu algoritma unsupervised learning yang paling umum digunakan adalah clustering atau pengelompokan.[9]
- Berbeda dengan metode sebelumnya, metode ini tidak menggunakan data latih dalam melakukan pemelajaran. Dengan kata lain, data-data yang diberikan kepada mesin adalah data-data yang tidak berlabel sehingga mesin dapat mempelajari data-data tersebut berdasarkan fitur-fiturnya. algoritma ini tidak memiliki variabel target dan bertujuan untuk mengelompokkan objek yang serupa dalam suatu area tertentu.
- Contoh unsupervised learning dalam dunia nyata, misalnya seorang supir taksi yang secara perlahan-lahan menciptakan konsep "macet" dan "tidak macet" tanpa pernah diberikan contoh oleh siapapun.[9]
- Pemelajaran semi terarah (semi-supervised learning), yakni tipe yang menggabungkan antara supervised dan unsupervised untuk menghasilkan suatu fungsi.
- Algoritma pemelajaran semi terarah menggabungkan kedua tipe algoritma di atas, di mana diberikan contoh masukan-keluaran yang tepat dalam jumlah sedikit dan sekumpulan masukan yang keluarannya belum diketahui. algoritma ini harus membuat sebuah rangkaian kesatuan antara dua tipe algoritma di atas untuk dapat menutupi kelemahan pada masing-masing algoritma.[9]
- Misalnya sebuah sistem yang dapat menebak umur seseorang berdasarkan foto orang tersebut. Sistem tersebut membutuhkan beberapa contoh, misalnya yang didapatkan dengan mengambil foto seseorang dan menanyakan umurnya (pemelajaran terarah). Akan tetapi, pada kenyataannya beberapa orang sering kali berbohong tentang umur mereka sehingga menimbulkan noise pada data. Oleh karena itu, digunakan juga pemelajaran tak terarah agar dapat saling menutupi kelemahan masing-masing, yaitu noise pada data dan ketiadaan contoh masukan-keluaran.[9]
- Reinforcement learning: Tipe ini mengajarkan bagaimana cara bertindak untuk menghadapi suatu masalah, yang suatu tindakan itu mempunyai dampak. Adalah sebuah algoritma pemelajaran yang diterapkan pada agen cerdas agar ia dapat menyesuaikan dengan kondisi dilingkungannya, hal ini dicapai dengan cara memaksimalkan nilai dari hadiah ‘reward’ yang dapat dicapai. Suatu hadiah didefinisikan sebuah tanggapan balik ‘feedback’ dari tindakan agen bahwa sesuatu baik terjadi [9].Sebagai contoh, sangatlah sulit untuk memrogram sebuah agen untuk menerbangkan sebuah helikopter, tetapi dengan memberikan beberapa nilai negatif untuk menabrak, bergoyang-goyang, serta melenceng dari jalur tujuan perlahan-lahan agen tersebut dapat belajar menerbangkan helikopter dengan lebih baik.[9]
- Pemelajaran berkembang (developmental learning algorithm) adalah sebuah bidang yang bertujuan untuk mempelajari mekanisme pengembangan, arsiterktur, dan batasan yang memungkinkan dibuatnya metode pemelajaran yang berlaku seumur hidup, serta bersifat terbuka terhadap kemampuan dan pengetahuan untuk dipasangkan kepada mesin.[25]
- Transduction: Tipe ini hampir mirip dengan Supervised Learning, tapi tidak secara jelas untuk membangun suatu fungsi melainkan mencoba memprediksi output baru yang berdasarkan dari input baru, masukan pelatihan input dan output
- Learning to learn: Tipe ini menggunakan algoritma untuk mempelajari yang sebelumnya.
Contoh pendekatan
[sunting | sunting sumber]Pohon keputusan
[sunting | sunting sumber]Pemelajaran pohon keputusan bisa dijadikan sebagai model prediktif yang dapat memetakan pengamatan sebuah pilihan ke kesimpulan target dari pilihan tersebut. Pohon keputusan memiliki pendekatan pemodelan prediksi menggunakan statistik, data mining, dan pemelajaran mesin. Pada pohon keputusan ini node-node daunnya akan merepresentasikan label kelas, sedangkan cabangnya merepresentasikan kaitan dari fitur-fitur yang dapat menuntun menuju label kelas yang ada. Pemelajaran pohon keputusan merupakan representasi sederhana untuk contoh pengklasifikasian. pemelajaran pohon keputusan merupakan salah satu teknik dari supervised learning. Terdapat banyak algoritma pohon keputusan, diantaranya adalah id3 (iterative dichotomiser 3), c4.5, cart (classification and regression tree), CHAID (CHi-squared Automatic Interaction Detector), MARS, dan lain-lain.
Sebagai contoh pohon keputusan dapat digunakan untuk penyaringan email. Dengan memasukan fitur-fitur dari email yang telah ditentukan menjadi cabangnya, dan nantinya cabang-cabang tersebut memiliki daun yang dapat menentukan email tersebut masuk ke label yang mana yang telah tersedia.
Jaringan saraf tiruan
[sunting | sunting sumber]Jaringan saraf tiruan (artificial neural network) adalah sebuah algoritma yang didesain untuk memodelkan cara kerja jaringan saraf dalam melakukan suatu pekerjaan atau fungsi tertentu. Jaringan ini biasanya diimplementasikan dengan menggunakan komponen elektronik atau disimulasikan dalam sebuah perangkat lunak di dalam komputer digital.[26]
Pengelompokan
[sunting | sunting sumber]Pengelompokan (clustering) merupakan salah satu pemelajaran yang tergolong dalam pemelajaran yang tidak memerlukan contoh (unsupervised learning). Definisi sederhana dari pengelompokan adalah sebuah proses untuk mengorganisasikan objek menjadi beberapa kelompok yang memiliki anggota yang mirip dalam hal tertentu.[27] algoritma pengelompokan menerima sekumpulan masukan dan kemudian membuat sebuah pembagian (kelompok-kelompok) dari masukan tersebut. Dua masukan yang berada pada kelompok yang sama seharusnya memiliki banyak kesamaan dibandingkan dengan dua masukan yang berada pada kelompok yang berbeda.[28]
Sebagai contoh, para astronom harus melakukan pengelompokan untuk menentukan tipe dari bintang-bintang berdasarkan data spektrum dari ratusan ribu bintang sehingga pada akhirnya mendapatkan istilah seperti “red giant” dan “white dwarf”.[9]
Jaringan Bayes
[sunting | sunting sumber]Bayesian network diciptakan karena adanya penelitian 'Alasan Probabilistik dalam Kecerdasan Sistem oleh Judea Pearl (1988) yang menuntun pada diterimanya probabilitas dan teori keputusan dalam kecerdasan buatan. Bayesian Network secara formal diciptakan untuk memungkinkan representasi yang efisien, dan penalaran yang teliti dengan, pengetahuan pasti. Bayesian network memungkinkan untuk dapat belajar dari pengalaman serta menggabungkan kecerdasan buatan yang terbaik dan jaringan saraf. Bayesian network merupakan keluarga dari model graf probabilistik. Struktur graf ini digunakan untuk merepresentasikan pengetahuan dari suatu domain yang belum pasti. Nantinya setiap node yang ada pada graf merepresentasikan variabel acak, dimana sisi-sisi antar node tersebut merepresentasikan probabilitas ketergantungan antar variabel yang acak tersebut.[29]
Pemrograman logika induktif
[sunting | sunting sumber]Pemrograman logika induksi (inductive logic programming) merupakan salah satu pendekatan pemelajaran mesin yang mempelajari konstruksi induktif dalam bentuk first-order berdasarkan contoh dan latar belakang pengetahuan yang ada.[30] Pendekatan ini menekankan pada representasi dari hipotesis sebagai program logika.
Contohnya pada pemelajaran relasi keluarga dari data yang diberikan. Proses klasifikasi dilakukan dengan memproses latar belakang pengetahuan, hipotesis, dan deskripsi yang diberikan. Deskripsi akan terdiri dari istilah seperti Father(Philip, Charles), Mother(Mum, Margaret), dan lainnya. Pada awalnya, belum latar belakang pengetahuan yang dapat digunakan. Sehingga memunculkan beberapa hipotesis seperti Grandparent(x,y). Seiring berjalannya waktu, latar belakang pengetahuan akan terus meningkat dan menemukan bahwa Parent(x,y) ⟺ [Mother(x,y) V Father(x,y)]. Dengan demikian, definisi dari Grandparent dapat dikurangi menjadi Grandparent(x,y) ⟺ [∃z Parent(x,z) ∧ Parent(z,y)].[9]
Manfaat dan implementasi
[sunting | sunting sumber]Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritma dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritma untuk tujuan tertentu. Aplikasi untuk pemelajaran mesin termasuk:
- Machine perception
- Computer vision, including object recognition
- Natural language processing
- Syntactic pattern recognition
- Machine learning
- Medical diagnosis
- Bioinformatics
- Brain-machine interfaces
- Cheminformatics
- Detecting credit card fraud
- Stock market analysis
- Classifying DNA sequences
- Sequence mining
- Speech and handwriting recognition
- Games
- Software engineering
- Adaptive websites
- Robot locomotion
- Computational advertising
- Computational finance
- Structural health monitoring
- Sentiment analysis (or opinion mining)
- Affective computing
- Menerima Informasi
- Recommender systems
Penerapan pada masa depan
[sunting | sunting sumber]Meskipun Machine Learning tidak dapat secara efektif memprediksi jengkel pengguna, kita masih percaya bahwa masih banyak yang bisa dilakukan untuk mencapai hasil yang lebih baik pada proyek ini. Pertama-tama, kumpulan data kami adalah kecil untuk metode pemelajaran mesin, kami ingin mengumpulkan lebih banyak data untuk melihat apakah meningkatkan hasil kami sama sekali. Hal lain yang kita ingin mencoba adalah mengubah permainan yang memainkan pengguna . Karena kita menggunakan jenis permainan penembak, banyak " menumbuk tombol " adalah terlibat. Sesuatu yang lebih seperti permainan balap dapat bekerja lebih baik untuk mendeteksi gangguan dengan sensor gaya, karena ada lebih banyak tombol memegang terlibat daripada dengan game jenis shooter. Sebuah permainan balap juga dapat memperkenalkan lebih terkait game stres dari sebuah permainan yang melibatkan menembak.
Lihat pula
[sunting | sunting sumber]Referensi
[sunting | sunting sumber]- ^ Definisi "tanpa harus diprogram secara eksplisit" sering dikaitkan dengan Arthur Samuel, pencipta istilah "machine learning" pada tahun 1959. Namun, frasa ini tidak ditemukan secara harfiah dalam publikasi tersebut dan mungkin merupakan parafrase yang muncul kemudian. Rujuk "Parafrase Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" dalam Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). "Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming". Artificial Intelligence in Design '96. Artificial Intelligence in Design '96 (dalam bahasa Inggris). Springer, Dordrecht. hlm. 151–170. doi:10.1007/978-94-009-0279-4_9. ISBN 978-94-010-6610-5.
- ^ "What is Machine Learning?". IBM (dalam bahasa Inggris). Diakses tanggal 2023-06-27.
- ^ Zhou, Victor (2019-12-20). "Machine Learning for Beginners: An Introduction to Neural Networks". Medium (dalam bahasa Inggris). Diarsipkan dari versi asli tanggal 2022-03-09. Diakses tanggal 2021-08-15.
- ^ Hu, Junyan; Niu, Hanlin; Carrasco, Joaquin; Lennox, Barry; Arvin, Farshad (2020). "Voronoi-Based Multi-Robot Autonomous Exploration in Unknown Environments via Deep Reinforcement Learning". IEEE Transactions on Vehicular Technology. 69 (12): 14413–14423. doi:10.1109/tvt.2020.3034800 . ISSN 0018-9545.
- ^ Yoosefzadeh-Najafabadi, Mohsen; Hugh, Earl; Tulpan, Dan; Sulik, John; Eskandari, Milad (2021). "Application of Machine Learning Algorithms in Plant Breeding: Predicting Yield From Hyperspectral Reflectance in Soybean?". Front. Plant Sci. 11: 624273. doi:10.3389/fpls.2020.624273 . PMC 7835636 . PMID 33510761 Periksa nilai
|pmid=
(bantuan). - ^ Bishop, C. M. (2006), Pattern Recognition and Machine Learning, Springer, ISBN 978-0-387-31073-2
- ^ Machine learning dan pengenalan pola "dapat dilihat sebagai dua aspek dari satu bidang yang sama".[6]
- ^ Friedman, Jerome H. (1998). "Data Mining and Statistics: What's the connection?". Computing Science and Statistics. 29 (1): 3–9.
- ^ a b c d e f g h i j S. J. Russell, P. Norvig, J. F. Canny, J. M. Malik, and D. D. Edwards, Artificial Intelligence: A Modern Approach, vol. 2. Prentice hall Englewood Cliffs, 1995.
- ^ Sindhu V, Nivedha S, Prakash M (February 2020). "An Empirical Science Research on Bioinformatics in Machine Learning". Journal of Mechanics of Continua and Mathematical Sciences (7). doi:10.26782/jmcms.spl.7/2020.02.00006 .
- ^ Sarle, Warren S. (1994). "Neural Networks and statistical models". SUGI 19: proceedings of the Nineteenth Annual SAS Users Group International Conference. SAS Institute. hlm. 1538–50. ISBN 9781555446116. OCLC 35546178.
- ^ a b c d Russell, Stuart; Norvig, Peter (2003). Artificial Intelligence: A Modern Approach (edisi ke-2nd). Prentice Hall. ISBN 978-0137903955.
- ^ a b Langley, Pat (2011). "The changing science of machine learning". Machine Learning. 82 (3): 275–9. doi:10. 1007/s10994-011-5242-y Periksa nilai
|doi=
(bantuan). - ^ Le Roux, Nicolas; Bengio, Yoshua; Fitzgibbon, Andrew (2012). "Improving First and Second-Order Methods by Modeling Uncertainty". Dalam Sra, Suvrit; Nowozin, Sebastian; Wright, Stephen J. Optimization for Machine Learning. MIT Press. hlm. 404. ISBN 9780262016469. Diarsipkan dari versi asli tanggal 2023-01-17. Diakses tanggal 2020-11-12.
- ^ Bzdok, Danilo; Altman, Naomi; Krzywinski, Martin (2018). "Statistics versus Machine Learning". Nature Methods. 15 (4): 233–234. doi:10.1038/nmeth.4642. PMC 6082636 . PMID 30100822.
- ^ a b Michael I. Jordan (2014-09-10). "statistics and machine learning". reddit. Diarsipkan dari versi asli tanggal 2017-10-18. Diakses tanggal 2014-10-01.
- ^ Hung et al. Algorithms to Measure Surgeon Performance and Anticipate Clinical Outcomes in Robotic Surgery. JAMA Surg. 2018
- ^ Cornell University Library (August 2001). "Breiman: Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)". Statistical Science. 16 (3). doi:10.1214/ss/1009213726 . Diarsipkan dari versi asli tanggal 26 June 2017. Diakses tanggal 8 August 2015.
- ^ Gareth James; Daniela Witten; Trevor Hastie; Robert Tibshirani (2013). An Introduction to Statistical Learning. Springer. hlm. vii. Diarsipkan dari versi asli tanggal 2019-06-23. Diakses tanggal 2014-10-25.
- ^ [Ramezanpour, A.; Beam, A.L.; Chen, J.H.; Mashaghi, A. Statistical Physics for Medical Diagnostics: Learning, Inference, and Optimization Algorithms. Diagnostics 2020, 10, 972. ]
- ^ [Mashaghi, A.; Ramezanpour, A. Statistical physics of medical diagnostics: Study of a probabilistic model. Phys. Rev. E 97, 032118 (2018)]
- ^ M. J. Zaki, W. Meira Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014.
- ^ J. Han, M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006.
- ^ K. P. Murphy, Machine Learning: A Probabilistic Perspective, The MIT Press, Cambridge, Massachusetts, London, England.
- ^ https://en.wiki-indonesia.club/wiki/Machine_learning
- ^ S. Hayken, Neural Networks: A Comprehensive Foundation, Macmillan College Publishing Company, 1994.
- ^ B. R. Jipkate, V. V. Gohokar, A Comparative Analysis of Fuzzy C-Means Clustering and K Means Clustering Algorithms, International Journal of Computational Engineering Research, ISSN: 2250-3005.
- ^ T. Finley, T. Joachims, Supervised Clustering with Support Vector Machine, Department of Computer Science, Cornell University, Ithaca, NY 14853 USA.
- ^ Ben-Gal I., Bayesian Networks, in Ruggeri F., Faltin F. & Kenett R., Encyclopedia of Statistics in Quality & Reliability, Wiley & Sons (2007).
- ^ S. Muggleton, L. D. Raedt, Inductive Logic Programming: Theory and Methods, Journal of Logic Programming, 1994: 19, 20: 629-679.
Bacaan lanjutan
[sunting | sunting sumber]- Nils J. Nilsson, Introduction to Machine Learning Diarsipkan 2019-08-16 di Wayback Machine..
- Trevor Hastie, Robert Tibshirani and Jerome H. Friedman (2001). The Elements of Statistical Learning Diarsipkan 2013-10-27 di Wayback Machine., Springer. ISBN 0-387-95284-5.
- Pedro Domingos (September 2015), The Master Algorithm, Basic Books, ISBN 978-0-465-06570-7
- Ian H. Witten and Eibe Frank (2011). Data Mining: Practical machine learning tools and techniques Morgan Kaufmann, 664pp., ISBN 978-0-12-374856-0.
- Ethem Alpaydin (2004). Introduction to Machine Learning, MIT Press, ISBN 978-0-262-01243-0.
- David J. C. MacKay. Information Theory, Inference, and Learning Algorithms Diarsipkan 2016-02-17 di Wayback Machine. Cambridge: Cambridge University Press, 2003. ISBN 0-521-64298-1
- Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd edition), Wiley, New York, ISBN 0-471-05669-3.
- Christopher Bishop (1995). Neural Networks for Pattern Recognition, Oxford University Press. ISBN 0-19-853864-2.
- Stuart Russell & Peter Norvig, (2009). Artificial Intelligence – A Modern Approach Diarsipkan 2011-02-28 di Wayback Machine.. Pearson, ISBN 9789332543515.
- Ray Solomonoff, An Inductive Inference Machine, IRE Convention Record, Section on Information Theory, Part 2, pp., 56–62, 1957.
- Ray Solomonoff, An Inductive Inference Machine Diarsipkan 2011-04-26 di Wayback Machine. A privately circulated report from the 1956 Dartmouth Summer Research Conference on AI.
- Kevin P. Murphy (2021). Probabilistic Machine Learning: An Introduction Diarsipkan 2021-04-11 di Wayback Machine., MIT Press.