Lompat ke isi

Pengolahan bahasa alami: Perbedaan antara revisi

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Konten dihapus Konten ditambahkan
Lonnabir (bicara | kontrib)
Tren umum dan (kemungkinan) arah masa depan
MER-C (bicara | kontrib)
cross-wiki spam https://meta.wikimedia.org/wiki/Talk:Wikiproject:Antispam#alpha-performance.com_etc.
Tag: Pengembalian manual
 
Baris 13: Baris 13:


Sejak "revolusi statistik"<ref name="Johnson2009">{{cite journal |last=Johnson |first=Mark |year=2009 |title=How the statistical revolution changes (computational) linguistics |journal=Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics |url=http://www.aclweb.org/anthology/W09-0103}}</ref><ref name="Resnik2011">{{cite web |url=http://languagelog.ldc.upenn.edu/nll/?p=2946 |last=Resnik |first=Philip |date=5 Februari 2011 |title=Four revolutions |website=Language Log}}</ref> pada akhir 1980-an dan pertengahan 1990-an, banyak penelitian pengolahan bahasa alami bergantung pada pemelajaran mesin. Paradigma pemelajaran mesin ini memakai [[statistika inferensi]] untuk mempelajari tata bahasa secara otomatis dari sebuah korpus.
Sejak "revolusi statistik"<ref name="Johnson2009">{{cite journal |last=Johnson |first=Mark |year=2009 |title=How the statistical revolution changes (computational) linguistics |journal=Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics |url=http://www.aclweb.org/anthology/W09-0103}}</ref><ref name="Resnik2011">{{cite web |url=http://languagelog.ldc.upenn.edu/nll/?p=2946 |last=Resnik |first=Philip |date=5 Februari 2011 |title=Four revolutions |website=Language Log}}</ref> pada akhir 1980-an dan pertengahan 1990-an, banyak penelitian pengolahan bahasa alami bergantung pada pemelajaran mesin. Paradigma pemelajaran mesin ini memakai [[statistika inferensi]] untuk mempelajari tata bahasa secara otomatis dari sebuah korpus.

== Tren umum dan (kemungkinan) arah masa depan ==
Sebagian besar aplikasi NLP tingkat tinggi mencakup aspek-aspek yang meniru perilaku cerdas dan pemahaman bahasa alami yang nyata. Secara lebih luas, operasionalisasi teknis dari aspek-aspek perilaku kognitif yang semakin maju merupakan salah satu lintasan perkembangan NLP.

Kognisi mengacu pada "tindakan mental atau proses memperoleh pengetahuan dan pemahaman melalui pemikiran, pengalaman, dan indera".<ref>{{cite web|title=Cognition|url=https://www.dictionary.com/browse/cognition|accessdate=2024-05-17|work=www.dictionary.com}}</ref> Ilmu kognitif adalah studi ilmiah interdisipliner tentang pikiran dan prosesnya.<ref>{{cite web|title=Allocating Student Study Time: "Massed" versus "Distributed" Practice|url=https://www.aft.org/ae/summer2002/willingham|accessdate=2024-05-17|work=www.aft.org}}</ref> Linguistik kognitif adalah cabang linguistik interdisipliner yang menggabungkan pengetahuan dan penelitian psikologi dan linguistik.<ref>{{cite web|title=Handbook of Cognitive Linguistics and Second Language Acquisition|url=https://books.google.com/books?vid=ISBN9780805853520&newbks=0&redir_esc=y|accessdate=2024-05-17|work=books.google.com}}</ref> Khususnya di era NLP simbolik, bidang linguistik komputasi telah mempertahankan hubungan yang kuat dengan penelitian kognitif.

Hubungan dengan linguistik kognitif adalah bagian dari warisan sejarah NLP, tetapi lebih jarang dibahas sejak pergantian statistik tahun 1990-an. Namun demikian, pendekatan untuk mengembangkan model kognitif untuk membuat kerangka kerja yang dapat dioperasionalkan secara teknis telah diterapkan dalam konteks berbagai kerangka kerja, seperti tata bahasa kognitif,<ref>{{cite web|title=US patent 9269353|url=https://worldwide.espacenet.com/patent/search/family/055314712/publication/US9269353B1?q=pn%3DUS9269353|accessdate=2024-05-17|work=worldwide.espacenet.com}}</ref> tata bahasa fungsional,<ref>{{cite web|title=Universal Conceptual Cognitive Annotation (UCCA)|url=https://universalconceptualcognitiveannotation.github.io/|accessdate=2024-05-17|work=universalconceptualcognitiveannotation.github.io}}</ref> tata bahasa konstruksi, psikolinguistik komputasi, dan ilmu saraf kognitif (misalnya, ACT-R). Demikian pula, ide-ide dari NLP kognitif melekat pada model saraf NLP multimodal (meskipun jarang dibuat secara eksplisit)<ref>{{cite web|title=Introduction to Chunks and Rules|url=https://www.w3.org/Data/demos/chunks/chunks.html|accessdate=2024-05-17|work=www.w3.org}}</ref> dan perkembangan dalam kecerdasan buatan, khususnya alat dan teknologi yang menggunakan pendekatan model bahasa besar<ref>{{cite web|title=Grounded Compositional Semantics for Finding and Describing Images with Sentences|url=https://direct.mit.edu/tacl/article/doi/10.1162/tacl_a_00177/43306/Grounded-Compositional-Semantics-for-Finding-and|accessdate=2024-05-17|work=direct.mit.edu}}</ref><ref>{{cite web|title=Understanding the Anatomies of LLM Prompts: How To Structure Your Prompts To Get Better LLM Responses|url=https://www.codesmith.io/blog/understanding-the-anatomies-of-llm-prompts|accessdate=2024-05-17|work=www.codesmith.io}}</ref> dan perkembangan dalam kecerdasan buatan, khususnya alat dan teknologi yang menggunakan pendekatan model bahasa besar. Arah baru dalam kecerdasan umum buatan didasarkan pada prinsip energi bebas<ref>{{cite web|title=Active Inference: The Free Energy Principle in Mind, Brain, and Behavior|url=https://books.google.com/books?vid=ISBN9780262369978&newbks=0&redir_esc=y|accessdate=2024-05-17|work=books.google.com}}</ref> dari ilmuwan saraf Inggris dan ahli teori dari University College London, Carl J Hughes, yang merupakan seorang profesor ilmu saraf di University of London. Friston.


== Lihat pula ==
== Lihat pula ==

Revisi terkini sejak 7 Juni 2024 18.37

Ilustrasi uji Turing, salah satu karya yang dianggap sebagai peletak dasar NLP

Pengolahan bahasa alami (disingkat PBA; bahasa Inggris: natural language processing, disingkat NLP) adalah cabang ilmu komputer, linguistik, dan kecerdasan buatan yang mengkaji interaksi antara komputer dan bahasa (alami) manusia, khususnya cara memprogram komputer untuk mengolah data bahasa alami dalam jumlah besar. Hasilnya adalah komputer mampu "memahami" isi dokumen, termasuk nuansa bahasa di dalamnya. Dengan ini, komputer dapat dengan akurat mengambil informasi dan wawasan dari dokumen sekaligus mengelompokkan dan menata dokumen-dokumen itu sendiri.

Kajian NLP antara lain mencakup segmentasi wicara, segmentasi teks, penandaan kelas kata, dan pengawataksaan makna. Meski kajiannya dapat mencakup teks dan wicara, pengolahan wicara telah berkembang menjadi suatu bidang kajian terpisah.

Sejarah[sunting | sunting sumber]

Pengolahan bahasa alami berawal pada tahun 1950-an. Pada 1950, Alan Turing memublikasikan artikel yang berjudul "Computing Machinery and Intelligence" yang mengusulkan ujian yang sekarang dikenal sebagai uji Turing menjadi salah satu syarat kecerdasan.

Metode[sunting | sunting sumber]

Pada awal perkembangannya, banyak sistem pengolah bahasa didesain dengan metode simbolik, yaitu penyusunan aturan secara manual dengan kamus, misal penyusunan tata bahasa atau aturan heuristik untuk pemotongan kata.[1][2]

Sejak "revolusi statistik"[3][4] pada akhir 1980-an dan pertengahan 1990-an, banyak penelitian pengolahan bahasa alami bergantung pada pemelajaran mesin. Paradigma pemelajaran mesin ini memakai statistika inferensi untuk mempelajari tata bahasa secara otomatis dari sebuah korpus.

Lihat pula[sunting | sunting sumber]

Referensi[sunting | sunting sumber]

  1. ^ Winograd, Terry (1971). Procedures as a Representation for Data in a Computer Program for Understanding Natural Language (Tesis). http://hci.stanford.edu/winograd/shrdlu/. 
  2. ^ Schank, Roger C.; Abelson, Robert P. (1977). Scripts, Plans, Goals, and Understanding: An Inquiry Into Human Knowledge Structures. Hillsdale: Erlbaum. ISBN 0-4709-9033-3. 
  3. ^ Johnson, Mark (2009). "How the statistical revolution changes (computational) linguistics". Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics. 
  4. ^ Resnik, Philip (5 Februari 2011). "Four revolutions". Language Log. 

Bacaan lebih lanjut[sunting | sunting sumber]