Lompat ke isi

Pengolahan bahasa alami: Perbedaan antara revisi

Dari Wikipedia bahasa Indonesia, ensiklopedia bebas
Konten dihapus Konten ditambahkan
rintisan
 
MER-C (bicara | kontrib)
cross-wiki spam https://meta.wikimedia.org/wiki/Talk:Wikiproject:Antispam#alpha-performance.com_etc.
Tag: Pengembalian manual
 
(17 revisi perantara oleh 12 pengguna tidak ditampilkan)
Baris 1: Baris 1:
[[Berkas:Turing Test version 3.png|thumb|Ilustrasi [[Uji Turing]], salah satu karya yang dianggap sebagai peletak dasar NLP.]]
[[Berkas:Turing Test version 3.png|jmpl|Ilustrasi [[uji Turing]], salah satu karya yang dianggap sebagai peletak dasar NLP]]
'''Pemrosesan bahasa alami''', disingkat '''PBA''' atau '''NLP''' (''natural language processing''), adalah cabang [[ilmu komputer]] dan [[linguistik]] yang mengkaji [[Interaksi manusia komputer|interaksi]] antara [[komputer]] dengan [[bahasa]] (alami) manusia <ref>{{citation|title=Introduction to artificial intelligence|author=Charniak, Eugene|publisher=Addison-Wesley|year=1984}}</ref>. NLP sering dianggap sebagai cabang dari [[kecerdasan buatan]] dan bidang kajiannya bersinggungan dengan [[linguistik komputasional]]. Kajian NLP antara lain mencakup [[segmentasi tuturan]] (''speech segmentation''), [[segmentasi teks]] (''text segmentation''), [[penandaan kelas kata]] (''part-of-speech tagging''), serta [[pengawataksaan makna]] (''word sense disambiguation''). Meskipun kajiannya dapat mencakup [[teks]] dan [[tuturan]], [[pemrosesan tuturan]] (''speech processing'') telah berkembang menjadi suatu bidang kajian terpisah.
'''Pengolahan bahasa alami''' (disingkat '''PBA'''; {{lang-en|natural language processing}}, disingkat '''NLP''') adalah cabang [[ilmu komputer]], [[linguistik]], dan [[kecerdasan buatan]] yang mengkaji [[Interaksi manusia–komputer|interaksi]] antara [[komputer]] dan [[bahasa]] (alami) manusia, khususnya cara memprogram komputer untuk mengolah data [[bahasa alami]] dalam jumlah besar. Hasilnya adalah komputer mampu "memahami" isi dokumen, termasuk nuansa bahasa di dalamnya. Dengan ini, komputer dapat dengan akurat mengambil informasi dan wawasan dari dokumen sekaligus mengelompokkan dan menata dokumen-dokumen itu sendiri.


Kajian NLP antara lain mencakup [[segmentasi wicara]], [[segmentasi teks]], [[penandaan kelas kata]], dan [[Disambiguasi makna|pengawataksaan makna]]. Meski kajiannya dapat mencakup [[Teks (teori sastra)|teks]] dan [[wicara]], [[pengolahan wicara]] telah berkembang menjadi suatu bidang kajian terpisah.
== Catatan kaki ==


== Sejarah ==
{{reflist}}
{{kembangkan bagian|date=Juni 2021}}
Pengolahan bahasa alami berawal pada tahun 1950-an. Pada 1950, [[Alan Turing]] memublikasikan artikel yang berjudul "Computing Machinery and Intelligence" yang mengusulkan ujian yang sekarang dikenal sebagai [[uji Turing]] menjadi salah satu syarat kecerdasan.


== Metode ==
{{kembangkan bagian|date=Juni 2021}}
Pada awal perkembangannya, banyak sistem pengolah bahasa didesain dengan metode simbolik, yaitu penyusunan aturan secara manual dengan kamus, misal penyusunan tata bahasa atau aturan heuristik untuk pemotongan kata.<ref name="Winograd1971">{{cite thesis |last=Winograd |first=Terry |year=1971 |title=Procedures as a Representation for Data in a Computer Program for Understanding Natural Language |url=http://hci.stanford.edu/winograd/shrdlu/}}</ref><ref name="Schank1977">{{cite book |last1=Schank |first1=Roger C. |last2=Abelson |first2=Robert P. |year=1977 |title=Scripts, Plans, Goals, and Understanding: An Inquiry Into Human Knowledge Structures |url=https://archive.org/details/scriptsplansgoal0000scha |location=Hillsdale |publisher=Erlbaum |isbn=0-4709-9033-3}}</ref>


Sejak "revolusi statistik"<ref name="Johnson2009">{{cite journal |last=Johnson |first=Mark |year=2009 |title=How the statistical revolution changes (computational) linguistics |journal=Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics |url=http://www.aclweb.org/anthology/W09-0103}}</ref><ref name="Resnik2011">{{cite web |url=http://languagelog.ldc.upenn.edu/nll/?p=2946 |last=Resnik |first=Philip |date=5 Februari 2011 |title=Four revolutions |website=Language Log}}</ref> pada akhir 1980-an dan pertengahan 1990-an, banyak penelitian pengolahan bahasa alami bergantung pada pemelajaran mesin. Paradigma pemelajaran mesin ini memakai [[statistika inferensi]] untuk mempelajari tata bahasa secara otomatis dari sebuah korpus.
{{ling-stub}}

== Lihat pula ==
{{div col|colwidth=20em}}
* ''[[1 the Road]]''
* [[Linguistik komputasi]]
* [[Pemahaman kueri]]
* [[Pembelajaran bahasa berbantuan komputer]]
* [[Pemelajaran dalam]]
* [[Penambangan teks biomedis]]
* [[Penelaahan berbantuan komputer]]
* [[Pengambilan informasi]]
* [[Pengolahan istilah majemuk]]
* [[Pengolahan linguistik dalam]]
* [[Pengolahan wicara]]
* [[Penilaian esai otomatis]]
* [[Penjawaban pertanyaan]]
* [[Penyederhanaan teks]]
* [[Perluasan kueri]]
* [[Semantik tersebar]]
* [[Teknologi bahasa]]
* [[Teknologi komunikasi dan bahasa]]
* [[Temu balik informasi]]
* [[Uji-baca]]
* [[Word2vec]]
{{div col end}}

== Referensi ==
{{reflist}}


== Bacaan lebih lanjut ==
{{commonscat|Natural_language_processing|Pengolahan bahasa alami}}
{{portal|Bahasa}}
<!-- In alphabetical order of by last name -->
{{refbegin}}
* {{cite journal |last=Bates |first=M. |year=1995 |title=Models of natural language understanding |journal=Proceedings of the National Academy of Sciences of the United States of America |volume=92 |issue=22 |pages=9977–9982 |pmid=7479812 |pmc=40721 |doi=10.1073/pnas.92.22.9977}}
* {{cite book |authors=Steven Bird, Ewan Klein, dan Edward Loper |year=2009 |title=Natural Language Processing with Python |url=https://archive.org/details/naturallanguagep0000bird |publisher=O'Reilly Media |isbn=978-0-5965-1649-9}}
* {{cite book |authors=Daniel Jurafsky dan James H. Martin |year=2008 |title=Speech and Language Processing |edition=2 |publisher=Pearson Prentice Hall |isbn=978-0-1318-7321-6}}
* {{cite book |last=Kurdi |first=Mohamed Zakaria |year=2016 |title=Natural Language Processing and Computational Linguistics: speech, morphology, and syntax |volume=1 |publisher=ISTE-Wiley |isbn=978-1-8482-1848-2}}
* {{cite book |last=Kurdi |first=Mohamed Zakaria |year=2017 |title=Natural Language Processing and Computational Linguistics: semantics, discourse, and applications |volume=2 |publisher=ISTE-Wiley |isbn=978-1-8482-1921-2}}
* {{cite book |authors=Christopher D. Manning, Prabhakar Raghavan, dan Hinrich Schütze |year=2008 |title=Introduction to Information Retrieval |url=https://archive.org/details/introductiontoin0000mann_b6m0 |publisher=Cambridge University Press |isbn=978-0-5218-6571-5}} [https://nlp.stanford.edu/IR-book/ Tersedia pula versi HTML dan PDF resmi tanpa biaya.]
* {{cite book |authors=Christopher D. Manning dan Hinrich Schütze |year=1999 |title=Foundations of Statistical Natural Language Processing |url=https://archive.org/details/foundationsofsta0000mann |publisher=The MIT Press |isbn=978-0-2621-3360-9}}
* {{cite book |authors=David M. W. Powers dan Christopher C. R. Turk |year=1989 |title=Machine Learning of Natural Language |url=https://archive.org/details/machinelearningo0000powe_w4r0 |publisher=Springer-Verlag |isbn=978-0-3871-9557-5}}
{{refend}}


{{Natural language processing}}
[[Kategori:Pemrosesan bahasa alami| ]]
{{authority control}}


[[Kategori:Pengolahan bahasa alami| ]]
[[en:natural language processing]]

Revisi terkini sejak 7 Juni 2024 18.37

Ilustrasi uji Turing, salah satu karya yang dianggap sebagai peletak dasar NLP

Pengolahan bahasa alami (disingkat PBA; bahasa Inggris: natural language processing, disingkat NLP) adalah cabang ilmu komputer, linguistik, dan kecerdasan buatan yang mengkaji interaksi antara komputer dan bahasa (alami) manusia, khususnya cara memprogram komputer untuk mengolah data bahasa alami dalam jumlah besar. Hasilnya adalah komputer mampu "memahami" isi dokumen, termasuk nuansa bahasa di dalamnya. Dengan ini, komputer dapat dengan akurat mengambil informasi dan wawasan dari dokumen sekaligus mengelompokkan dan menata dokumen-dokumen itu sendiri.

Kajian NLP antara lain mencakup segmentasi wicara, segmentasi teks, penandaan kelas kata, dan pengawataksaan makna. Meski kajiannya dapat mencakup teks dan wicara, pengolahan wicara telah berkembang menjadi suatu bidang kajian terpisah.

Sejarah[sunting | sunting sumber]

Pengolahan bahasa alami berawal pada tahun 1950-an. Pada 1950, Alan Turing memublikasikan artikel yang berjudul "Computing Machinery and Intelligence" yang mengusulkan ujian yang sekarang dikenal sebagai uji Turing menjadi salah satu syarat kecerdasan.

Metode[sunting | sunting sumber]

Pada awal perkembangannya, banyak sistem pengolah bahasa didesain dengan metode simbolik, yaitu penyusunan aturan secara manual dengan kamus, misal penyusunan tata bahasa atau aturan heuristik untuk pemotongan kata.[1][2]

Sejak "revolusi statistik"[3][4] pada akhir 1980-an dan pertengahan 1990-an, banyak penelitian pengolahan bahasa alami bergantung pada pemelajaran mesin. Paradigma pemelajaran mesin ini memakai statistika inferensi untuk mempelajari tata bahasa secara otomatis dari sebuah korpus.

Lihat pula[sunting | sunting sumber]

Referensi[sunting | sunting sumber]

  1. ^ Winograd, Terry (1971). Procedures as a Representation for Data in a Computer Program for Understanding Natural Language (Tesis). http://hci.stanford.edu/winograd/shrdlu/. 
  2. ^ Schank, Roger C.; Abelson, Robert P. (1977). Scripts, Plans, Goals, and Understanding: An Inquiry Into Human Knowledge Structures. Hillsdale: Erlbaum. ISBN 0-4709-9033-3. 
  3. ^ Johnson, Mark (2009). "How the statistical revolution changes (computational) linguistics". Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics. 
  4. ^ Resnik, Philip (5 Februari 2011). "Four revolutions". Language Log. 

Bacaan lebih lanjut[sunting | sunting sumber]