Linguistik korpus

Linguistik korpus adalah metode linguistik yang menggunakan data dari bahan-bahan bahasa yang terkumpul dalam suatu sumber yang disebut korpus (jamak: korpora) yang berasal dari penggunaan bahasa dalam berbagai genre, ragam, dan bahan lisan maupun tertulis^[1] yang menjamin keragaman yang seluas-luasnya dan menghindari penggunaan bahasa yang sangat sempit seperti idiolek. Data-data tersebut disusun secara sistematis dan mudah diakses secara elektronis melalui komputer.

Metode ini digunakan dalam linguistik deskriptif maupun linguistik terapan, seperti penyusunan kamus, untuk menjamin bahwa data yang digunakan benar-benar berasal dari penggunaan yang luas dan terhindar dari penggunaan subjektif. Selain itu, korpus dapat membantu menyediakan, mengumpulkan, dan mengatur data linguistik untuk tujuan penelitian dan akademis lainnya, termasuk pedagogi.^[2]

Sejarah dan perkembangan

Dalam sejarah kajian linguistik, istilah korpus sudah ada sebelum tahun 1950-an. Pada awal kemunculannya, korpus digunakan oleh beberapa ahli bahasa dalam metodologi penelitian linguistik dengan mengumpulkan data bahasa sebanyak-banyaknya untuk mendukung teori-teori mereka. Meski dalam perkembangannya, korpus kembali memiliki daya tarik setelah penggunaan komputer modern dalam pengelolaannya sejak tahun 1980-an.^[1]

Istilah korpus dalam linguistik korpus modern selalu dikaitkan dengan korpus berbasis komputer yang memberikan keleluasaan pada peneliti untuk mencari kata atau ekspresi kebahasaan tertentu, menyusun korpus berdasarkan urutan tertentu, menemukan kata dalam konteks tertentu, dan menghitung frekuensi kemunculan kata tertentu dalam korpus secara cepat, akurat, dan dalam skala besar. Oleh karena itu, korpus di era modern lebih ditekankan pada bentuknya yang elektronis dan unsur keterbacaannya pada mesin.^[3]

Selain itu, penggunaan komputer modern juga meningkatkan jumlah dan memperluas jangkauan korpus. Jika sebelumnya jumlah korpus terbatas oleh keterbatasan manusia dalam mengoleksi dan mengelola korpus, maka dengan adanya komputer memungkinkan korpus tersedia dalam jumlah yang sangat besar dan dapat diakses dengan mudah.^[3]

Korpus bahasa Indonesia

Referensi

^ ^a ^b McEnery, Tony; Wilson, Andrew (1996). Corpus Linguistics (dalam bahasa Inggris). Edinburgh University Press. ISBN 978-0-7486-0482-1.
^ Sari, Faizah (2013). "Bagaimana Teknologi dapat Membantu Metodologi" (PDF). Masyarakat Linguistik Indonesia. 31 (1): 107–110.
^ ^a ^b Suhardijanto, Totok dan Arawinda Dinakaramani (2018). "Korpus Beranotasi: ke Arah Pengembangan Korpus Bahasa-bahasa di Indonesia" (PDF). Kongres Bahasa Indonesia.

Artikel bertopik linguistika ini adalah sebuah rintisan. Anda dapat membantu Wikipedia dengan mengembangkannya.

[:0-1] McEnery, Tony; Wilson, Andrew (1996). Corpus Linguistics (dalam bahasa Inggris). Edinburgh University Press. ISBN 978-0-7486-0482-1.

[2] Sari, Faizah (2013). "Bagaimana Teknologi dapat Membantu Metodologi" (PDF). Masyarakat Linguistik Indonesia. 31 (1): 107–110.

[:1-3] Suhardijanto, Totok dan Arawinda Dinakaramani (2018). "Korpus Beranotasi: ke Arah Pengembangan Korpus Bahasa-bahasa di Indonesia" (PDF). Kongres Bahasa Indonesia.

[1]

[2]

[3]