Pengembangan Kamus Jenis Kata Yang Dilengkapi Kata Majemuk Sebagai Sumber Daya NLP Bahasa Indonesia

Yansyah, Yoppy (2017) Pengembangan Kamus Jenis Kata Yang Dilengkapi Kata Majemuk Sebagai Sumber Daya NLP Bahasa Indonesia.

Full text not available from this repository.
Official URL: http://elib.unikom.ac.id/gdl.php?mod=browse&op=rea...

Abstract

Pada penelitian tentang ��Pembangunan Kamus Jenis Kata Sebagai Resource NLP Bahasa Indonesia��, resource yang dihasilkan sebanyak 38.870 lema yang terdiri dari kata dasar dan turunannya, belum menghasilkan bentuk kata majemuk sebagai penambahan sumber daya. Resource dalam kamus jenis kata yang dilengkapi kata majemuk sangat dibutuhkan untuk penelitian tentang NLP seperti tokenisasi kata pada POS Tag dan question answering. Berdasarkan kebutuhan akan sumber daya maka dilakukan pengembangan kamus jenis kata yang dilengkapi kata majemuk yang dapat digunakan dalam pengembangan dalam bidang NLP. Pada penelitian sebelumnya data masukan kbbi berformat .txt, sehingga tidak dapat mendeteksi lema yang dicetak tebal. Oleh sebab itu dilakukan proses konversi format data masukan dari kbbi.pdf menjadi kbbi.doc dan menjadi kbbi.html dan dilakukan dengan 3 proses yaitu 5 tahapan proses merapikan data masukan terdiri dari penghapusan karakter HTML entitas, penghapusan label kecuali label jenis kata, penghapusan nomor makna, penyamaan simbol kata majemuk dan penyatuan kata terpisah. Dalam proses memisahkan kata dilakukan 3 tahapan terdiri dari, pemisahan kata majemuk, pengambilan kata dan jenis kata, dan pemisahan kata dasar dengan kata turunannya. Dalam proses mendeteksi kata majemuk dilakukan 4 tahapan terdiri dari penghapusan baris kosong, pengisian kata dan jenis kata untuk kata majemuk, pembersihan dan pengkategorian. Hasil akhir dari pengembangan kamus jenis kata yang dilengkapi kata majemuk adalah menghasilkan lema sebanyak 51.147 lema terdiri dari 10.609 lema atau kata majemuk dan 40.439 lema atau bukan kata majemuk. kamus jenis kata yang dilengkapi kata majemuk sudah tersedia dan dapat dimanfaatkan untuk penelitian NLP (Natural Language Processing).

Item Type: Article
Uncontrolled Keywords: Kamus jenis kata, kamus online, resource NLP, kata majemuk.
Subjects: S1-Final Project > Fakultas Teknik Dan Ilmu Komputer > Teknik Informatika > 2017
Divisions: Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer
Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer > Teknik Informatika (S1)
Date Deposited: 10 Nov 2017 03:33
Last Modified: 10 Nov 2017 03:33
URI: https://repository.unikom.ac.id/id/eprint/53556

Actions (login required)

View Item View Item