Ramandha Putri, Dina (2017) Word Sense Disambiguation Menggunakan Metode Lesk Untuk Cerpen Anak Berbahasa Indonesia. Diploma thesis, Universitas Komputer Indonesia.
Full text not available from this repository.Abstract
Word Sense Disambiguation adalah suatu proses mengidentifikasi makna kata yang yang digunakan dalam suatu konteks ketika kata memiliki sejumlah makna yang berbeda. Pada penelitian sebelumnya, Word Sense Disambiguation menggunakan Simplified Lesk memiliki kompleksitas waktu lebih rendah dan akurasi yang dihasilkan lebih besar dibandingkan Original Lesk. Tahap sistem Word Sense Disambiguation dimulai dari penerimaan input teks dokumen hingga melakukan preprocessing yang terdiri dari tokenisasi kalimat, tokenisasi kata dan removal stopword. Hasil dari preprocessing berupa kalimat yang diproses dengan menentukan kata yang ambigu dan mencari makna dari kata yang ambigu menggunakan kamus kateglo. Apabila kata yang memiliki makna lebih dari satu dan jenis kata lebih noun (kata benda) atau verb (kata kerja) akan dipilih sebagai kata yang ambigu. Selanjutya dihitung berapa kali kemunculan kata yang sama yang ada pada kalimat dan kata pada setiap makna kata yang ambigu menggunakan Simplified Lesk. Banyaknya kemunculan kata yang sama akan menghasilkan bobot terbesar dan menjadi kandidat makna terpilih yang tepat untuk kata yang ambigu. Berdasarkan hasil pengujian menggunakan data sebanyak 35cerpen anak online berbahasa Indonesia yang diambil dari beberapa sumber, disimpulkan bahwa Word Sense Disambiguation menggunakan Simplified Lesk menghasilkan performansi yang sangat kecil dengan nilai rata-rata recall sebesar 22.08%, precision sebesar 18.82%, f-measure sebesar 19.68%, dan akurasi sebesar 14.04%. Hal tersebut disebabkan karena inventori kata dasar yang kurang lengkap pada kamus kateglo sehingga banyak kata yang tidak terdeteksi, penggunaan sinonim yang digunakan untuk menambah bobot Simplified Lesk tidak menghasilkan hasil yang signifikan dan adanya kesalahan pada proses removal stopword dimana kata yang terdapat pada daftar stopword termasuk kedalam kata yang ambigu sehingga kata tidak diproses pada tahap Simplified Lesk.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Word Sense Disambiguation, kata yang ambigu, kateglo, Simplified Lesk, Sinonim. |
Subjects: | S1-Final Project > Fakultas Teknik Dan Ilmu Komputer > Teknik Informatika > 2017 |
Divisions: | Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer > Teknik Informatika (S1) |
Date Deposited: | 10 Nov 2017 03:33 |
Last Modified: | 10 Nov 2017 03:33 |
URI: | http://repository.unikom.ac.id/id/eprint/53534 |
Actions (login required)
View Item |