Shole, Fernando (2018) Perbandingan Metode Smoothing Untuk Deteksi Dan Koreksi Kesalahan Kata Dalam Teks Berbahasa Indonesia. Diploma thesis, Universitas Komputer Indonesia.
Full text not available from this repository.Abstract
Dalam Topik NLP (Natural Language Processing), kesalahan kata merupakan hal yang penting untuk diperhatikan. Beberapa penelitian telah dilakukan untuk mengatasi masalah kesalahan ejaan real-word dalam bahasa Inggris. Skripsi Muhammad Aburizal Siregar telah mengatasi masalah kesalahan ejaan real-word dalam bahasa Indonesia yaitu deteksi dan koreksi kesalahan kata real-word memiliki akurasi sebesar 11% setelah mengubah perhitungan probabilitas n-gram dengan menggunakan metode additive smoothing. Oleh karena itu, penelitian ini bertujuan untuk membandingkan akurasi metode deteksi dan koreksi kesalahan ejaan real-word dalam bahasa Indonesia menggunakan metode smoothing Good-Turing estimate, Jelinek-Mercer, Katz smoothing, Witten-Bell dan Absolute discounting untuk kasus deteksi dan koreksi kesalahan real-word dalam bahasa Indonesia. Dari hasil pengujian pada 30 artikel berita menggunakan korpus sebesar 21,5 didapatkan akurasi yang paling tinggi adalah metode Absoulte Discounting pada akurasi deteksi sebesar 80%, dan Jelinek Mercer pada akurasi koreksi sebesar 89% dan hasil akurasi metode smoothing yang paling rendah adalah metode Good-turing dengan akurasi deteksi dan koreksi sebesar 0%.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | kesalahan ejaan, deteksi, koreksi, real-word, n-gram, confusion set |
Subjects: | ?? UNIK1502 ?? |
Divisions: | Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer > Teknik Informatika (S1) |
Date Deposited: | 31 Jan 2019 10:24 |
Last Modified: | 31 Jan 2019 10:24 |
URI: | http://repository.unikom.ac.id/id/eprint/58555 |
Actions (login required)
View Item |