Novriana (2017) Implementasi Support Vector Machine (SVM) Dan Maximal Marginal Importance (MMI) Untuk Peringkasan Multi Dokumen Artikel Berbahasa Indonesia. Diploma thesis, Universitas Komputer Indonesia.
Full text not available from this repository.Abstract
Artikel berita memiliki pandangan dan cara penyampaian informasi yang berbeda-beda mengenai satu topik berita yang sama, selain itu berita juga berasal dari lebih dari satu sumber berita dan kebanyakan membahas mengenai berita yang sama namun dengan tata bahasa yang berbeda sesuai dengan pemuat berita. Ringkasan artikel berita dapat membantu pembaca untuk mendapatkan informasi yang penting dari berita. Peringkas teks otomatis multi dokumen artikel berbahasa Indonesia yang dilakukan pada penelitian ini terdiri atas beberapa tahapan, yaitu : preprocessing, ekstraksi fitur, training dan klasifikasi kalimat relevan dan non relevan menggunakan support vector machine (SVM), serta tahap pembentukan ringkasan menggunakan maximal marginal importance (MMI). Artikel yang digunakan pada penelitian ini berupa artikel berita berbahasa Indonesia dan memiliki kesamaan topik. Preprocessing yang digunakan berupa pemecahan kalimat, case folding, tokenizing dan filtering(stopword). Sedangkan fitur-fitur kalimat yang digunakan adalah fitur panjang kalimat, fitur posisi kalimat, fitur data numerik, fitur kata-kata thematik, fitur kemiripan kalimat menyerupai judul, fitur kemiripan kalimat dengan kalimat lain, serta fitur ikatan leksikal dengan kalimat sebelum dan sesudahnya. Pada tahapan training dan klasifikasi digunakan LibSVM dengan menggunakan kernel Radial Basis Function (RBF) dimana nilai parameter C dan sebesar 1 dan 0.5. Pada tahap klasifikasi akan didapat kalimat yang relevan dan non relevan dari artikel yang akan diringkas. Setelah didapatkan kalimat relevan dan non relevan, akan dilakukan pembentukan ringkasan dari hasil kalimat relevan dengan menggunakan metode maximal marginal importance (MMI). Pada proses evaluasi dilakukan dengan melakukan perbandingan antara ringkasan yang dihasilkan oleh sistem dengan ringkasan manual yang dihasilkan oleh abstractor untuk mendapatkan nilai performansi recall, precision dan f-measure. Dari pengujian yang telah dilakukan, didapatkan nilai performansi recall sebesar 55.2%, precision 56% dan f-measure sebesar 53.65%.
Item Type: | Thesis (Diploma) |
---|---|
Uncontrolled Keywords: | Peringkas teks otomatis, multi dokumen, Support Vector Machine (SVM), Maximal Marginal Importance (MMI), Ekstraksi Fitur. |
Subjects: | S1-Final Project > Fakultas Teknik Dan Ilmu Komputer > Teknik Informatika > 2017 |
Divisions: | Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer > Teknik Informatika (S1) |
Date Deposited: | 06 Jun 2017 02:58 |
Last Modified: | 06 Jun 2017 02:58 |
URI: | http://repository.unikom.ac.id/id/eprint/51936 |
Actions (login required)
View Item |