Peningkatan Akurasi Analisis Sentimen Menggunakan Supervised Term Weighting Dan Unsupervisd Term Weighting Pada Algoritma Support Vector Machine (Studi Kasus: Opini Ulasan Film dari IMDB)

Rakhmat Sentiaji, Aditia (2017) Peningkatan Akurasi Analisis Sentimen Menggunakan Supervised Term Weighting Dan Unsupervisd Term Weighting Pada Algoritma Support Vector Machine (Studi Kasus: Opini Ulasan Film dari IMDB).

Full text not available from this repository.
Official URL: http://elib.unikom.ac.id/gdl.php?mod=browse&op=rea...

Abstract

Pertumbuhan pengguna internet terus meningkat sesuai dengan berjalannya waktu. Terhitung mulai dari tahun 1993 hingga 2016 pengguna internet mencapai 3,4 miliar dengan tingkat penetrasi 46%. Pertumbuhan pengguna internet memberikan dampak pada pertumbuhan data secara signifikan. Data tersebut akan menjadi sampah jika hanya disimpan tanpa dianalisis lebih lanjut. Salah satu teknik analisis yang bisa dilakukan adalah analisis sentimen. Teknik tersebut dapat menganalisis pendapat, sentimen, evaluasi, penilaian, sikap, dan emosi masyarakat terhadap entitas seperti produk, layanan, organisasi, individu, isu, peristiwa, topik, dan atribut. Dalam perkembangan analisis sentimen, algoritma yang digunakan untuk melakukannya terus dikembangkan untuk menaikkan akurasi klasifikasi sentimen suatu opini. Dalam penelitian yang dilakukan Tim O��Keefe dan Fatimah Wulandini, algoritma Support Vector Machine (SVM) dinilai memiliki tingkat akurasi tertinggi. Tahapan awal melakukan analisis sentimen menggunakan algoritma SVM adalah melakukan pembobotan yang merubah kata-kata menjadi angka yang didasarkan pada kemunculannya. Ada yang memperhitungkan kemunculannya berdasarkan label dari dokumen yaitu Term Frequency Odd Ratio (TF-OR), ada yang tanpa memperhitungkan kemunculannya berdasarkan label dari dokumen yaitu Term Weighting �� Inverse Document Frequency (TF-IDF). Pemilihan dua teknik pembobotan dapat mempengaruhi tingkat akurasi yang dihasilkan algoritma SVM. Penelitian Man Lan menunjukkan bahwa teknik pembobotan TF-OR memiliki tingkat akurasi tertinggi dengan catatan komposisi data latih positif dan negatif yang digunakan seimbang, Dalam menghadapi dataset yang tidak seimbang, akurasi yang didapat menjadi lebih rendah dibanding teknik pembobotan TF-IDF. Maka penelitian ini bermaksud untuk membuat suatu model pembobotan dengan memanfaatkan TF-OR dan TF-IDF sehingga membuat akurasi algoritma SVM menjadi relatif stabil ketika menggunakan data latih yang seimbang atau tidak seimbang.

Item Type: Article
Uncontrolled Keywords: analisis sentimen, svm, tf-idf, tf-or, term weighting, klasifikasi
Subjects: S2 Thesis > Magister Sistem Informasi > 2017
Divisions: Universitas Komputer Indonesia > Perpustakaan UNIKOM
Date Deposited: 10 Nov 2017 03:32
Last Modified: 10 Nov 2017 03:32
URI: https://repository.unikom.ac.id/id/eprint/53318

Actions (login required)

View Item View Item