Part Of Speech Tagger Untuk Bahasa Indonesia Menggunakan Conditional Random Field (CRF)

Saefulloh, Fivip (2017) Part Of Speech Tagger Untuk Bahasa Indonesia Menggunakan Conditional Random Field (CRF). Diploma thesis, Universitas Komputer Indonesia.

Full text not available from this repository.
Official URL: http://elib.unikom.ac.id/gdl.php?mod=browse&op=rea...

Abstract

Part-of-speech tagging (POS tagging) merupakan proses penandaan untuk menentukan kelas kata atau kelas leksikal lain untuk setiap kata dalam teks input. Proses ini memainkan peranan penting di beberapa bidang NLP seperti speech recognition, natural language parsing dan information retrieval [2]. Salah satu metode probabilistik yang digunakan untuk pengembangan POS tagging adalah Conditional Random Field (CRF). Pada Bahasa Indonesia sendiri telah dilakukan penelitian dengan menggunakan metode ini dengan akurasi 80,21 % serta 91,15 % [5,3] menggunakan 37 dan 25 tagset dengan menggunakan data training sebanyak 26346 kata. Dari dua penelitian tersebut, akurasi yang dihasilkan masih belum maksimal. Maka penelitian ini bertujuan untuk menghasilkan POS tagger untuk Bahasa Indonesia dengan menggunakan CRF yang diharapkan dapat menghasilkan akurasi yang lebih baik. CRF merupakan framework untuk membangun model probabilistik untuk segmentasi dan pelabelan data sekuens yang memiliki kelebihan dibandingkan model probabilistik lainnya. Tiga tahap utama dalam penelitian ini adalah ekstraksi fitur, training dan testing. Data training dan data testing yang digunakan berasal dari ��Indonesian_Manually_Tagged_Corpus�� [8] berisi 250000 kata menggunakan 23 tagset. Pada proses training digunakan data training sebanyak 200 kalimat yang berisi 3910 kata dengan nilai standar deviasi 2 dan learning rate 0,000001. Dari hasil pengujian yang dilakukan terhadap 4 data testing, rata-rata akurasi yang dihasilkan adalah 78,20 %.

Item Type: Thesis (Diploma)
Uncontrolled Keywords: Pelabelan kelas kata, CRF, Bahasa Indonesia, kelas kata
Subjects: S1-Final Project > Fakultas Teknik Dan Ilmu Komputer > Teknik Informatika > 2017
Divisions: Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer
Universitas Komputer Indonesia > Fakultas Teknik dan Ilmu Komputer > Teknik Informatika (S1)
Date Deposited: 06 Jun 2017 02:58
Last Modified: 06 Jun 2017 02:58
URI: http://repository.unikom.ac.id/id/eprint/51875

Actions (login required)

View Item View Item