Penelitian

Penerapan Modifikasi Metode Enhanced Confix Stripping Stemmer pada Teks Berbahasa Madura

Stemming adalah teknik untuk menemukan kata dasar dari sebuah kata yang telah mengalami imbuhan dengan cara menghilangkan atau menghapus imbuhan-imbuhan tersebut. Algoritma Enhanced Confix Stripping Stemmer adalah algoritma stemming yang akurat untuk mencari bentuk dasar dari suatu kata dalam Bahasa Indonesia. Bahasa Madura memiliki struktur morfologi yang mirip dengan Bahasa Indonesia. Bahasa Madura memiliki kata yang dapat dibentuk dari awalan (ter-ater), akhiran (panoteng) dan sisipan (sesselan) dan Kata Ulang (Rangkebbhan). Modifikasi algoritma Enhanced Confix Stripping Stemmer dilakukan pada tabel aturan pemenggalan, langkah-langkah algoritma dan penambahan langkah algoritma sesuai dengan morfologi Bahasa Madura. Dengan demikian dapat dihasilkan sebuah algoritma baru yang dikembangkan dari algoritma Enhanced Confix Stripping Stemmer. Setelah melakukan beberapa analisa dan pengujian dengan menggunakan sistem yang telah dibangun maka diperoleh hasil dari modifikasi algoritma Enhanced Confix Stripping Stemmer pada teks berbahasa Madura. Persentase kata Bahasa Madura yang berhasil distemming adalah 95,75 % dari 400 kata yang diuji. Dengan demikian modifikasi Enhanced Confix Stripping Stemmer pada teks berbahasa Madura dinilai efektif untuk diterapkan.

Kata Kunci : Stemming, Enhanced Confix Stripping Stemmer, Madura