PHP Stemmer Bahasa Indonesia

Stemming dalam Bahasa Indonesia: Panduan Lengkap untuk Information RetrievalPada kesempatan kali ini, kita akan membahas tentang stemming dalam konteks Information Retrieval (IR) untuk Bahasa Indonesia. Artikel ini merupakan bagian dari tugas dalam mata kuliah “Sistem Temu Kembali Informasi,” yang dalam bahasa Inggris dikenal sebagai “Information Retrieval System” atau disingkat “IR.”Apa Itu Stemming dan Hubungannya dengan IR?Stemming adalah proses untuk menemukan bentuk dasar dari sebuah kata dengan menghilangkan semua imbuhan, baik awalan, sisipan, akhiran, maupun kombinasi dari awalan dan akhiran. Tujuan utama dari stemming adalah menyederhanakan variasi bentuk kata menjadi bentuk dasar yang sesuai dengan struktur morfologi bahasa Indonesia.Peran Stemming dalam Information RetrievalDalam Information Retrieval, ada dua proses utama: Indexing dan Searching. Proses Indexing terdiri dari beberapa subproses, termasuk:Word Tokenization: Mengubah dokumen menjadi kumpulan term dengan mengh… PHP Stemmer Bahasa Indonesia

Algoritma Stemming Bahasa Indonesia Perl

Algoritma Stemmer Bahasa Indonesia


Program pencari kata dasar (stemmer) dalam Bahasa Indonesia, dibuat dengan bahasa pemrograman Perl. Program ini bekerja menggunakan kamus kata dasar, menurut pola kata berimbuhan sesuai pedoman Ejaan Yang Disempurnakan (EYD). Semoga bermanfaat.
1. Pendahuluan Struktur pembentukan kata dalam Bahasa Indonesia adalah sebagai berikut: [awalan-1] + [awalan-2] + dasar + [akhiran] + [kepunyaan] + [sandang] Masing-masing bagian tersebut (yang dalam kotak bisa ada atau tidak), digabungkan dengan kata dasar membentuk kata berimbuhan. Di bawah ini imbuhan yang banyak digunakan dalam Bahasa Indonesia : Kata sandang: -lah, -kah, -pun, -tah.Kata kepunyaan: -ku, -mu, -nya.Akhiran: -i, -an, -kan.Awalan: me-, ber-, pe-, di-, ke-, ter-, se-. Dalam proses penggabungan awalan, terdapat aturan-aturan berikut: Awalan Perubahan Bentuk Aturan me | pe meng | peng + V | k | g | h | q … Misal: mengambil = meng + ambil V = Vokal (a, i, u, e, o)
meny | peny + s … Misal: penyakit = … Algoritma Stemming Bahasa Indonesia Perl