PERBANDINGAN ALGORITMA STEMMING PORTER / NAZIEF & ADRIANI STEMMING DOKUMEN TEKS BAHASA INDONESIA

Konferensi Nasional Sistem dan Informatika 2009; Bali, November 14, 2009  KNS&I09-036
196
PERBANDINGAN  ALGORITMA STEMMING PORTER DENGAN
ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS
BAHASA INDONESIA
Ledy Agusta
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
ledyagusta@gmail.com
ABSTRACT
Information Retrieval (IR) is a process to retrieve relevant documents from set of documents in a database. Increasing
amount of text documents on internet is followed by the increase of the need for effective and efficient IR tools. Search
Engine is an application of IR system that depends on indexing and query expansion tools’s support. Stemming is a
process to transform all words in text document to their rootword form. Rootword then will be saved as index. Stemming
is also used for query expansion. The appropriate algorithm will give best performance to IR system, indexing and query
expansion. This research compares two Indonesian stemmers, Porter and  Nazief &… PERBANDINGAN ALGORITMA STEMMING PORTER / NAZIEF & ADRIANI STEMMING DOKUMEN TEKS BAHASA INDONESIA

Script PHP PostgreSQL Database Stemming Input Kata Ke Dalam Database

Dalam tugas akhir yang saya kerjakan untuk menyelesaikan perkuliahan, terdapat proses stemming bahasa indonesia. Stemming adalah proses mencari bentuk kata dasar sesuai aturan dan kaidah bahasa Indonesia yang baku. Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Algoritma yang saya gunakan dalam proses stemming tersebut adalah algoritma Nazief & Adriani. Algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan (presisi) lebih baik dari algoritma lainnya. Algoritma yang dibuat oleh Bobby Nazief dan Mirna Adriani sangat dibutuhkan dan menentukan dalam proses IR dalam dokumen Indonesia.

Proses stemming tersebut sangat bergantung pada kamus kata dasar yang kita miliki. Oleh karena itu, saya melakukan pencarian mengenai kata dasar yang cocok dan lengkap untuk penelitian tersebut. Setelah melalang buana ke server satu ke server lainnya maka saya mendapatkan situs yang bagus yaitu: http://bahtera.org/. Bahtera ada… Script PHP PostgreSQL Database Stemming Input Kata Ke Dalam Database

Algoritma Nazief Adriani Stemming Teks Bahasa Indonesia

Stemming merupakan bagian yang tidak terpisahkan dalam Information Retrieval (IR). Tidak banyak algoritma yang dikhususkan untuk stemming bahasa Indonesia dengan berbagai keterbatasan didalamnya. Algoritma Porter salah satunya, Algoritma ini membutuhkan waktu yang lebih singkat dibandingkan dengan stemmingmenggunakan Algoritma Nazief & Adriani, namun proses stemming menggunakan Algoritma Porter memiliki prosentase keakuratan (presisi) lebih kecil dibandingkan dengan stemming menggunakan Algoritma Nazief & Adriani. Algoritma Nazief & Adriani sebagai algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan (presisi) lebih baik dari algoritma lainnya. Algoritma ini sangat dibutuhkan dan menentukan dalam proses IR dalam dokumen Indonesia. Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa IR dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya. Algoritma stemming untuk bahasa yang … Algoritma Nazief Adriani Stemming Teks Bahasa Indonesia

PHP Script Stemming Nazief Algoritma Bahasa Indonesia

SCRIPT STEMMING ALGORITMA NAZIEF  DALAM BAHASA INDONESIA , YANG BERTUJUAN MENEMUKAN KATA DASAR

1300-an kata STOP WORD LIST BAHASA INDONESIA dan terus di update.
30000-an kata DASAR BAHASA INDONESIA dan terus di update.
Jangan Lupa Periksa Daftar Stop Word List dan Sumber Bahan Thesis/Skripsi/Disertasi/Jurnal Ilmiah Tentang Stemming dan Information Retrieval , Link Di Sebelah Kanan Halaman. Selamat Menikmati. Happy Researching!



<?php
require_once(‘Algoritma_stemming.php’);
?>
<h3>STEMMING KATA DASAR</h3>
<form method=”post” action=”">
<input type=”text” name=”katadasar” id=”katadasar” size=”20″>
<input class=”btnForm” type=”submit” name=”btnSubmitAdd” value=”Submit”/>
</form>
<?php
if(isset($_POST['katadasar'])){
$teksAsli = $_POST['katadasar'];
//echo $teksAsli;
$length = strlen($teksAsli);
//echo $length;
$pattern = ‘[A-Za-z]‘;
$kata = ”;
if(eregi($pattern,$teksAsli)){
$kata = $teksAsli;
$stemming = NAZIEF($kata);//Memasu… PHP Script Stemming Nazief Algoritma Bahasa Indonesia

Daftar Kata Dasar Bahasa Indonesia (+30000 kata)

DAFTAR 30000-an kata DASAR DALAM BAHASA INDONESIA update.

a
ab
aba
aba-aba
abad
abadi
abadiah
abah
abah-abah
abai
abaimana
abaka
abaktinal
abakus
abal-abal
aban
abang
abangan
abangga
abar
abatoar
abau
abdas
abdi
abdikasi
abdomen
abdominal
abdu
abduksi
abduktor
abece
aben
aberasi
abet
abian
abid
abidin
abilah
abing
abiogenesis
abiosfer
abiotik
abis
abisal
abiseka
abiturien
abjad
abjadiah
ablasi
ablaut
ablepsia
abnormal
abnormalitas
abnus
aboi
abolisi
abon
abonemen
abong-abong
aborsi
abortif
abortiva
abortus
abrak
abrakadabra
abrar
abras
abrasi
abreaksi
abrek
abreviasi
abrikos
abrit-abrit
abrosfer
absah
absen
absensi
absensia
absente
absenteisme
abses
absis
absolusi
absolut
absolutisme
absonan
absorb
absorben
absorbir
absorpsi
absorpsiometer
absorptif
abstain
abstinensi
abstrak
abstraksi
absurd
absurdisme
abtar
abu
abu-abu
abuan
abuh
abuk
abuk-abuk
abul
abulhayat
abulia
abun-abun
abur
abus
abyad
acah
acak
acak-acakan
acala
acan
acang
acang-acang
acap
acar
acara
acaram
acat
acau
acawi
ac… Daftar Kata Dasar Bahasa Indonesia (+30000 kata)