Selasa, 15 Maret 2011

STBI

Nama : MUSTIKAWATI
NRP : 08.04.111.00043

Exercise 1.1
1. Collect the documents to be indexed:



2. Tokenize the text, turning each document into a list of tokens:



3. Do linguistic preprocessing, producing a list of normalized tokens, which
are the indexing terms:



Exercise 1.7
1. tangerine 46653 OR trees 316812 = ( 1234568) AND
marmalade 107913 OR skies 271658 = ( 012356789) AND
kaleidoscope 87009 OR eyes 213312= (0123789)

2. ( 1234568) AND ( 012356789) AND (0123789)

3. (123568) AND (0123789) = ( 1238)

 Exercise 1.10

INTERSECT(x, y)
answer ← ()
while y ≠ NIL OR y ≠ NIL
do if docID(x) = docID(y)
then ADD(answer, docID(x))
x ← next(x)
y← next(y)
else if docID(x) < docID(y) then x ← next(x) else y ← next(y) return answer Gunakan google dan yahoo. Coba beberapa query boolean. Catat hasil yang diberikan. Bandingkan!



Hasil penelusuran Google
1. Hasil yang diberikan google lebih mendekati kebenaran dan keakuratan dari perintah yang diberikan.

2. Data yang ditampilkan lebih banyak sesuai data yang dibutuhkan.

Hasil penelusuran Yahoo
1. Hasil yang diberikan yahoo belum mendekati kebenaran dan keakuratan dari perintah yang diberikan
2. Data yang ditampilkan sedikit yang sesuai dengan query yang dimasukan

0 komentar:

Posting Komentar