public class TurkishTokenStream
extends java.lang.Object
Modifier and Type | Field and Description |
---|---|
static int |
MAX_CUMLE_BOY |
static int |
MAX_KELIME_BOY |
Constructor and Description |
---|
TurkishTokenStream(java.io.InputStream is,
java.lang.String encoding)
Herhangibir input Streaminden'den kelime okuyan TurkishTokenStream oluşturur.
|
TurkishTokenStream(java.lang.String fileName,
java.lang.String encoding)
Dosyadan kelime okuyan TurkishTokenStream oluşturur
|
Modifier and Type | Method and Description |
---|---|
char |
harfIsle(char chIn) |
boolean |
isSentenceDelimiter(char ch) |
java.lang.String |
nextSentence()
Metindeki veya stream'deki bir sonraki cümleyi getirir
|
java.lang.String |
nextWord()
Metindeki veya stream'deki bir sonraki kelimeyi getirir
- Büyük harfleri küçültür
- Noktalama işaretlerini yutar.
|
void |
setStatistics(Istatistikler statistics) |
public static int MAX_KELIME_BOY
public static int MAX_CUMLE_BOY
public TurkishTokenStream(java.lang.String fileName, java.lang.String encoding)
fileName
- encoding:
- default için null verinpublic TurkishTokenStream(java.io.InputStream is, java.lang.String encoding)
is
- encoding
- : default için null verinpublic java.lang.String nextWord()
public java.lang.String nextSentence()
public char harfIsle(char chIn)
public boolean isSentenceDelimiter(char ch)
public void setStatistics(Istatistikler statistics)
Copyright 2005-2008 Zemberek Development Team. All Rights Reserved.