: Class LowerCaseTokenizer

Overview

Package

Class

Tree

Deprecated

Index

Help

PREV CLASS NEXT CLASS

FRAMES NO FRAMES

SUMMARY: INNER | FIELD | CONSTR | METHOD

DETAIL: FIELD | CONSTR | METHOD

com.lucene.analysis
Class LowerCaseTokenizer

java.lang.Object
  |
  +--com.lucene.analysis.TokenStream
        |
        +--com.lucene.analysis.Tokenizer
              |
              +--com.lucene.analysis.LowerCaseTokenizer

public final class LowerCaseTokenizer
extends Tokenizer

LowerCaseTokenizer performs the function of LetterTokenizer and LowerCaseFilter together. It divides text at non-letters and converts them to lower case. While it is functionally equivalent to the combination of LetterTokenizer and LowerCaseFilter, there is a performance advantage to doing the two tasks at once, hence this (redundent) implementation. Note: this does a decent job for most European languages, but does a terrible job for some Asian languages, where words are not separated by spaces.

Fields inherited from class com.lucene.analysis.Tokenizer

input

Constructor Summary

LowerCaseTokenizer(Reader in)

Method Summary

Token next()
Returns the next token in the stream, or null at EOS.

Methods inherited from class com.lucene.analysis.Tokenizer

close

Methods inherited from class java.lang.Object

clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait

Constructor Detail

LowerCaseTokenizer

public LowerCaseTokenizer(Reader in)

Method Detail

public final Token next()
                 throws IOException

Description copied from class: TokenStream

Returns the next token in the stream, or null at EOS.

Overrides:: next in class TokenStream