com.hankcs.hanlp.tokenizer
类 NotionalTokenizer

java.lang.Object
  继承者 com.hankcs.hanlp.tokenizer.NotionalTokenizer

public class NotionalTokenizer
extends Object

实词分词器,自动移除停用词

作者:
hankcs

构造方法摘要
NotionalTokenizer()
           
 
方法摘要
static List<List<Term>> seg2sentence(String text)
          切分为句子形式
static List<List<Term>> seg2sentence(String text, Filter... filterArrayChain)
          切分为句子形式
static List<Term> segment(char[] text)
          分词
static List<Term> segment(String text)
           
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

构造方法详细信息

NotionalTokenizer

public NotionalTokenizer()
方法详细信息

segment

public static List<Term> segment(String text)

segment

public static List<Term> segment(char[] text)
分词

参数:
text - 文本
返回:
分词结果

seg2sentence

public static List<List<Term>> seg2sentence(String text)
切分为句子形式

参数:
text -
返回:

seg2sentence

public static List<List<Term>> seg2sentence(String text,
                                            Filter... filterArrayChain)
切分为句子形式

参数:
text -
filterArrayChain - 自定义过滤器链
返回:


Copyright © 2014–2015 鐮佸啘鍦�/a>. All rights reserved.