|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||
java.lang.Objectcom.hankcs.hanlp.HanLP
public class HanLP
HanLP: Han Language Processing
汉语言处理包
常用接口工具类
| 嵌套类摘要 | |
|---|---|
static class |
HanLP.Config
库的全局配置,既可以用代码修改,也可以通过hanlp.properties配置(按照 变量名=值 的形式) |
| 方法摘要 | |
|---|---|
static String |
convertToPinyinFirstCharString(String text,
String separator,
boolean remainNone)
转化为拼音(首字母) |
static List<Pinyin> |
convertToPinyinList(String text)
转化为拼音 |
static String |
convertToPinyinString(String text,
String separator,
boolean remainNone)
转化为拼音 |
static String |
convertToSimplifiedChinese(String traditionalChineseString)
简转繁 |
static String |
convertToTraditionalChinese(String simplifiedChineseString)
繁转简 |
static List<String> |
extractKeyword(String document,
int size)
提取关键词 |
static List<String> |
extractPhrase(String text,
int size)
提取短语 |
static List<String> |
extractSummary(String document,
int size)
自动摘要 |
static String |
getSummary(String document,
int max_length)
自动摘要 |
static Segment |
newSegment()
创建一个分词器 这是一个工厂方法 与直接new一个分词器相比,使用本方法的好处是,以后HanLP升级了,总能用上最合适的分词器 |
static CoNLLSentence |
parseDependency(String sentence)
依存文法分析 |
static List<Term> |
segment(String text)
分词 |
| 从类 java.lang.Object 继承的方法 |
|---|
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait |
| 方法详细信息 |
|---|
public static String convertToSimplifiedChinese(String traditionalChineseString)
traditionalChineseString - 繁体中文
public static String convertToTraditionalChinese(String simplifiedChineseString)
simplifiedChineseString - 简体中文
public static String convertToPinyinString(String text,
String separator,
boolean remainNone)
text - 文本separator - 分隔符remainNone - 有些字没有拼音(如标点),是否保留它们(用none表示)
public static List<Pinyin> convertToPinyinList(String text)
text - 待解析的文本
public static String convertToPinyinFirstCharString(String text,
String separator,
boolean remainNone)
text - 文本separator - 分隔符remainNone - 有些字没有拼音(如标点),是否保留它们(用none表示)
public static List<Term> segment(String text)
text - 文本
public static Segment newSegment()
public static CoNLLSentence parseDependency(String sentence)
sentence - 待分析的句子
public static List<String> extractPhrase(String text,
int size)
text - 文本size - 需要多少个短语
public static List<String> extractKeyword(String document,
int size)
document - 文档内容size - 希望提取几个关键词
public static List<String> extractSummary(String document,
int size)
document - 目标文档size - 需要的关键句的个数
public static String getSummary(String document,
int max_length)
document - 目标文档max_length - 需要摘要的长度
|
||||||||||
| 上一个类 下一个类 | 框架 无框架 | |||||||||
| 摘要: 嵌套 | 字段 | 构造方法 | 方法 | 详细信息: 字段 | 构造方法 | 方法 | |||||||||