Ansj中文分词

Ansj中文是一个基于google语义模型+条件随机场模型的中文分词的java实现.分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上,目前实现了.中文分词. 中文姓名识别 . 用户自定义词典,可以应用到自然语言处理等方面,适用于对分词效果要求搞的各种项目.项目地址:https://github.com/ansjsun/ansj_seg 文档:http://ansjsun.github.io/ansj_seg/

NLP-lang java自然语言处理基础包

#nlp-lang 项目n文档#### 这个项目是一个基本包.封装了大多数nlp项目中常用工具 > 工具 * √ 词语标准化 * √ tire树结构 * √ 双数组tire树 * √ 文本断句 * √ html标签清理 > 组件 * √ 汉字转拼音 * √ 简繁体转换 * √ bloomfilter * √ 指纹去重 * √ 词共现统计 文档:http://www.nlpcn.org/docs/7 项目地址:https://github.com/NLPchina/nlp-lang

Page 1 of 1 1