jieba(结巴)Python分词器加载到Eclipse方法
16lz
2021-01-22
参考:http://www.oschina.net/p/jieba/news
一、结巴的安装
Python 2.x 下的安装
全自动安装:easy_install jieba或者pip install jieba
半自动安装:先下载http://pypi.python.org/pypi/jieba/,解压后运行python setup.py install
手动安装:将jieba目录放置于当前目录或者site-packages目录
通过import jieba 来引用 (第一次import时需要构建Trie树,需要几秒时间)
Python 3.x 下的安装
目前master分支是只支持Python2.x 的
Python3.x 版本的分支也已经基本可用:https://github.com/fxsjy/jieba/tree/jieba3k
git clone https://github.com/fxsjy/jieba.git
git checkout jieba3k
python setup.py install
安装完毕后,在命令行中测试,
#encoding=utf-8
import jieba
seg_list = jieba.cut("我来到北京清华大学",cut_all=True)
print "Full Mode:", "/ ".join(seg_list) #全模式
seg_list = jieba.cut("我来到北京清华大学",cut_all=False)
print "Default Mode:", "/ ".join(seg_list) #精确模式
seg_list = jieba.cut("他来到了网易杭研大厦") #默认是精确模式
print ", ".join(seg_list)
seg_list = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造") #搜索引擎模式
print ", ".join(seg_list)
看是否安装成功。
二、Eclipse的配置
以上安装完以后再Eclipse中输入上述命令显示jieba不存在,点击window->Preference->PyDev->Eidtor->interpreter-Python
选择下面的Libraries,选择New Folder,将结巴的安装目录加入即可,在linux下使用easy_install一般安装在/usr/local/lib/Python2.7/dist-packages/jieba-0.31-py2.7.egg
点击确定就可以在Eclipse中使用了,enjoying it!
更多相关文章
- python实现单例模式
- [Python设计模式] 第1章 计算器——简单工厂模式
- Linux或Linux虚拟机桥接模式使用Python2认证Drcom
- 如何在/account / url模式之外使用Django-AllAuth注册表单?
- Python_面向对象_单例模式
- [Python]流式模式匹配?
- Python正则表达式拆分保持拆分模式字符
- 分离RegEx模式匹配具有相同的潜在启动字符。
- 【Python】logging结合decorator模式实优化日志输出