jieba分词三种模式 ,词性标注+分词

  • Post author:
  • Post category:其他


jieba分词三种模式

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# Author: Jia ShiLin
'''
jieba三种分词模式
注意jieba分词后得到的是一个list
'''

import jieba
import jieba.posseg as pseg

# 1. print("\n jieba分词全模式")
seg_list = jieba.cut("小明硕士毕业于中国科学院计算所,后在日本京都大学深造", cut_all=True)
print("Full    Mode:", "/".join(seg_list))
# 2. print("\n jieba分词精确模式")
seg_list1 = jieba.cut("小明硕士毕业于中国科学院计算所,后在日本京都大学深造", cut_all=False)  ## cut_all不写也行,默认是精确模式
print('Default Mode:', '/'.join(seg_list1))
# 3. print("\n搜索引擎模式:")
seg_list2 = jieba.cut_for_search("小明硕士毕业于中国科学院计算所,后在日本京都大学深造")
print("Search  Mode:", '/'.join(seg_list2))

词性标注+分词

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# Author: Jia ShiLin

import jieba.posseg as pseg

strings = "小明硕士毕业于中国科学院计算所,后在日本京都大学深造"
seg_list = pseg.cut(strings)

print("\njieba词性标注: ")
for word, flat in seg_list:
    print("%s | %s" % (word, flat))



版权声明:本文为qq_35290785原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。