本文主要是介绍短文本分类工具 TextGrocery,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
>>> from tgrocery import Grocery # 新开张一个杂货铺,别忘了取名! >>> grocery = Grocery( 'sample' ) # 训练文本可以用列表传入 >>> train_src = [ ( 'education' , '名师指导托福语法技巧:名词的复数形式' ), ( 'education' , '中国高考成绩海外认可 是“狼来了”吗?' ), ( 'sports' , '图文:法网孟菲尔斯苦战进16强 孟菲尔斯怒吼' ), ( 'sports' , '四川丹棱举行全国长距登山挑战赛 近万人参与' ) ] >>> grocery.train(train_src) # 也可以用文件传入 >>> grocery.train( 'train_ch.txt' ) # 保存模型 >>> grocery.save() # 加载模型(名字和保存的一样) >>> new_grocery = Grocery( 'sample' ) >>> new_grocery.load() # 预测 >>> new_grocery.predict( '考生必读:新托福写作考试评分标准' ) education # 测试 >>> test_src = [ ( 'education' , '福建春季公务员考试报名18日截止 2月6日考试' ), ( 'sports' , '意甲首轮补赛交战记录:米兰客场8战不败国米10年连胜' ), ] >>> new_grocery.test(test_src) # 准确率 0.5 # 同样可以用文本传入 >>> new_grocery.test( 'test_ch.txt' ) # 自定义分词器 >>> custom_grocery = Grocery( 'custom' , custom_tokenize = list ) |
这篇关于短文本分类工具 TextGrocery的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!