本文主要是介绍王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
第一部分 DeepDive 知识抽取实战
注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。
1.1 工程组成
1.2 先验数据导入
1.3 待抽取文章导入
1.4 流程
1.5 文章数据预处理
对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。
在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。
1.6 候选实体抽取
候选实体对生成
关系特征抽取
数据标注
因子图构建
总结
这个项目仅仅听老师讲,很难懂这个过程。还需要自己亲自实践,才能真正理解。
这篇关于王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!