本文主要是介绍事件抽取在工业界的具体应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
每天给你送来NLP技术干货!
来自:AI算法小喵
写在前面
本篇不具体谈技术,主要是汇总在事件抽取方向的相关厂商调研结果。如果本文对你有所帮助,记得文末点赞+在看,也可以分享给你需要的朋友~~。
1. 事件抽取范畴、范式、技术栈
领域范畴:厂商无论是在特定领域(如:法律、金融),还是通用领域,厂商做的都是限定类型的事件抽取。
范式:除标准抽取外(即事件检测和事件论元识别),还有:仅抽取
触发词和论元
;仅抽取事件类型和论元
。在论元抽取上也各不相同,有的仅抽取主体
,有的抽取通用属性
(如:时间/地点,或者时间/地点/主体/客体)等。技术栈:
-
预训练语言模型+(BiLSTM)+CRF
预训练语言模型+MRC
预训练语言模型+Biaffine
Bert+BiLSTM+Self-Attention+Pointer Network
预训练语言模型+指针结构+CLN(ConditionalLayerNorm)等
2. 相关厂商汇总
2.1 华为云
领域范畴
华为云/自然语言处理服务接口说明/事件抽取[1]目前只支持金融公告中的会议召开、聘任、辞职、股票增持、股票减持5类事件以及相关要素的抽取。
范式(标准事件抽取)
包括事件检测(触发词抽取➕事件类型判定) 事件论元识别(论元抽取➕论元角色判定)
技术栈
未找到直接描述,但找到了华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析[2],但注意这个比赛不属于标准的事件抽取。
上图分别是他们的整体框架图和子模型图,他们将这个任务拆解了三个子任务:
事件类型预测
,事件要素抽取
,以及事件表格填充
。值得关注的是在论元提取(要素抽取)阶段,除了CRF外,他们也尝试了MRC(阅读理解范式)、Biaffine。其中Biaffine思想来自论文Named Entity Recognition as Dependency Parsing[3]。
另外在最后表格填充时,他们也采用了特殊处理。
2.2 百度
领域范畴
百度AI/知识图谱/事件图谱/事件属性抽取[4]从资讯的标题与正文中,抽取事件发生
时间
、地点
、参与者
、触发词
等事件元素。应该未限定领域范畴。范式和技术栈
未找到直接描述,但可从其报告百度: 事件图谱技术与应用[5]分析:
通用属性抽取针对
时间、地点、参与者、触发词
进行抽取,采用的是实体识别常用的预训练语言模型(ERNIE)+BiLSTM+CRF;自定义论元抽取采用MRC(阅读理解) 方式,将抽取转换成问答形式,通过问题嵌入要抽取的目标,如某角色的论元,来解耦了模型与事件类型、角色类型的相关部分;
语义角色抽取和目前我实验所采用的范式一样,都是层叠指针结构。另外因为不同类型事件有各自的论元角色,如果全部建模到模型中,模型会变得很复杂,所以百度将所有角色分门别类,如主体、客体等等(这里百度称为语义角色),然后利用多层指针结构同时抽取。
需要指出的是,通用属性抽取的问题是无法灵活地泛化。MRC(阅读理解方案)的问题则是效率,因为需要对每一个角色都进行单独提问抽取。
2.3 科大讯飞
无,但科大讯飞有举办相关比赛,这里有一份参赛者的分享科大讯飞2020完整事件抽取系统[6]。
范式
非标准的事件抽取,任务包括:抽取
触发词
,主体/客体/时间/地点
,判定事件发生状态的属性
,包括极性、时态
。极性分为:肯定、否定、可能;时态分为:过去、现在、将来、其他。技术栈(pipeline)
触发词抽取:Bert+指针结构;特征层面:利用远程监督增加了已知的所有触发词的嵌入。
主体/客体/时间/地点抽取:Bert+conditionalLayerNorma+指针结构。特征层面:trigger在文本中的位置、其他词到trigger的位置。
2.4 深擎科技
在他们主页上没有找到相关接口,但是找到一篇他们分享的文章结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取[7]。这篇文章里主要提及了事件主体识别
和事件类型判定
:
事件类型判定:
金融事件的特征相对明显,业务术语等很大程度上决定了分类的效果,他们直接采用Fasttext分类模型,在句子级的事件识别任务中达到了95.7%的准确率。
事件主体识别:
采用了基于指针网络带注意力机制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主体识别模型,从文本中找出在事件中充当的主体角色元素。
2.5 幂律智能
领域范畴
法律方向,分析对象主要为裁判文书、案件卷宗等法律描述文本
范式(非标准事件抽取)
主要抽取出独立的包含
时间、人物、地点、描述的子事件
技术栈
基于深度学习的序列标注模型,从探测出的事件片段中预测出时间、地点、任务、描述信息
值得注意的是,他们还有一个时间线(类似于事件脉络),主要是通过提取出的时间标准化比对。
2.6 云孚语义
有,而且已经有了事件脉络(原计划将要做的,别人已经有了😂),但是目前没有看到云孚主页[7]有演示接口,仅看到它的微信公众号文章中的展示。
3.总结
关于事件抽取方向的相关厂商调研内容就到这里了,后续将会出事件抽取方向调研-技术栈篇等相关内容。如果本文对你有所帮助,记得点赞+在看,也可以分享给你需要的朋友~~。
参考资料
[1]
华为云/自然语言处理服务接口说明/事件抽取: https://support.huaweicloud.com/api-nlp/nlp_03_0086.html#ZH-CN_TOPIC_0264822087__table159236111615
[2]华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析: https://bbs.huaweicloud.com/blogs/209117
[3]Named Entity Recognition as Dependency Parsing: https://aclanthology.org/2020.acl-main.577/
[4]百度AI/知识图谱/事件图谱/事件属性抽取: https://ai.baidu.com/tech/kg/event_graph/extract
[5]百度: 事件图谱技术与应用: https://www.ruilog.com/notebook/view/01afff1812a2.html
[6]科大讯飞2020完整事件抽取系统: https://jishuin.proginn.com/p/763bfbd32eca
[7]结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取: https://www.jiqizhixin.com/articles/2019-08-30-8
[8]云孚主页: https://www.yunfutech.com/demohome
📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。
最近文章
EMNLP 2022 和 COLING 2022,投哪个会议比较好?
一种全新易用的基于Word-Word关系的NER统一模型
阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果
ACL'22 | 快手+中科院提出一种数据增强方法:Text Smoothing
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套! 后台回复【五件套】
下载二:南大模式识别PPT 后台回复【南大模式识别】
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注
这篇关于事件抽取在工业界的具体应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!