事件抽取在工业界的具体应用

2024-02-18 14:50

本文主要是介绍事件抽取在工业界的具体应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

每天给你送来NLP技术干货!


来自:AI算法小喵

写在前面

本篇不具体谈技术,主要是汇总在事件抽取方向的相关厂商调研结果。如果本文对你有所帮助,记得文末点赞+在看,也可以分享给你需要的朋友~~。

1. 事件抽取范畴、范式、技术栈

  1. 领域范畴:厂商无论是在特定领域(如:法律、金融),还是通用领域,厂商做的都是限定类型的事件抽取

  2. 范式:除标准抽取外(即事件检测和事件论元识别),还有:仅抽取触发词和论元;仅抽取事件类型和论元。在论元抽取上也各不相同,有的仅抽取主体,有的抽取通用属性(如:时间/地点,或者时间/地点/主体/客体)等。

  3. 技术栈

    • 预训练语言模型+(BiLSTM)+CRF

    • 预训练语言模型+MRC

    • 预训练语言模型+Biaffine

    • Bert+BiLSTM+Self-Attention+Pointer Network

    • 预训练语言模型+指针结构+CLN(ConditionalLayerNorm)等

2. 相关厂商汇总

2.1 华为云

  • 领域范畴

    华为云/自然语言处理服务接口说明/事件抽取[1]目前只支持金融公告中的会议召开、聘任、辞职、股票增持、股票减持5类事件以及相关要素的抽取。

  • 范式(标准事件抽取)

    包括事件检测(触发词抽取➕事件类型判定) 事件论元识别(论元抽取➕论元角色判定)

  • 技术栈

    未找到直接描述,但找到了华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析[2],但注意这个比赛不属于标准的事件抽取。9794d11f3eb216a21e33c007222abd3f.png96f706588e418ebcfb100744ccd5a2fd.pngc3cb8c6eb9c56b911fd1fa23be81cf69.png

    上图分别是他们的整体框架图和子模型图,他们将这个任务拆解了三个子任务:事件类型预测事件要素抽取,以及事件表格填充

    值得关注的是在论元提取(要素抽取)阶段,除了CRF外,他们也尝试了MRC(阅读理解范式)、Biaffine。其中Biaffine思想来自论文Named Entity Recognition as Dependency Parsing[3]

    另外在最后表格填充时,他们也采用了特殊处理

2.2 百度

  • 领域范畴

    百度AI/知识图谱/事件图谱/事件属性抽取[4]从资讯的标题与正文中,抽取事件发生时间地点参与者触发词等事件元素。应该未限定领域范畴。

  • 范式和技术栈

    未找到直接描述,但可从其报告百度: 事件图谱技术与应用[5]分析:

    • 通用属性抽取针对时间、地点、参与者、触发词进行抽取,采用的是实体识别常用的预训练语言模型(ERNIE)+BiLSTM+CRFff36d978e3cf059e9bb03f884e6bcc04.png

    • 自定义论元抽取采用MRC(阅读理解) 方式,将抽取转换成问答形式,通过问题嵌入要抽取的目标,如某角色的论元,来解耦了模型与事件类型、角色类型的相关部分;ea35e62b0bc3fcd31479e9ae6c9861c4.png

    • 语义角色抽取和目前我实验所采用的范式一样,都是层叠指针结构。另外因为不同类型事件有各自的论元角色,如果全部建模到模型中,模型会变得很复杂,所以百度将所有角色分门别类,如主体、客体等等(这里百度称为语义角色),然后利用多层指针结构同时抽取。48b80924ec62f946abd4bd89f5c72428.png

需要指出的是,通用属性抽取的问题是无法灵活地泛化。MRC(阅读理解方案)的问题则是效率,因为需要对每一个角色都进行单独提问抽取。

2.3 科大讯飞

无,但科大讯飞有举办相关比赛,这里有一份参赛者的分享科大讯飞2020完整事件抽取系统[6]

  • 范式

    非标准的事件抽取,任务包括:抽取触发词主体/客体/时间/地点,判定事件发生状态的属性包括极性、时态。极性分为:肯定、否定、可能;时态分为:过去、现在、将来、其他。

  • 技术栈(pipeline)

    • 触发词抽取Bert+指针结构特征层面:利用远程监督增加了已知的所有触发词的嵌入。7b9ceb579c8db27d7706e833c9cf7fb3.png

    • 主体/客体/时间/地点抽取Bert+conditionalLayerNorma+指针结构特征层面:trigger在文本中的位置、其他词到trigger的位置。670db7c8d1daea7f503662268a524ea2.png

2.4 深擎科技

在他们主页上没有找到相关接口,但是找到一篇他们分享的文章结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取[7]。这篇文章里主要提及了事件主体识别事件类型判定

  • 事件类型判定

    金融事件的特征相对明显,业务术语等很大程度上决定了分类的效果,他们直接采用Fasttext分类模型,在句子级的事件识别任务中达到了95.7%的准确率。

  • 事件主体识别

    采用了基于指针网络带注意力机制(PAN,Point Attention Network:Bert+BiLSTM+Self-Attention+Pointer Network)的事件主体识别模型,从文本中找出在事件中充当的主体角色元素。

2.5 幂律智能

e4461f668f11d2c80a35a9b8d6055e28.png
幂律智能-功能介绍
  • 领域范畴

    法律方向,分析对象主要为裁判文书、案件卷宗等法律描述文本

  • 范式(非标准事件抽取)

    主要抽取出独立的包含时间、人物、地点、描述的子事件

  • 技术栈

    基于深度学习的序列标注模型,从探测出的事件片段中预测出时间、地点、任务、描述信息

值得注意的是,他们还有一个时间线(类似于事件脉络),主要是通过提取出的时间标准化比对。

2b0b4f01eda15098c378e9f11f916041.png
幂律智能事件抽取展示页面

2.6 云孚语义

有,而且已经有了事件脉络(原计划将要做的,别人已经有了😂),但是目前没有看到云孚主页[7]有演示接口,仅看到它的微信公众号文章中的展示。

06eb5b5eb179436d10f3537645a18169.png
云孚语义-事件脉络

3.总结

关于事件抽取方向的相关厂商调研内容就到这里了,后续将会出事件抽取方向调研-技术栈篇等相关内容。如果本文对你有所帮助,记得点赞+在看,也可以分享给你需要的朋友~~。

参考资料

[1]

华为云/自然语言处理服务接口说明/事件抽取: https://support.huaweicloud.com/api-nlp/nlp_03_0086.html#ZH-CN_TOPIC_0264822087__table159236111615

[2]

华为云作为CCKS 2020篇章事件要素抽取比赛冠军的方案解析: https://bbs.huaweicloud.com/blogs/209117

[3]

Named Entity Recognition as Dependency Parsing: https://aclanthology.org/2020.acl-main.577/

[4]

百度AI/知识图谱/事件图谱/事件属性抽取: https://ai.baidu.com/tech/kg/event_graph/extract

[5]

百度: 事件图谱技术与应用: https://www.ruilog.com/notebook/view/01afff1812a2.html

[6]

科大讯飞2020完整事件抽取系统: https://jishuin.proginn.com/p/763bfbd32eca

[7]

结合指针网络的注意力机制(PAN模型)实现金融领域事件抽取: https://www.jiqizhixin.com/articles/2019-08-30-8

[8]

云孚主页: https://www.yunfutech.com/demohome


📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

EMNLP 2022 和 COLING 2022,投哪个会议比较好?

一种全新易用的基于Word-Word关系的NER统一模型

阿里+北大 | 在梯度上做简单mask竟有如此的神奇效果

ACL'22 | 快手+中科院提出一种数据增强方法:Text Smoothing


下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!  后台回复【五件套】
下载二:南大模式识别PPT  后台回复【南大模式识别】

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

7f5b7baab49f3c9fce3bb1adf7286300.png

记得备注

这篇关于事件抽取在工业界的具体应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/721504

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

禁止平板,iPad长按弹出默认菜单事件

通过监控按下抬起时间差来禁止弹出事件,把以下代码写在要禁止的页面的页面加载事件里面即可     var date;document.addEventListener('touchstart', event => {date = new Date().getTime();});document.addEventListener('touchend', event => {if (new

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。

【C++高阶】C++类型转换全攻略:深入理解并高效应用

📝个人主页🌹:Eternity._ ⏩收录专栏⏪:C++ “ 登神长阶 ” 🤡往期回顾🤡:C++ 智能指针 🌹🌹期待您的关注 🌹🌹 ❀C++的类型转换 📒1. C语言中的类型转换📚2. C++强制类型转换⛰️static_cast🌞reinterpret_cast⭐const_cast🍁dynamic_cast 📜3. C++强制类型转换的原因📝