【大咖说Ⅴ】陈文亮教授:基于语言理解的信息抽取研究

2024-01-16 00:40

本文主要是介绍【大咖说Ⅴ】陈文亮教授:基于语言理解的信息抽取研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎来到2022 CCF BDCI

大咖说系列专题报告

听顶级专家学者

围绕特定技术领域或选题

讲述自身成果的研究价值与实际应用价值

便于广大技术发烧友、大赛参赛者

吸收学术知识,强化深度学习

每周一、三、五

「大咖说」与你不见不散~

↓↓↓

本期大咖

陈文亮,苏州大学计算机学院教授、博士生导师,苏州大学人类语言技术研究所所长。2013年1月回国加入苏州大学计算机科学与技术学院。2005年-2010年在日本国立情报通信研究所担任专家研究员。2011年-2012年在新加坡国立信息通讯研究院担任研究科学家。近年来在国内外主要期刊杂志和学术会议上发表三十多篇学术论文,包括AI/NLP领域国际主要学术会议如ACL、AAAI、IJCAI、EMNLP、COLING等,国际顶级杂志如ACM/IEEE 杂志、Artificial Intelligence Journal等。曾在国际主要学术会议IJCNLP-2013和COLING-2014上作讲习报告(Tutorial)。出版英文专著一本,获得中国专利三项、美国专利一项。2020年获得钱伟长中文信息处理科学技术奖一等奖。2019年和2022年两次获得中国知识图谱大会CCKS最佳中文论文奖。

研究方向:信息抽取、知识图谱、KBQA

分享主题:基于语言理解的信息抽取研究

 

我们通常可以用数据库文档、单位文档、网络数据文档等各类文档进行信息抽取系统、常见问题检索、行业知识问答、说明书阅读等工作。我们一般采用三层框架:第一层是数据层,即各类文档;第二层是核心技术层,包括一些业界领先、全栈式、用户可定制的系列自然语言分析技术;第三层是服务层,即FAQ问题检索、知识问答服务、文档阅读服务、信息抽取服务等。

本次报告基于语言理解的信息抽取研究,研究目标是处理多模态文档数据、精准分析语言内部结构、对人类语言进行深层理解,以支持各种应用需求,主要从基于噪音标注数据的实体识别、基于噪音标注数据的关系识别、节约计算资源的事件抽取、基于信息抽取的相关应用四个方面展开介绍和分享。

具体内容请看陈老师的视频讲解小课堂~

【大咖说Ⅴ】陈文亮教授:基于语言理解的信息抽取研究

希望大家听完老师的分享,能学以致用,应用到竞赛中打怪升级、实操进阶哟~

这篇关于【大咖说Ⅴ】陈文亮教授:基于语言理解的信息抽取研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/610749

相关文章

C#读取本地网络配置信息全攻略分享

《C#读取本地网络配置信息全攻略分享》在当今数字化时代,网络已深度融入我们生活与工作的方方面面,对于软件开发而言,掌握本地计算机的网络配置信息显得尤为关键,而在C#编程的世界里,我们又该如何巧妙地读取... 目录一、引言二、C# 读取本地网络配置信息的基础准备2.1 引入关键命名空间2.2 理解核心类与方法

深入理解C++ 空类大小

《深入理解C++空类大小》本文主要介绍了C++空类大小,规定空类大小为1字节,主要是为了保证对象的唯一性和可区分性,满足数组元素地址连续的要求,下面就来了解一下... 目录1. 保证对象的唯一性和可区分性2. 满足数组元素地址连续的要求3. 与C++的对象模型和内存管理机制相适配查看类对象内存在C++中,规

关于Java内存访问重排序的研究

《关于Java内存访问重排序的研究》文章主要介绍了重排序现象及其在多线程编程中的影响,包括内存可见性问题和Java内存模型中对重排序的规则... 目录什么是重排序重排序图解重排序实验as-if-serial语义内存访问重排序与内存可见性内存访问重排序与Java内存模型重排序示意表内存屏障内存屏障示意表Int

C语言线程池的常见实现方式详解

《C语言线程池的常见实现方式详解》本文介绍了如何使用C语言实现一个基本的线程池,线程池的实现包括工作线程、任务队列、任务调度、线程池的初始化、任务添加、销毁等步骤,感兴趣的朋友跟随小编一起看看吧... 目录1. 线程池的基本结构2. 线程池的实现步骤3. 线程池的核心数据结构4. 线程池的详细实现4.1 初

使用Python检查CPU型号并弹出警告信息

《使用Python检查CPU型号并弹出警告信息》本教程将指导你如何编写一个Python程序,该程序能够在启动时检查计算机的CPU型号,如果检测到CPU型号包含“I3”,则会弹出一个警告窗口,感兴趣的小... 目录教程目标方法一所需库步骤一:安装所需库步骤二:编写python程序步骤三:运行程序注意事项方法二

PostgreSQL如何查询表结构和索引信息

《PostgreSQL如何查询表结构和索引信息》文章介绍了在PostgreSQL中查询表结构和索引信息的几种方法,包括使用`d`元命令、系统数据字典查询以及使用可视化工具DBeaver... 目录前言使用\d元命令查看表字段信息和索引信息通过系统数据字典查询表结构通过系统数据字典查询索引信息查询所有的表名可

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

业务中14个需要进行A/B测试的时刻[信息图]

在本指南中,我们将全面了解有关 A/B测试 的所有内容。 我们将介绍不同类型的A/B测试,如何有效地规划和启动测试,如何评估测试是否成功,您应该关注哪些指标,多年来我们发现的常见错误等等。 什么是A/B测试? A/B测试(有时称为“分割测试”)是一种实验类型,其中您创建两种或多种内容变体——如登录页面、电子邮件或广告——并将它们显示给不同的受众群体,以查看哪一种效果最好。 本质上,A/B测