苏神博客阅读记录

2023-10-23 08:59
文章标签 记录 博客 阅读 苏神

本文主要是介绍苏神博客阅读记录,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

20220504

​​​​​​GAU-α:尝鲜体验快好省的下一代Attention

FLASH:可能是近来最有意思的高效Transformer设计

对attention的一个革新。标准的transformer是attention层和FFN层交替,FLASH这篇提出来利用GAU代替attention+FFN,命名为FLASH-Quad,然后采用分块混合注意力,提出了线性复杂度的FLASH.

20220505

GPLinker:基于GlobalPointer的事件联合抽取

事件联合抽取模型,第一次接触事件抽取,有点类似于NER。未接触过实际任务,理解不深,其中完全子图搜索应用新颖。

明日阅读:

GPLinker:基于GlobalPointer的实体关系联合抽取

Efficient GlobalPointer:少点参数,多点效果

20220506

Efficient GlobalPointer:少点参数,多点效果

这篇厉害了(因为思路刚好可以用于最近的模型),GlobalPointner的改进,把原来NER的打分函数根据识别和分类两部分进行修改,极大减少了参数量,并且效果算有所提升(在简单任务略微降低,复杂任务极大提升)。最近试试在我们的数据上Efficient GlobalPointner是不是会更好。

GPLinker:基于GlobalPointer的实体关系联合抽取

这篇很多部分没看懂,一方面是概率图模型不理解,一方面对比的TPLinker不理解。明天继续扩展看相关的来理解GPLinker。

明日阅读:

基于DGCNN和概率图的轻量级信息抽取模型

20220507

今天工作太忙了,没来得及看,明天继续上边计划。

20220509

基于DGCNN和概率图的轻量级信息抽取模型

这是一篇考古论文,2019年bert刚提出来没多久,模型没有用bert,还在研究各种字词位置编码,看的原因是想深入了解概率图模型。没想到惊喜很多:第一个是作者放弃当时常规的命名实体识别和关系抽取模型,自己设计了概率图模型的抽签结构;第二个是很多比赛技巧,比如远程监督的先验特征(把训练集里的所有三元组取出来构建成三元组知识库直接匹配)比如知识蒸馏(用训练出来的模型对质量不好的训练集进行改进)。后边这俩技巧其实在日常开发中也用处广泛。

明日阅读:

TPLinker

20220516

在bert4keras中使用混合精度和XLA加速训练

几个参数就可以加速训练,很方便实用。

TPLinker读了但是忘记记录了,没有印象了。。。下次再读一次吧。

这篇关于苏神博客阅读记录的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/266854

相关文章

Spring Retry 实现乐观锁重试实践记录

《SpringRetry实现乐观锁重试实践记录》本文介绍了在秒杀商品SKU表中使用乐观锁和MybatisPlus配置乐观锁的方法,并分析了测试环境和生产环境的隔离级别对乐观锁的影响,通过简单验证,... 目录一、场景分析 二、简单验证 2.1、可重复读 2.2、读已提交 三、最佳实践 3.1、配置重试模板

在 Spring Boot 中使用异步线程时的 HttpServletRequest 复用问题记录

《在SpringBoot中使用异步线程时的HttpServletRequest复用问题记录》文章讨论了在SpringBoot中使用异步线程时,由于HttpServletRequest复用导致... 目录一、问题描述:异步线程操作导致请求复用时 Cookie 解析失败1. 场景背景2. 问题根源二、问题详细分

关于Spring @Bean 相同加载顺序不同结果不同的问题记录

《关于Spring@Bean相同加载顺序不同结果不同的问题记录》本文主要探讨了在Spring5.1.3.RELEASE版本下,当有两个全注解类定义相同类型的Bean时,由于加载顺序不同,最终生成的... 目录问题说明测试输出1测试输出2@Bean注解的BeanDefiChina编程nition加入时机总结问题说明

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

关于rpc长连接与短连接的思考记录

《关于rpc长连接与短连接的思考记录》文章总结了RPC项目中长连接和短连接的处理方式,包括RPC和HTTP的长连接与短连接的区别、TCP的保活机制、客户端与服务器的连接模式及其利弊分析,文章强调了在实... 目录rpc项目中的长连接与短连接的思考什么是rpc项目中的长连接和短连接与tcp和http的长连接短

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Servlet中配置和使用过滤器的步骤记录

《Servlet中配置和使用过滤器的步骤记录》:本文主要介绍在Servlet中配置和使用过滤器的方法,包括创建过滤器类、配置过滤器以及在Web应用中使用过滤器等步骤,文中通过代码介绍的非常详细,需... 目录创建过滤器类配置过滤器使用过滤器总结在Servlet中配置和使用过滤器主要包括创建过滤器类、配置过滤

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

python与QT联合的详细步骤记录

《python与QT联合的详细步骤记录》:本文主要介绍python与QT联合的详细步骤,文章还展示了如何在Python中调用QT的.ui文件来实现GUI界面,并介绍了多窗口的应用,文中通过代码介绍... 目录一、文章简介二、安装pyqt5三、GUI页面设计四、python的使用python文件创建pytho