cmu专题

20 项任务全面碾压 BERT,CMU 全新 XLNet 模型屠榜,代码已开源!

BERT 带来的影响还未平复,CMU 与谷歌大脑提出的 XLNet 在 20 个任务上超过了 BERT 的表现,并在 18 个任务上取得了当前最佳效果。令人激动的是,目前 XLNet 已经开放了训练代码和大型预训练模型,这又可以玩一阵了~ 转载来源 公众号:机器之心 “ 阅读本文大概需要 5 分钟。 ” 2018 年,谷歌发布了基于双向 Transformer 的大规模预训练语言模型 B

CMU 15-445 Project 2 B+ Tree 技术总结

首先是教科书的伪代码 感觉基本都要按这个来写,不然(可能)写不出来的,PPT 的讲解也不够详细。Project 的代码结构的确是根据这个伪代码来设计的。不过我感觉这种写法的伪代码有点难看。 并发的要点 基本做 lab 的过程就是全程对着上面两个 guideline 来操作。 然后是我的一些技术总结踩坑的地方(可能会没有帮助 )

NLP能否像人脑一样工作?CMU、MIT三篇论文详解机器和大脑范畴下NLP的关系

本文转载自公众号机器之心 作为计算机科学领域与人工智能领域的重要研究课题,自然语言处理已经在各领域展开了广泛的研究与探讨。随着研究的深入,一些学者开始探讨机器中的自然语言处理和大脑中的自然语言处理是否存在着一些联系,进而延伸至神经科学与 BERT 等 NLP 预训练方法的交叉点。本文选取 CMU Wehbe 研究小组(2 篇)和 MIT Roger P. Levy 教授组(1 篇)的三篇文章,对

CVPR2018 | CMU谷歌Spotlight论文:超越卷积的视觉推理框架

人类在看到图像时可以进行合理的推理与预测,而目前的神经网络系统却还难以做到。近日,来自卡耐基梅隆大学(CMU)的陈鑫磊(现 Facbook 研究科学家)、Abhinav Gupta,谷歌的李佳、李飞飞等人提出了一种新型推理框架,其探索空间和语义关系的推理性能大大超过了普通卷积神经网络。目前该工作已被评为 CVPR 2018 大会 Spotlight 论文。 近年来,我们在图像分类 [ 16

图挖掘与多关系学习:工具与应用,亚马逊与CMU-WWW2021教程(附ppt)

来源:专知本文附ppt,建议阅读5分钟给出一个大的图,比如谁买什么,哪个节点是最重要的节点?我们如何找到社区? 给出一个大的图,比如谁买什么,哪个节点是最重要的节点?我们如何找到社区?如果节点有属性(比如,性别,或环保,或欺诈者),并且我们知道一些节点的利益值,我们如何猜测其余节点的属性?图自然地表示了一系列过程,包括社交网络或通信网络上的人之间的交互、万维网上网页之间的链接、客户和产品之

CMU 10-414/714: Deep Learning Systems --hw3

实现功能 在ndarray.py文件中完成一些python array操作 我们实现的NDArray底层存储就是一个一维向量,只不过会有一些额外的属性(如shape、strides)来表明这个flat array在维度上的分布。底层运算(如加法、矩阵乘法)都是用C++写的,以便达到理论上的最高速度。但像转置、broadcasting、矩阵求子阵等操作都可以在python框架里通过简单的调整arr

大模型机器人的进击时刻:从RoboFlamingo、OK-Robot到CMU 18万机器人、Digit、FMB

这两天,我在朋友圈说道,本质上来讲,斯坦福mobile aloha就是大模型机器人领域里的缩略版ChatGPT时刻,虽然aloha本身并没有像ChatGPT那么强大(毕竟才三人团队),但会让大模型机器人成为今2024年最大的爆发点,为何这么讲呢? 一方面,ChatGPT对于各大公司最大的意义是,让大家看到了在大模型上投入的希望,而mobile aloha则让大家看到了在大模型机器人上投入的希望,

碾压LoRA!Meta CMU | 提出高效大模型微调方法:GaLore,内存可减少63.3%

来源: AINLPer公众号(每日干货分享!!) 编辑: ShuYini 校稿: ShuYini 时间: 2024-3-13 引言 大模型训练通常会遇到内存资源的限制。目前常用的内存减少方法低秩适应(LoRA),通过引入低秩(low-rank)适配器来更新模型的权重,而不是直接更新整个权重矩阵。然而,这种方法在预训练和微调阶段通常表现不佳,为此,本文作者提出了梯度低秩映射(Gradien

CMU 10-414/714: Deep Learning Systems --hw0

hw0 宏观上的步骤: softmax loss: 实现softmax loss代码 概念 softmax就是将结果映射到0~1之间,且所有结果相加为1(概率形式)cross-entropy loss就是计算 p ( x ) log ⁡ q ( x ) p(x)\log {q(x)} p(x)logq(x),此值可用于衡量实际输出与期望输出的距离,进而衡量预测模型与真实模型之间的差距,值越

CMU和ETH联合研发了一个名为 「敏捷但安全」的新框架,为四足机器人在复杂环境中实现高速运动提供了解决方案

在高速机器人运动领域,实现同时兼顾速度和安全一直是一大挑战。但现在,卡内基梅隆大学(CMU)和苏黎世联邦理工学院(ETH)的研究团队带来了突破性进展。他们开发的新型四足机器人算法,不仅能在复杂环境中高速行进,还能巧妙避开障碍,真正做到了「敏捷而安全」。 论文地址: https://arxiv.org/pdf/2401.17583.pdf 在 ABS 的加持下,机器狗在各种场景下都展现出了惊

微软 CMU - Tag-LLM:将通用大语言模型改用于专业领域

文章目录 一、前言二、主要内容三、总结 🍉 CSDN 叶庭云:https://yetingyun.blog.csdn.net/ 一、前言 论文地址:https://arxiv.org/abs/2402.05140 Github 地址:https://github.com/sjunhongshen/Tag-LLM 大语言模型(Large Language Model

CMU团队的terrainAnalysis地形分析代码笔记

1.源码连接: GitHub - HongbiaoZ/autonomous_exploration_development_environment: Leveraging system development and robot deployment for ground-based autonomous navigation and exploration. 2.参考资料: CMU团队开源

Introduction CMU最优控制16-745超详细学习笔记

CMU最优控制16-745超详细学习笔记 背景 跌跌撞撞入坑Optimization-based Motion Planning和Optimal Control已经大半年啦,这大半年来迷迷糊糊看了不少相关资料和论文,想借这个机会来整理一下相关的内容,也算是给自己写论文理清一下思路。 去年年底做一个移动机械臂移动操作mobile manipulation课题看了ETH RSL开源框架OCS2(

【CMU-自主导航与规划】Autonomous Exploration Development Environment 配置与运行

官方文档:https://www.cmu-exploration.com/ 一、安装与配置: 适用版本: Ubuntu 18.04 ROS Melodic and Ubuntu 20.04 with ROS Noetic. 如果使用 Ubuntu 22.04 with ROS2 Humble, 则需要配置ROS2【https://drive.google.com/file/d/1a01RSrP

英飞凌TC3xx之一起认识GTM(九)GTM相关知识简述及应用实例(CMU,CCM,TBU,MON)

英飞凌TC3xx之一起认识GTM(九)GTM相关知识简述及应用实例(CMU,CCM,TBU,MON) 1 时钟管理单元(CMU)2 集群配置模块(CCM)3 时基单元(TBU)4 监控单元(MON)5 总结 由前文的各篇内容,开发者已经知道如何使用GTM的大部分功能,在这些功能中,都需要一个信息就是fGTM 的数据,我们在前文的各应用中假设该值是100MHz,但是对于TC3xx系

涂鸦秒变动画,CMU 中国本科生让画动起来(附代码 Demo)

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 转自量子位,作者郭一璞 凡人的世界,绘画就是静态的。但在一个神秘的计算机世界,一切都不一样,不信你看。 画一个独角兽,然后轻轻一点。 独角兽就 “活了”,奔跑跳动、跃然纸上。 给它取个名,再轻轻一点 —— 拥有姓名的独角兽,就从纸面进入一个三维世界,开始不知疲倦的翻越,一座座山丘…… 这个世界里,还生活着

今年英语高考,CMU用重构预训练交出134高分,大幅超越GPT3!

视学算法报道 机器之心编辑部 本文提出的重构预训练(reStructured Pre-training,RST),不仅在各种 NLP 任务上表现亮眼,在高考英语上,也交出了一份满意的成绩。 我们存储数据的方式正在发生变化,从生物神经网络到人工神经网络,其实最常见的情况是使用大脑来存储数据。随着当今可用数据的不断增长,人们寻求用不同的外部设备存储数据,如硬盘驱动器或云存储。随着深度学习技术的兴

【CMU 15-445】Lecture 12: Query Execution I 学习笔记

Query Execution I Processing ModelsIterator ModelMaterialization ModelVectorization Model Access MethodsSequential ScanIndex Scan Modification QueriesHalloween Problem 本节课主要介绍SQL语句执行的相关机制。

【CMU 15-445】Lecture 10: Sorting Aggregations Algorithms 学习笔记

Sorting & Aggregations Algorithms SortingTop-N Heap SortExternal Merge Sort2-WAY External Merge SortK-WAY External Merge SortDouble Buffering Optimization AggregationsSortingHashing 本节课主要介绍的是

【CMU 15-445】Lecture 11: Joins Algorithms 学习笔记

Joins Algorithms Nested Loop JoinNaive Nested Loop JoinBLock Nested Loop JoinIndex Nested Loop Join Sort-Merge JoinHash JoinBasic Hash JoinPartitioned Hash Join Conclusion 本节课主要介绍的是数据库系统中的一些Joi

CMU-15445 2021 Project 3-Query Exection (请求执行)

CMU-15445 2021 Project 3-Query Exection (请求执行) 先贴结果图和LeaderBoard: CMU禁止公开源代码哦~, 有问题欢迎私聊, 评论或者加群: 484589324交流~ 这是我受益最大的一个Project, 本来还以为按照惯例实现三个算子即可, 结果只有一道题, 要求实现全部算子hh, 但是做完之后可以理解数据库增删改查分组筛选等所有操

TinyMPC - CMU (卡耐基梅隆大学)开源的机器人 MPC 控制器

系列文章目录 CasADi - 最优控制开源 Python/MATLAB 库 文章目录 系列文章目录前言一、机器人硬件对比1.1 Teensy 上的微控制器基准测试1.2 机器人硬件1.3 BibTeX 二、求解器三、功能(预期)3.1 高效3.2 鲁棒3.3 可嵌入式3.4 最小依赖性3.5 高效热启动3.6 接口 四、在 Ubuntu 安装4.1 在终端克隆此 repo4.2 导

从Intel Cyclone10GX TransceiverPHY 高速收发器认识ATX PLL、FPLL、CMU PLL等PLL

文章目录 前言一、pandas是什么?二、使用步骤 1.引入库2.读入数据总结 前言         在使用Intel Cyclone10GX TransceiverPHY的过程中发现这个IP还是比较复杂的,特别是时钟系统,提到了多种PLL:ATX PLL、FPLL、CMU PLL,这里进行一下扩展学习。 关于TransceiverPHY        Intel Cycl

CMU 15-213 Introduction to Computer Systems学习笔记(19) Dynamic Memory Allocation: Advanced Concepts

这节课主要是学习一些更复杂的技术,研究不同数据结构去存储 free list 我们要看implict allocators,因此我们会研究垃圾回收是怎么工作的。老师说一旦你开始了动态的分配存储,事情变坏的会很快。 Explicit Free Lists  这里说的我们维护的block不是一整块,而是自由分配那些free block,因此我们存储的是forward/back pointer

卡内基梅隆 计算机音乐,包揽大牛|CMU Music tech也来了!!大牛横扫了!!

原标题:包揽大牛|CMU Music tech也来了!!大牛横扫了!! Nuts Congratulations Nuts北大学员横扫了! 继QueenMary博士/Gatech/NYU/Mcgill硕士后 ✨最dream的顶尖CMU music tech拿下✨ Offer CMU 卡内基·梅隆大学(Carnegie Mellon University),简称CMU,坐落在美国宾夕法尼亚州的

CMU凸优化-梯度下降

CMU凸优化-梯度下降 1 梯度下降算法2 梯度下降步长选择方法3 梯度下降算法收敛性4 Pros and Cons 1 梯度下降算法 在机器学习篇章的开始机器学习-梯度下降算法,我对梯度下降算法的推导证明以及应用都做了详细介绍,这里就不在做过多推导,直接给出梯度下降的计算公式: ( x ( k ) = x ( k − 1 ) − t k ∇ f ( x ( k − 1 ) )