law专题

LLM的范式转移:RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始,整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道,Strawberry 就是之前的 Q-star,其合成数据的方法会大幅提升 LLM 的智能推理能力,尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上,帮助 OpenAI 新一代 Orion。 OpenA

【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law

相关博客 【自然语言处理】【Scaling Law】Observational Scaling Laws:跨不同模型构建Scaling Law 【自然语言处理】【Scaling Law】语言模型物理学 第3.3部分:知识容量Scaling Laws 【自然语言处理】Transformer中的一种线性特征 【自然语言处理】【大模型】DeepSeek-V2论文解析 【自然语言处理】【大模型】BitN

反着用scaling law验证数据:群聊场景指代消歧

本文作者:白牛 我们之前开源了 LLM 群聊助手茴香豆(以下简称豆哥),它的特点是: 设计了一套拒答 pipeline,实用于群聊场景。能够有效抵抗各种文本攻击、过滤无关话题,累计面对 openmmlab 数千用户运行半年( 17 个群、7w 条群消息)。这个过程确认了 text2vec 模型更适合反着用工业级开源。除算法 pipeline 外,还实现对应的 android、web ser

Coursera: An Introduction to American Law 学习笔记 Week 03: Property Law

An Introduction to American Law 本文是 https://www.coursera.org/programs/career-training-for-nevadans-k7yhc/learn/american-law 这门课的学习笔记。 文章目录 An Introduction to American LawInstructors Week 03: P

Coursera: An Introduction to American Law 学习笔记 Week 02: Contract Law

An Introduction to American Law 本文是 https://www.coursera.org/programs/career-training-for-nevadans-k7yhc/learn/american-law 这门课的学习笔记。 文章目录 An Introduction to American LawInstructors Week 02: C

LLM漫谈(六)| 复旦MOSS提出数据配比scaling law

大型语言模型的预训练数据包括多个领域(例如,网络文本、学术论文、代码),其混合比例对结果模型的能力有着至关重要的影响。现有方法更多依赖于启发式或者定性策略来调整比例,MOSS团队提出了混合比例函数形式的定量预测方法,称为数据混合定律(data mixing laws)。 实验结果表明,该方法能够有效地优化RedPajama数据集上1B模型的训练混合比例,使其在100B个token的训练中

人工智能论文GPT-3(1):2020.5 Language Models are Few-Shot Learners;摘要;引言;scaling-law

摘要 近期的工作表明,在大量文本语料库上进行预训练,然后针对特定任务进行微调,可以在许多NLP任务和基准测试中取得实质性进展。虽然这种方法在架构上通常是与任务无关的,但仍然需要包含数千或数万示例的针对特定任务的微调数据集。相比之下,人类通常只需要几个示例或简单的说明就能执行新的语言任务——这是当前NLP系统仍难以做到的。在这里,我们展示了扩大语言模型规模可以极大地提高与任务无关、少量样本的性能,

The Law of Leaky Abstractions 抽象漏洞定理

我们每天都在使用的Internet里有一个小魔法。就是internet基础协议里的TCP协议。 TCP传输数据是可靠的。具体说来:你通过TCP传输数据,那么,数据是肯定会传输成功的并且顺序不会乱也不会错误。 我们使用TCP协议来获取网页、发送电子邮件。就连骗人钱财的邮件它都准确的送到。好玩吧。 TCP的反面是不可靠的传输协议,名字叫IP。没有人会打包票数据一定送达,可能在

告别微软,姜大昕带领这支精英团队攀登Scaling Law,万亿参数模型已有预览版

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 发布在https://it.weoknow.com 更多资源欢迎关注   攀登 Scaling Law,打造万亿参数大模型,前微软 NLP 大牛姜大昕披露创业路线图。 前段时间,OpenAI 科学家

数据审计 -本福德定律 Benford‘s law (sample database classicmodels _No.6)

数据审计 -本福德定律 Benford’s law 准备工作,可以去下载 classicmodels 数据库资源如下 [ 点击:classicmodels] 也可以去我的博客资源下载 文章目录 数据审计 -本福德定律 Benford's law 前言一、什么是 本福德定律?二、数学公式三、应用领域四、应用(看看是否有 会计、审计和欺诈检测。)总结 前言 假设 clas

迪米特法则(Law of Demeter)与领域模型行为

在领域模型的行为设计中我们提到 2013-04-22 15:37 "@banq "的内容 我们把A对象自身固有行为看成是A的一种能力,而把需要依赖其他对象的方法称为交互行为。哪些属于A的自身方法?哪些属于交互方法?设计思路和方法是如何考虑的? ... 那么什么是对象的固有行为?我们认为是那些保证该对象逻辑一致性的行为,称为对象的基本职责,保证自己的存在。 迪米特法则(Law of De

Computing beyond Moore’s Law(2015)

Computing beyond Moore’s Law(2015) 作者 John M. Shalf, Lawrence Berkeley National Laboratory Robert Leland, Sandia National Laboratories 摩尔定律:每18个月,晶体管数量翻一番。 Robert Dennard scaling:通过缩小晶体管的尺寸,使得单位面积上的

Re56:读论文 A Brief History of the Changing Roles of Case Prediction in AI and Law

诸神缄默不语-个人CSDN博文目录 诸神缄默不语的论文阅读笔记和分类 论文名称:A Brief History of the Changing Roles of Case Prediction in AI and Law 论文下载地址:https://journals.latrobe.edu.au/index.php/law-in-context/article/view/88 本文是201

Java设计模式之迪米特法则(Law of Demeter, LoD)

2019独角兽企业重金招聘Python工程师标准>>>     迪米特法则(Law of Demeter),Demeter是古希腊神话中的农业、谷物和丰收的女神,奥林匹斯十二主神之一。它的名字源于迪米特计划, 该项目是为纪念Demeter,“distribution-mother”和希腊农业女神而命名的,以表示自下而上的编程哲学。     迪米特法具体含义可以从以下几句话中理解: Eac