law专题

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。 OpenA

【自然语言处理】【Scaling Law】Observational Scaling Laws：跨不同模型构建Scaling Law

相关博客【自然语言处理】【Scaling Law】Observational Scaling Laws：跨不同模型构建Scaling Law 【自然语言处理】【Scaling Law】语言模型物理学第3.3部分：知识容量Scaling Laws 【自然语言处理】Transformer中的一种线性特征【自然语言处理】【大模型】DeepSeek-V2论文解析【自然语言处理】【大模型】BitN

反着用scaling law验证数据：群聊场景指代消歧

本文作者：白牛我们之前开源了 LLM 群聊助手茴香豆（以下简称豆哥），它的特点是：设计了一套拒答 pipeline，实用于群聊场景。能够有效抵抗各种文本攻击、过滤无关话题，累计面对 openmmlab 数千用户运行半年（ 17 个群、7w 条群消息）。这个过程确认了 text2vec 模型更适合反着用工业级开源。除算法 pipeline 外，还实现对应的 android、web ser

Coursera: An Introduction to American Law 学习笔记 Week 03: Property Law

An Introduction to American Law 本文是 https://www.coursera.org/programs/career-training-for-nevadans-k7yhc/learn/american-law 这门课的学习笔记。文章目录 An Introduction to American LawInstructors Week 03: P

Coursera: An Introduction to American Law 学习笔记 Week 02: Contract Law

An Introduction to American Law 本文是 https://www.coursera.org/programs/career-training-for-nevadans-k7yhc/learn/american-law 这门课的学习笔记。文章目录 An Introduction to American LawInstructors Week 02: C

LLM漫谈（六）| 复旦MOSS提出数据配比scaling law

大型语言模型的预训练数据包括多个领域（例如，网络文本、学术论文、代码），其混合比例对结果模型的能力有着至关重要的影响。现有方法更多依赖于启发式或者定性策略来调整比例，MOSS团队提出了混合比例函数形式的定量预测方法，称为数据混合定律（data mixing laws）。实验结果表明，该方法能够有效地优化RedPajama数据集上1B模型的训练混合比例，使其在100B个token的训练中

人工智能论文GPT-3（1）：2020.5 Language Models are Few-Shot Learners；摘要；引言；scaling-law

摘要近期的工作表明，在大量文本语料库上进行预训练，然后针对特定任务进行微调，可以在许多NLP任务和基准测试中取得实质性进展。虽然这种方法在架构上通常是与任务无关的，但仍然需要包含数千或数万示例的针对特定任务的微调数据集。相比之下，人类通常只需要几个示例或简单的说明就能执行新的语言任务——这是当前NLP系统仍难以做到的。在这里，我们展示了扩大语言模型规模可以极大地提高与任务无关、少量样本的性能，

The Law of Leaky Abstractions 抽象漏洞定理

我们每天都在使用的Internet里有一个小魔法。就是internet基础协议里的TCP协议。 TCP传输数据是可靠的。具体说来：你通过TCP传输数据，那么，数据是肯定会传输成功的并且顺序不会乱也不会错误。我们使用TCP协议来获取网页、发送电子邮件。就连骗人钱财的邮件它都准确的送到。好玩吧。 TCP的反面是不可靠的传输协议，名字叫IP。没有人会打包票数据一定送达，可能在

告别微软，姜大昕带领这支精英团队攀登Scaling Law，万亿参数模型已有预览版

ChatGPT狂飙160天，世界已经不是之前的样子。新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源发布在https://it.weoknow.com 更多资源欢迎关注攀登 Scaling Law，打造万亿参数大模型，前微软 NLP 大牛姜大昕披露创业路线图。前段时间，OpenAI 科学家

数据审计 -本福德定律 Benford‘s law （sample database classicmodels _No.6）

数据审计 -本福德定律 Benford’s law 准备工作，可以去下载 classicmodels 数据库资源如下 [ 点击：classicmodels] 也可以去我的博客资源下载文章目录数据审计 -本福德定律 Benford's law 前言一、什么是本福德定律？二、数学公式三、应用领域四、应用(看看是否有会计、审计和欺诈检测。)总结前言假设 clas

迪米特法则(Law of Demeter)与领域模型行为

在领域模型的行为设计中我们提到 2013-04-22 15:37 "@banq "的内容我们把A对象自身固有行为看成是A的一种能力，而把需要依赖其他对象的方法称为交互行为。哪些属于A的自身方法？哪些属于交互方法？设计思路和方法是如何考虑的？ ... 那么什么是对象的固有行为？我们认为是那些保证该对象逻辑一致性的行为，称为对象的基本职责，保证自己的存在。迪米特法则(Law of De

Computing beyond Moore’s Law（2015）

Computing beyond Moore’s Law（2015）作者 John M. Shalf, Lawrence Berkeley National Laboratory Robert Leland, Sandia National Laboratories 摩尔定律：每18个月，晶体管数量翻一番。 Robert Dennard scaling：通过缩小晶体管的尺寸，使得单位面积上的

Re56：读论文 A Brief History of the Changing Roles of Case Prediction in AI and Law

诸神缄默不语-个人CSDN博文目录诸神缄默不语的论文阅读笔记和分类论文名称：A Brief History of the Changing Roles of Case Prediction in AI and Law 论文下载地址：https://journals.latrobe.edu.au/index.php/law-in-context/article/view/88 本文是201

Java设计模式之迪米特法则(Law of Demeter, LoD)

2019独角兽企业重金招聘Python工程师标准>>> 迪米特法则（Law of Demeter），Demeter是古希腊神话中的农业、谷物和丰收的女神，奥林匹斯十二主神之一。它的名字源于迪米特计划，该项目是为纪念Demeter，“distribution-mother”和希腊农业女神而命名的，以表示自下而上的编程哲学。迪米特法具体含义可以从以下几句话中理解： Eac