首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
透彻专题
透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路
引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验
阅读更多...
一文讲透彻初学者怎么入门大语言模型(LLM)?
关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、firefly等),你只要懂部署,配置几个参数就能启动训练。甚至现在有大量云上项目,你根本不需要部署,直接上传数据,就能启动。 这我让想起来之前的算法工程师都被调侃成调参师,新
阅读更多...
转自MIT牛人林达华的 “图˙谱˙马尔可夫过程˙聚类结构 ”————经典、透彻
题目中所说到的四个词语,都是MachineLearning以及相关领域中热门的研究课题。表面看属于不同的topic,实际上则是看待同一个问题的不同角度。不少文章论述了它们之间的一些联系,让大家看到了这个世界的奇妙。 从图说起 这里面,最简单的一个概念就是“图”(Graph),它用于表示事物之间的相互联系。每个图有一批节点(Node),每个节点表示一个对象,通过一些边(Edge)把这些点连在
阅读更多...
一文讲透彻Redis 持久化
文章目录 ⛄1.RDB持久化🪂🪂1.1.执行时机🪂🪂1.2.RDB原理🪂🪂1.3.小结 ⛄2.AOF持久化🪂🪂2.1.AOF原理🪂🪂2.2.AOF配置🪂🪂2.3.AOF文件重写 ⛄3.RDB与AOF对比⛄4. 总结 欢迎来到 请回答1024 的博客 🍓🍓🍓欢迎来到 请回答1024的博客 关于博主: 我是 请回答1024,一个追求数
阅读更多...
【MYSQL锁】透彻地理解MYSQL锁
🔥作者主页:小林同学的学习笔录 🔥mysql专栏:小林同学的专栏 目录 1.锁 1.1 概述 1.2 全局锁 1.2.1 语法 1.2.1.1 加全局锁 1.2.1.2 数据备份 1.2.1.3 释放锁 1.2.1.4 特点 1.2.1.5 演示 1.3 表级锁 1.3.1 介绍 1.3.2 表锁 1.3.2.1 语法 1.3.2.2 特点
阅读更多...
ES7:异步神器async-await(我看过讲得最清晰透彻的文章)
背景: 关于异步处理,ES5的回调使我们陷入地狱,ES6的Promise使我们脱离魔障,终于、ES7的async-await带我们走向光明。今天就来学习一下 async-await。 async-await和Promise的关系 经常会看到有了 async-await、promise 还有必要学习吗、async await优于promise的几个特点,接收了这些信息后,就蒙圈了。现在才知道,
阅读更多...
ES6:Promise 用法(简洁透彻容易理解的文章)
ES6 Promise 先拉出来遛遛 复杂的概念先不讲,我们先简单粗暴地把Promise用一下,有个直观感受。那么第一个问题来了,Promise是什么玩意呢?是一个类?对象?数组?函数? 别猜了,直接打印出来看看吧,console.dir(Promise),就这么简单粗暴。 这么一看就明白了,Promise是一个构造函数,自己身上有all、reject、resolve这几个眼熟的方法,原型上
阅读更多...
殊途同归 从两个角度解释电容退耦原理(超透彻)
殊途同归 从两个角度解释电容退耦原理(超透彻) 电子工程专辑.2017-08-05订阅采用电容退耦是解决电源噪声问题的主要方法。这种方法对提高瞬态电流的响应速度,降低电源分配系统的阻抗都非常有效。对于电容退耦,很多资料中都有涉及,但是阐述的角度不同。有些是从局部电荷存储(即储能)的角度来说明,有些是从电源分配系统的阻抗的角度来说明,还有些资料的说明更为混乱,一会提储能,一会提阻抗,因此很多人在看资
阅读更多...
大模型面试准备(九):简单透彻理解MoE
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何备战、面试常考点分享等热门话题进行了深入的讨论。 合集在这里:《大模型面试宝典》(2024版) 正式发布! LLM 时代流传着一个法则:Scaling Law,即通过某种维度的指数上升可以带来指标的线性提升。 如下图所示
阅读更多...
一文教你如何透彻理解Java异常处理
一、JAVA 异常类型结构分类 在Java中Throwable是所有异常类型的基类,并且Throwable异常下一层分为两个分支,分别为Error 和 Exception,Error和 Exception都继承自基类Throwable。 其关系结构图如下: 二、Error 和 Exeption区别 1. Error Error表示不可恢复的情况,例如Java虚拟机(JVM)内存不足,
阅读更多...
透彻理解“对数”概念及其在量化交易中的意义
透视一个数学概念,目前看需要从三个层面:数学史、数学概念、数学意义。 学校教育,不教数学史,不教其实际意义,只教概念,完全是混蛋无赖做法。 对数的发展史 对数之前是等差、等比数列。 15世纪,法国数学家N.Chuquet(1445-1488)在其《算学三部》中给出双数列的对应关系。 1 2 4 8 16 32 64 128 ... # 数列一:等比数列0 1 2 3 4 5 6
阅读更多...
条款30:透彻了解inlining的里里外外
首先,inline函数只是一个申请,而不是命令。编译器可以执行你的申请,也可以拒绝。 申请有两种形式:隐式申请:在类内部定义的函数都默认为inline函数,甚至包括内部定义的友元函数。显示申请:使用inline关键字。 其次,inline函数一般要放到头文件中,因为编译器需要在程序调用内联函数时立刻将他替换,所以必须要知道这个函数的具体内容。类似的还有模板,必须在让编译器能够在调用模板的的
阅读更多...
全网最透彻HTTPS(面试常问)
每篇文章都希望你能收获到东西,这篇将带你深入 HTTPS 加解密原理,希望看完能够有这些收获: 明白 HTTPS 到底解决了什么问题 理解对称加密与非对称加密的原理和使用场景 明白 CA 机构和根证书到底起了什么作用 Why HTTPS 近几年来,各大公司都在大力推进 HTTPS 的建设。Google Chrome将非 HTTPS 的网站标注为「不安全」,苹果要求 APP 中需要使
阅读更多...
出门问问把AIGC看得很透彻
(图片来源:Pixabay) 李志飞将AIGC看得很透,他可能是行业里“最不着急”的人。 @数科星球原创 作者丨苑晶 编辑丨大兔 “几乎每一个行业,从业者都是国外的2倍,利润又是同行的1/5,让中国的创业难度提升了10倍”。李志飞的这句话适用于广大行业,也可看成AIGC行业所面临的现状。 在2023年,AIGC行业开局即炸裂。“被离职”、泛互联网从业者及创业者
阅读更多...
程序员人生之路(强烈推荐,分析的透彻!),某程序达人的人生感悟,估计没有半个甲子的时间,是绝对不可能感悟出来的。...
相对同时刚出校门同学从事其它行业而言优厚的薪水,以及不断学习更新的专业知识不仅仅让你感到生活的充实,更满足了你那不让外人知的虚荣心。在刚出校门的几年中,你经常回头看看被你落在后面的同学们,在内心怜悯他们的同时,你也会对自已天天加班的努力工作感到心里平衡:“有付出才会有回报”这句话在那几年中你说的最多,不管是对自已的朋友们还是自已的爱人。第二句最常说的话是对公司的领导:“不行我就走人!”,实际上你也
阅读更多...
透彻阐述 ExtJS 4 的MVC【有图有真相】
ExtJS是我听说了很久的一个js框架了,但是从来就没有用过,读研期间寝室里有个小哥在用,不过那时候醉心于WordPress开发,也懒得理会了。现在公司里,有个上线系统用到了这个框架中的一个TreePanel组件,整个界面上,就正中间扔了一个tree panel,而且不知道什么原因,CSS还有bug,把按钮都搞破了,弄得丑陋不堪,我于是自告奋勇,仔细调试,终于修复了那个显示上的bug,从此算是初
阅读更多...
最为透彻的utf-8、unicode详解
1、unicode的诞生 首先明白计算机能识别的都是二进制010101010这种代码,但是这些010010111人是难以看懂的,于是美国人就用ASCII码制作了一张表,里面包含从a、b、c.......@%$等128个字符差不多半个字节(1111,1111==256 0111,1111==128),为了以后扩充方便就取了一个字节,最高位是0,就这样将英文字符、字符、数字128个包含进
阅读更多...
透彻解析!济南易途java安排工作
蚂蚁金服 一面 算法题,给了长度为N的有重复元素的数组,要求输出第10大的数。 需要在2小时内完成。 二面 自我介绍 目前在部门做什么,业务简单介绍下,内部有哪些系统,作用和交互过程说下 Dubbo踩过哪些坑,怎么解决的? 对线程安全的理解 乐观锁和悲观锁的区别? 这两种锁在Java和MySQL分别是怎么实现的? 事务有哪些特性? 怎么理解原子性? HashMap为什么不
阅读更多...
一位高人隐士传授的炼精化气秘法 透彻之极!
文源成山居士 炼精化气秘法(高人隐士传授,透彻之极!) 先是阐述该法的特点和意义: 一、该法继承和发展了传统丹道功 传统气功一般不是打命门内窍,而是打会阴。如道家正宗丹道功从下丹田练起,打开阴跷库,然后走任督二脉循环。而且小周天那个督脉走的不是外面,而是走的脊柱里面,这样就把先天气的信息量直接通过督脉上升到头部。头
阅读更多...
大模型面试面经:简单透彻理解MoE
LLM 时代流传着一个法则:Scaling Law,即通过某种维度的指数上升可以带来指标的线性提升。 如下图所示,在 Compute、Data、Parameter 三个维度上的指数上升可以带来在 test loss 上的线性下降。 MoE(Mixture of Experts,混合专家模型)从本质上来说就是一种高效的 scaling 技术,用较少的 compute 实现更大的模型规模,从而
阅读更多...
重磅好文透彻理解,异构图上 Node 分类理论与DGL源码实战
重磅好文透彻理解,异构图上 Node 分类理论与DGL源码实战 文章源码下载地址:点我下载http://inf.zhihang.info/resources/pay/7692.html 书接上文,关注过作者历史文章的读者都知道,图上机器学习/深度学习系列文章 从 一文揭开图机器学习的面纱,你确定不来看看吗 开始,已经陆续和大家一起了解了 同构图上的链接预测、节点分类与回归、边分类与回归 等
阅读更多...
太透彻了:约瑟夫环的三种解法
????????关注后回复 “进群” ,拉你进程序员交流群???????? 作者丨bigsai 来源丨bigsai 前言 约瑟夫环问题是算法中相当经典的一个问题,其问题理解是相当容易的,并且问题描述有非常多的版本,并且约瑟夫环问题还有很多变形,这篇约瑟夫问题的讲解,一定可以带你理解通通! 什么是约瑟夫环问题? 约瑟夫环问题在不同平台被"优化"描述的不一样,例如在牛客剑指offer叫孩子们的游戏,
阅读更多...
透彻理解 group by 子句
怎样彻底理解group by子句 group by 表示分组的意思 把相同的放一组不相同的放一起 那么他就有统计的作用了!那么应该怎么用呢! 例子: select sex ,count(*) from student group by sex; -- 这里表示的是将student这个表中性别相同的放一组 -- 并且将他们的数量统计出来 当然 你可以在后面再加其他的选项例如 s
阅读更多...
Linux探秘之旅:透彻理解路径、命令与系统概念
目录 如何远程连接 远程登录简明指南 linux区别 1.严格区分大小写 2.linux的命令返回结果判断 3.如何查看网络信息 4.关于后缀名(Linux不关心文件后缀) 4.1 需要记忆的后缀 5.echo命令 6.linux一切皆文件 6.1比如磁盘的文件 6.2可执行文件 7.命令小结 8.linux的硬盘,必须要挂载后才能使用(挂载的概念) 9.学习linu
阅读更多...
世界上最浪费时间的三件事。很透彻。
我问你,世界上最浪费时间的是什么事? 人人网?偷菜?魔兽世界? 不是,尽管它们排名也很靠前。 世界上最浪费时间的是三个单词:WORRY, BLAME, & JUDGEMENT. 第一位:WORRY,担忧。 让我们感觉到担忧的事情很多,年纪越大,越是如此。然而,总体来说,让我们担忧的不过2类事情: 1. 我们准备不足的事情,如考试,如演出,如工作机会……我们担忧这些事
阅读更多...
JVM-透彻理解字节码以及指令
一、字节码与指令概述 package ch13_bytecode;public class HelloWorld {public static void main(String[] args) {System.out.println("hello world");}} 生成字节码: cafe babe 0000 0031 0022 0a00 0600 1409
阅读更多...