七月专题

8月31日微语报,星期六,农历七月廿八

8月31日微语报,星期六,农历七月廿八,周末愉快! 一份微语报,众览天下事! 1、川渝地区正经历同期罕见高温,与高压天气系统和地形有关。 2、全国超六成GDP增量产自59城,深圳超京沪居“强城”之首。 3、教育部:今年 “特岗计划”教师工资性补助每人每年增加3600元。 4、北京常住人口规模连续六年下降。 5、北京市教委:秋季学期起义务教育学校学生课间10分钟延长至15分钟。

8月29日微语报,星期四,农历七月廿六

8月29日微语报,星期四,农历七月廿六,工作愉快,生活喜乐! 一份微语报,众览天下事! 1、免税店政策大升级!27家市内免税店即将亮相,免税消费新时代来临! 2、合租“卡年龄”:济南多家中介明确“50岁以上不能合租”。 3、抖音新规严打“假揭黑真牟利”,禁止违规蹭热不当获利。 4、国家体育总局原副局长杜兆才,被控收受财物4341万余元。 5、海浪橙色预警:超强台风“珊珊”将给

刷题:《七月在线》机器学习笔试部分(一)

1. 以下哪种方法属于判别式模型(discriminative model)(D ) A:隐马模型(HMM);B:朴素贝叶斯;C:LDA;D:支持向量机 解: 判别式模型(Discriminative Model)是直接对条件概率p(y|x;θ)建模。常见的判别式模型有 线性回归模型、线性判别分析、支持向量机SVM、神经网络等。   生成式模型(Generative Model)则会对x和

【七月】再见,不负遇见

Happiness can be found, even in the darkest of times, if one only remembers to turn on the light! 即使在最黑暗的时刻,幸福也有迹可循,只要你记得打开一盏灯。 If life is divided into two episodes, the first is “hesitance-free”, w

8月25日微语报,星期日,农历七月廿二

8月25日微语报,星期日,农历七月廿二,周末愉快! 一份微语报,众览天下事! 1、两部门预拨5000万元中央自然灾害救灾资金支持辽宁防汛救灾。 2、重达2492克拉!博茨瓦纳发现世界第二大钻石。 3、支架出厂价5万,卖给医院12万!被国家医保局公开问询后,心脉医疗公告:价格调整为7万元左右或以下。 4、南京警方破获两个恶意倒卖门票“黄牛”团伙,多名“黄牛”被抓。 5、高温橙色

康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)

前言 自从我司于23年7月开始涉足论文审稿领域之后「截止到24年6月份,我司的七月论文审稿GPT已经迭代到了第五版,详见此文的8.1 七月论文审稿GPT(从第1版到第5版)」,在业界的影响力越来越大,所以身边朋友如发现业界有相似的工作,一般都会第一时间发给我,比如本部分要介绍的康奈尔大学的reviewer2 当然,我自己也会各种看类似工作的论文,毕竟同行之间的工作一定会互相借鉴的,我们会学他们

图灵七月书讯【Cassandra权威指南将在7月末上市】

重点图书推荐 Cassandra权威指南——本书是一本广受好评的Cassandra 图书。与传统的关系型数据库不同,Cassandra 是一种开源的分布式存储系统。书中介绍了它无中心架构、高可用、无缝扩展等引入注目的特点,讲述了如何安装、配置Cassandra 及如何在其上运行实例。 [样章试读]   Flash游戏编程基础教程——本本书是Flash 游戏设计方面的入门级图书。全

推荐给程序员的书:七月图书推荐

七月,图灵原创书相继出炉,并在网店的排行榜上荣登前三甲,图灵原创书的作者皆是各社区的领军人物,有着相当深厚的技术功底,这是图灵原创书在《结网》后的一个跨越。 本月推荐,是本版书与外版书相结合,推荐给读者最前沿的技术新书。 新书预告 《Node.js开发指南》 国内第一本本土Node书 内容简介: Node.js是一种新兴的开源技术,它将JavaScript从Web浏览器

七月SSL行业新闻回顾

大事件一:被泄露的私钥和基于假私钥进行的撤回 上个月,我们报告说Spotify和Cisco在应用程序中捆绑了有效证书的私钥。这些证书将根据基准要求被撤销,但应用程序不是泄露私钥的唯一来源。Koen Rouwhorst发现了各种属于GitHub存储库中的有效证书的私钥。你甚至能通过标准文件名(如server.key)在相应的网站上下载这些密钥。根据规定,所有被泄露的私钥都必须在24小时内由证书

七月论文审稿GPT第4.5版:通过15K条paper-review数据微调Llama2 70B(含各种坑)

前言 当我们3月下旬微调完Mixtral 8x7B之后(更多详见:七月论文大模型:含论文的审稿、阅读、写作、修订 ),下一个想微调的就是llama2 70B 因为之前积攒了不少微调代码和微调经验,所以3月底apple便通过5K的paper-review数据集成功微调llama2 70B,但过程中也费了不少劲考虑到最后的成功固然令人欣喜,但真正让一个人或一个团队快速涨经验的还是那些在训练过程中走

七月审稿之提升模型效果的三大要素:prompt、数据质量、训练策略(附PeerRead)

前言 我带队的整个大模型项目团队超过40人了,分六个项目组,每个项目组都是全职带兼职,且都会每周确定任务/目标/计划,然后各项目组各自做任务拆解,有时同组内任务多时 则2-4人一组 方便并行和讨论,每周文档记录当周工作内容,平时群内随时讨论 1-2周一次语音会,最后通过相关课程不断招募各项目组成员 ​​​ 比如在我司审稿项目之前的工作中,我们依次想尽各种办法微调以下模型(我之外,包括且不限于阿

七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b,对GPT4胜率超过80%

模型训练 Mixtral-8x7b地址:魔搭社区 GitHub: hiyouga/LLaMA-Factory: Unify Efficient Fine-tuning of 100+ LLMs (github.com) 环境配置 git clone https://github.com/hiyouga/LLaMA-Factory.gitconda create -n llama_fa

七月论文审稿GPT第4版:通过paper-review数据集微调Mixtral-8x7b

模型训练 Mixtral-8x7b地址:魔搭社区 GitHub: hiyouga/LLaMA-Factory: Unify Efficient Fine-tuning of 100+ LLMs (github.com) 环境配置 git clone https://github.com/hiyouga/LLaMA-Factory.gitconda create -n llama_fa

[英语歌曲]七月四日:4th of July

我听之我见:近乎痴狂地去爱一个人,有多少人有过这样的经历?或许有人认为这只是傻,全是痴,嗤之以鼻,一笑而过。然而,不身处其中之人如何能解其中味?喜也好,悲也罢,敢这样不计得失地去爱的人都是有大勇气的。如果一生能有一次这么刻骨铭心的爱,便不枉此生了吧! Download 英文歌词 4th of July

七月论文审稿GPT第3.1版和第3.2版:通过paper-review数据集分别微调Mistral、gemma

前言 我司第二项目组一直在迭代论文审稿GPT(对应的第二项目组成员除我之外,包括:阿荀、阿李、鸿飞、文弱等人),比如 七月论文审稿GPT第1版:通过3万多篇paper和10多万的review数据微调RWKV七月论文审稿GPT第2版:用一万多条paper-review数据集微调LLaMA2 7B最终反超GPT4七月论文审稿GPT第2.5和第3版:分别微调GPT3.5、Llama2 13B以扩大对

夏暑七月云南行

七月里远赴云南,入住腾冲曲石原乡。新闻播报中到处都是暑热和水灾,云南腾冲却是一片荫凉,到处绿树婆娑,鲜花烂漫。住进雅居乐山景洋房,不管是泰式别墅“绿野牧歌”,还是景观洋房“山居高黎”,头顶一片蔚蓝,身畔无尽碧绿,自然风光与民俗文化完美融合,享受着原生山水相融的天然滋养,生活好不惬意。暑热难耐的季节投入腾冲原乡的怀抱中,感觉进入到让人向往的世外桃源。     云南素有“彩云之南”的美称,途

七月23日

七月23日,天气晴朗,万物可爱 今天开始,学习我们班长,写一写自己的感悟。2日一更`。 `

学习进行时--七月.net

5月、6月是我挺迷惘的时期,公司里一直待我很好的上司离职,更促使我要明确自己未来的发展方向,接触了SAP/Oracle DBA,还想到了要继续读书,考研,做大学教师,也在想到底选哪个方向,反正就是无头苍蝇到底乱撞,搜索了大堆的资料,真的很难讲。 对数据挖掘、商务智能挺感兴趣的,不管是oracle/sap都是有对应的方向的。就算是再去读书,那也是研究方向呀。也无所谓矛盾了。 其实做教师一直对我蛮

七月论文审稿GPT第2.5和第3版:分别微调GPT3.5、Llama2 13B以扩大对GPT4的优势

前言 自去年7月份我带队成立大模型项目团队以来,我司至今已有5个项目组,其中 第一个项目组的AIGC模特生成系统已经上线在七月官网第二项目组的论文审稿GPT则将在今年3 4月份对外上线发布第三项目组的RAG知识库问答第1版则在春节之前已就绪至于第四、第五项目组的大模型机器人、Agent则正在迭代中 所有项目均为会对外上线发布的商用项目,而论文审稿GPT至今在过去的半年已经迭代两个版本,其中第

七月论文审稿GPT第2版:用一万多条paper-review数据集微调LLaMA2 7B最终反超GPT4

目录 前言 第一部分 第二版对论文PDF数据的解析 1.1 两大PDF解析器:nougat VS ScienceBeam 1.1.1 Meta nougat 1.1.2 ScienceBeam 1.2 对2.6万篇paper的解析 1.2.1 nougat的解析过程 1.2.2 ScienceBeam的解析结果 第二部分 第二版对paper和review数据的处理 2.1 第一

七月算法(julyedu.com)5 月深度学习班学习笔记-第一节数学基础

关于数学在机器学习中的重要性: 程博是这样说的------ 不错,数学是算法的基础,没有好的数学根基是不能触碰到算法的根源,但是我认为一般非数学专业的人适可而止,不要太迷恋数学,我们大部分人,了解微积分、矩阵等就可以了 1.梯度 了解机器学习的同学肯定不陌生这个名词,认为很高大上。其实没那么深奥。归根到底还是求导。。。。 多元求偏导就被定义为梯度(如上)。 对梯

七月论文审稿GPT第2.5和第3版:分别微调GPT3.5、Llama2 13B以扩大对GPT4的优势

前言 自去年7月份我带队成立大模型项目团队以来,我司至今已有5个项目组,其中 第一个项目组的AIGC模特生成系统已经上线在七月官网第二项目组的论文审稿GPT则将在今年3 4月份对外上线发布第三项目组的RAG知识库问答第1版则在春节之前已就绪至于第四、第五项目组的大模型机器人、Agent则正在迭代中 所有项目均为会对外上线发布的商用项目,而论文审稿GPT至今在过去的半年已经迭代两个版本,其中第

七月论文审稿GPT第2.5版:微调GPT3.5 turbo 16K和llama2 13B以扩大对GPT4的优势

前言 自去年7月份我带队成立大模型项目团队以来,我司至今已有5个项目组,其中 第一个项目组的AIGC模特生成系统已经上线在七月官网第二项目组的论文审稿GPT则将在今年3 4月份对外上线发布第三项目组的RAG知识库问答第1版则在春节之前已就绪至于第四、第五项目组的大模型机器人、Agent则正在迭代中 所有项目均为会对外上线发布的商用项目,而论文审稿GPT至今在过去的半年已经迭代两个版本,其中第

七月进度管理(任务墙)

任务墙 完成任务计划完成时间实际完成时间陈兆庭1实现服务器端mysql建表7.107.10胡宇晨1统计功能7.87.81个人信息界面UI及对接7.187.16黄志鹏1完成登录、注册服务器端功能7.157.151完成进一步同步协议7.317.31康鑫1完善富文本功能7.107.9林静雯1瓶子的描述字段7.37.31增加“喜欢”功能7.107.10涂涵越1完成账户信息界面7.157.151完成登录、

七月论文审稿GPT第2版:用一万多条paper-review数据集微调LLaMA2最终反超GPT4

前言 如此前这篇文章《学术论文GPT的源码解读与微调:从ChatPaper到七月论文审稿GPT第1版》中的第三部分所述,对于论文的摘要/总结、对话、翻译、语法检查而言,市面上的学术论文GPT的效果虽暂未有多好,可至少还过得去,而如果涉及到论文的修订/审稿,则市面上已有的学术论文GPT的效果则大打折扣 原因在哪呢?本质原因在于无论什么功能,它们基本都是基于API实现的,而关键是API毕竟不是万能

纪念2007年七月之梅雨

2007年七月之梅雨 --纪念川豫皖苏四省已有1455万人受灾 阳历七月七本是吉祥日江苏鱼米地进入梅雨季 谁人犯雨师商羊何其怒雨水倾盘下淅淅又三天 城外池塘泛城内道路淹行人探水深车架不敢前 年年喊防汛岁岁梅雨淹青天高在上安知民房低 纵有三峡壮不挡黄梅雨城市花园美不能排雨水 不禁思大禹为我请雨神更祈共工助天下无水灾  Trackback: http://tb.blog.csdn.net/T