本文主要是介绍DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
公共资源速递
This Weekly Snapshots !
5 个数据集:
* LongWriter-6k 长上下文输出数据集
* Yoga-16 人体瑜伽动作图像数据集
* HUST-OBS 甲骨文识别数据集
* UAVDT 无人机目标检测追踪视频数据集
* SWE-bench Verified 代码生成评估基准
1 个模型:
* DeepSeek-Prover-V1.5-RL
3 个教程:
* 一键部署 DeepSeek-Prover-V1.5
* Flash-VStream 视频理解 Demo
* Paints-Undo 一张图生成绘画全过程
访问官网立即使用:openbayes.com
公共数据集
1. LongWriter-6k 长上下文输出数据集
该数据集包含 6k 篇 SFT 数据,输出长度为 2k-32k 字(包括英文和中文),可支持训练 LLM,将其最大输出窗口大小扩展至 10,000+ 字。
* 直接使用:
https://go.openbayes.com/EHvlo
2. Yoga-16 人体瑜伽动作图像数据集
Yoga-16 数据集分为 3 个主要目录:训练、测试和验证,每个目录包含 16 个子目录,对应 16 种不同的瑜伽姿势。这个结构化的数据集提供了全面的图像集合,以方便高级瑜伽姿势识别模型的分类准确率。
* 直接使用:
https://go.openbayes.com/iU957
3. HUST-OBS 甲骨文识别数据集
该数据集包含总计 140,053 幅甲骨文图像,这些图像来自 3 个不同的来源,包括书籍、网站和现有数据库,是迄今为止最大的 OBS 识别和解密数据集之一。
* 直接使用:
https://go.openbayes.com/0hiKT
4. UAVDT 无人机目标检测追踪视频数据集
该数据集包含 10 小时的原始视频,约 8k 个具有代表性的视频帧,这些视频帧带有手动标注边界框和一些有用的标签,例如车辆类别和遮挡。
* 直接使用:
https://go.openbayes.com/lxh5a
5. SWE-bench Verified 代码生成评估基准
该基准是对现有 SWE-bench 的改进版本(子集),旨在更可靠地评估 AI 模型解决现实世界软件问题的能力。
* 直接使用:
https://go.openbayes.com/O1uuo
公共模型
1. DeepSeek-Prover-V1.5-RL
该模型是一个为 Lean 4 定理证明而设计的开源语言模型,它通过优化训练和推理过程来增强 DeepSeek-Prover-V1。该模型在 DeepSeekMath-Base 上进行了预训练,专门研究形式化数学语言,使用从 DeepSeek-Prover-V1 得到的增强形式定理证明数据集进行监督微调。
* 直接使用:
https://go.openbayes.com/XQEtA
公共教程
1. 一键部署 DeepSeek-Prover-V1.5
该模型是 DeepSeek 于 2024 年开源的数学定理证明模型,研究团队在 Lean 4 中引入了该模型,模型通过自我迭代和 Lean 证明器监督,构建了一个「围棋」式的学习环境。该教程是一键部署 DeepSeek-Prover-V1.5 模型,相关环境和依赖已经安装完毕,一键克隆启动即可体验。
* 在线运行:
https://go.openbayes.com/fcH4R
2. Flash-VStream 视频理解 Demo
Flash-VStream 是一种模拟人类记忆机制的视频语言模型。它能够实时处理极长的视频流,并同时响应用户的查询。该教程为 Flash-VStream 一键运行 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。
* 在线运行:
https://go.openbayes.com/gxTeU
3. 教程上新 | 仅需 1 张图片即可生成完整绘画过程,Lvmin Zhang 新作 Paints-Undo 上线!
ControlNet 作者张吕敏 (Lvmin Zhang) 开发了名为 Paints-Undo 的新项目,能够快速拆解任意图像的绘画过程,帮助初学者更好地理解不同风格图像的绘画技巧。OpenBayes 现已上线了「Paints-Undo 一张图生成绘画全过程 Demo」,该教程为大家搭建好了环境,无需输入任何命令,一键克隆即可启动!
* 在线运行:
https://go.openbayes.com/mTe2p
以上就是小贝上周在 OpenBayes 的全部更新内容啦~
小贝还建立了「Stable Diffusion 教程交流群」,欢迎小伙伴们入群探讨各类技术问题、分享应用效果~扫描下方二维码添加小贝总微信(微信号:OpenBayes001),备注「SD 教程交流」,即可加入群聊。
这篇关于DeepSeek 数学大模型现可一键部署!LongWriter-6k数据集上线,助力大模型万字长文输出的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!