一键部署 Llama3 8B/70B！最高仅占1.07GB存储；COCONut上线，字节跳动推出的首个大规模全景图像分割数据集

本文主要是介绍一键部署 Llama3 8B/70B！最高仅占1.07GB存储；COCONut上线，字节跳动推出的首个大规模全景图像分割数据集，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

近日，Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3，该模型惊动了整个 AI 圈，HyperAI超神经也迫不及待想要体验一下！hyper.ai 官网现已在公共教程上线「一键部署 Llama3」！ 有没有人和我一样激动的搓手手？赶紧来运行一下~

4 月 22 日-4 月 26 日，hyper.ai 官网更新速览：

优质公共数据集：10 个
优质教程精选：3 个
社区文章精选：5 篇
热门百科词条：5 条

访问官网：hyper.ai

公共数据集精选

1. COCONut 大规模全景图像分割数据集

COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集，包含约 383K 图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR2024。

直接使用：https://go.hyper.ai/43gIy

2. Solar System Planets 太阳系行星数据集

该数据集包含太阳系所有行星的 .jpg 格式图片，数据集分为训练集、测试集和验证集。每个集都包含 9 个不同行星的子集：地球、水星、金星、地球、火星、木星、土星、天王星和海王星。

直接使用：https://go.hyper.ai/awnIo

3. Chinese medical dialogue data 中文医疗问答数据集

该数据集为中文医疗问答数据集，包含 6 个不同医疗科室的问答数据文件夹，每个文件夹下有一个 csv 文件。

直接使用：https://go.hyper.ai/scsmp

4. TAL-SCQ5K 好未来中文数学竞赛数据集

TAL-SCQ5K 是一组高质量中文数学竞赛数据集，包含 5K 道中文数学竞赛题目（3K 道用于训练，2K 道用于测试），提供中文和英文两种语言。

直接使用：https://go.hyper.ai/RqwbX

5. 安徽电信知道问答数据集

该数据集包含 15.6 万条安徽电信问答数据，包括用户提问、网友回答、最佳回答，数据集来源为百度知道，适用于 FAQ 问答系统任务。

直接使用：https://go.hyper.ai/CMkpM

6. WikiArt 维基艺术图像数据集

该数据集包含来自 1,119 位不同艺术家、 27 种风格的 80,020 张独特图像，数据来源于 WikiArt.org，WikiArt 数据集只能用于非商业研究目的。

直接使用：https://go.hyper.ai/nCKMw

7. Wonders Of World 世界奇观数据集

该数据集包含世界上 50 个最令人惊叹的地标，这些地标均选自著名的新七大奇迹列表。数据集信息包括地标的：名称、类型、位置、维基百科链接、图片链接和建造年份。

直接使用：https://go.hyper.ai/qQLA4

8. Google Landmarks Photos 谷歌地标图片数据集

该数据集包含约 12 万个地标图片的 URL，每个地标图片都有唯一的 ID，有助于实例识别和图像检索任务。

直接使用：https://go.hyper.ai/fJ5kO

9. GIS World Data File GIS 世界数据文件数据集

该数据集为世界地图的形状数据集，包含国家边界、一级行政管理（省、州等）、有争议的地区、海岸线、人口稠密地区等各种比例级别的地图。

直接使用：https://go.hyper.ai/hcwKe

10. SSDO 大规模海表溶解氧数据集

该数据集为论文「基于时空机器学习的卫星全球海表氧气测绘与解释」中使用的数据。基于该论文研究搭建的框架 DOsurface-Pred Framework，研究团队生成了跨越 2010-2018 年的大规模海表溶解氧数据集，包含卫星数据、固定船只和电导仪测量数据。

直接使用：https://go.hyper.ai/d9w8B

更多公共数据集，请访问 ：

https://hyper.ai/datasets

公共教程精选

1. 使用 Ollama 和 Open WebUI 部署 Llama3-8B-Instruct

该教程为 Ollama + Open WebUI 一键运行包，只需按步骤输入命令即可运行 Llama3-8B-Instruct 大模型。

在线运行：https://go.hyper.ai/7lZyb

2. 使用 Ollama 和 Open WebUI 部署 Llama3-70B

该教程通过 Ollama 和 Open WebUI 工具来一键运行模型，仅需按步骤输入命令即可运行 Llama3-70B 大模型。虽然模型参数较大，但经过平台部署后使用单卡 A6000 即可使用，仅占用 1.07 GB 存储。

在线运行：https://go.hyper.ai/u4XHj

3. 在线教程丨刘强东数字人首秀交易额破 5 千万！用 GeneFace++ 生成实时说话数字人

GeneFace++ 作为一种通用且稳定的实时音频驱动 3D 说话人脸生成技术，可以通过改进唇形同步、视频质量和系统效率，实现实时说话人的生成。「GeneFace++ 数字人 Demo」教程现已上线hyper.ai 官网，并且为大家搭建好环境，简化了数字人的制作流程，无需担心环境配置、硬件需求和版本兼容等问题，点击在线运行即可一键启动。

在线运行：https://go.hyper.ai/4BwgN

社区文章精选

1. 【数学数据集汇总】天才博士陶哲轩力荐数据集！含代码、中文竞赛题目、正向逆向问答对等

干货来了！hyper.ai 汇总了 10 个数学分类数据集，内含天才数学家陶哲轩力荐的数据集资源，助力 AI for Math 的发展研究。

查看详细干货：https://go.hyper.ai/6Vhrb

2. 基于美日 627 例患者的临床数据，谷歌证实 AI 辅助肺癌筛查的群体有效性

基于 AI 的快速发展，谷歌团队研究了机器学习模型如何有效地将研究结果传达给放射科医生，评估了广义人工智能辅助系统在特定工作流程环境、设备和国家特定指南和评分/管理协议下对肺癌筛查工作流程的影响，并在美国和日本进行测试。结果表明，在人工智能辅助下，平均每位病例筛查时间可减少 14 秒。研究论文已经发表于「Radiology AI」期刊。

查看完整报道：https://go.hyper.ai/wiCl0

3. 【活动汇总】纽约大学 AI Meets Science；第十六届生物信息学和生物医学技术国际会议；Bio-IT World2024

HyperAI 超神经网罗了海内外 AI for Science 垂类会议，并整理会议信息与链接，一键直达官方主页，不错过任何一场重量级活动！本文为近期的活动汇总。

查看完整文章：https://go.hyper.ai/HTGNG

4. 纳米尺度下的单粒子追踪，厦门大学方宁团队用 AI 奏响「细胞里的摇滚」

厦门大学方宁教授团队基于深度学习研发了一种自动化、高速、多维的单粒子追踪系统，打破了细胞微环境中纳米颗粒旋转追踪的局限性，实现了在纳米尺度下，全方位、精准追踪活细胞内单分子/单个纳米颗粒。本文是该研究的详细解读和分享该论文已经发表于权威期刊「Nano Letters」。

查看完整报道：https://go.hyper.ai/G4k2e

5 . 解构海洋缺氧：浙大 GIS 实验室融合机器学习及卫星测绘，发布全球海表溶解氧综合建模框架

浙大 GIS 实验室研究人员将机器学习技术与卫星产品相结合，开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework，证实了即使在氧气充足的海表区域，其溶解氧含量也出现了下降趋势，而这种趋势主要归因于海表温度的变化。研究论文已经发表于「ACS Publications」。

查看完整报道：https://go.hyper.ai/NlRmn

热门百科词条精选

1. 故障词元 Glitch Token

2. 多模态大语言模型 MLLM

3. 掩码语言建模 MLM

4. 分组查询注意力 GQA

5. 变分自编码器 VAE

这里汇编了数百条 AI 相关词条，让你在这里读懂「人工智能」：

https://hyper.ai/wiki

B 站直播预告

Google 日前宣布将于当地时间 5 月 14 日举办 2024 年度 I/O 开发者大会，为了帮助大家深入了解，超神经直播间将持续直播「Google 专题」视频， 涉及：Google I/O 历年发布会、高管访谈、相关纪录片等丰富内容。

下表为小编为大家精选的内容预告↓↓↓

日期	时间	内容
4 月 29 日星期一	18:00	Google 历年 I/O 发布会
4 月 30 日星期二	18:00	Google Cloud NEXT 历年大会
5 月 1 日星期三	18:00	TIME100 访谈Sundar Pichai
5 月 2 日星期四	18:00	Google 首席执行官谈中美人工智能竞赛
5 月 3 日星期五	18:00	AlphaGo 纪录片
5 月 4 日星期六	18:00	Google 纪录片背后创始人的故事
5 月 5 日星期日	18:00	BBC 纪录片没有 Google 的世界