一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集

本文主要是介绍一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,Meta 震撼发布了号称「开源 GPT-4」的大模型 Llama3,该模型惊动了整个 AI 圈,HyperAI超神经也迫不及待想要体验一下!hyper.ai 官网现已在公共教程上线「一键部署 Llama3」! 有没有人和我一样激动的搓手手?赶紧来运行一下~

4 月 22 日-4 月 26 日,hyper.ai 官网更新速览:

  • 优质公共数据集:10 个

  • 优质教程精选:3 个

  • 社区文章精选:5 篇

  • 热门百科词条:5 条

访问官网:hyper.ai

公共数据集精选

1. COCONut 大规模全景图像分割数据集

COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR2024。

直接使用:https://go.hyper.ai/43gIy

2. Solar System Planets 太阳系行星数据集

该数据集包含太阳系所有行星的 .jpg 格式图片,数据集分为训练集、测试集和验证集。每个集都包含 9 个不同行星的子集:地球、水星、金星、地球、火星、木星、土星、天王星和海王星。

直接使用:https://go.hyper.ai/awnIo

3. Chinese medical dialogue data 中文医疗问答数据集

该数据集为中文医疗问答数据集,包含 6 个不同医疗科室的问答数据文件夹,每个文件夹下有一个 csv 文件。

直接使用:https://go.hyper.ai/scsmp

4. TAL-SCQ5K 好未来中文数学竞赛数据集

TAL-SCQ5K 是一组高质量中文数学竞赛数据集,包含 5K 道中文数学竞赛题目(3K 道用于训练,2K 道用于测试),提供中文和英文两种语言。

直接使用:https://go.hyper.ai/RqwbX

5. 安徽电信知道问答数据集

该数据集包含 15.6 万条安徽电信问答数据,包括用户提问、网友回答、最佳回答,数据集来源为百度知道,适用于 FAQ 问答系统任务。

直接使用:https://go.hyper.ai/CMkpM

6. WikiArt 维基艺术图像数据集

该数据集包含来自 1,119 位不同艺术家、 27 种风格的 80,020 张独特图像,数据来源于 WikiArt.org,WikiArt 数据集只能用于非商业研究目的。

直接使用:https://go.hyper.ai/nCKMw

7. Wonders Of World 世界奇观数据集

该数据集包含世界上 50 个最令人惊叹的地标,这些地标均选自著名的新七大奇迹列表。数据集信息包括地标的:名称、类型、位置、维基百科链接、图片链接和建造年份。

直接使用:https://go.hyper.ai/qQLA4

8. Google Landmarks Photos 谷歌地标图片数据集

该数据集包含约 12 万个地标图片的 URL,每个地标图片都有唯一的 ID,有助于实例识别和图像检索任务。

直接使用:https://go.hyper.ai/fJ5kO

9. GIS World Data File GIS 世界数据文件数据集

该数据集为世界地图的形状数据集,包含国家边界、一级行政管理(省、州等)、有争议的地区、海岸线、人口稠密地区等各种比例级别的地图。

直接使用:https://go.hyper.ai/hcwKe

10. SSDO 大规模海表溶解氧数据集

该数据集为论文「基于时空机器学习的卫星全球海表氧气测绘与解释」中使用的数据。基于该论文研究搭建的框架 DOsurface-Pred Framework,研究团队生成了跨越 2010-2018 年的大规模海表溶解氧数据集,包含卫星数据、固定船只和电导仪测量数据。

直接使用:https://go.hyper.ai/d9w8B

更多公共数据集,请访问

https://hyper.ai/datasets

公共教程精选

1. 使用 Ollama 和 Open WebUI 部署 Llama3-8B-Instruct

该教程为 Ollama + Open WebUI 一键运行包,只需按步骤输入命令即可运行 Llama3-8B-Instruct 大模型。

在线运行:https://go.hyper.ai/7lZyb

2. 使用 Ollama 和 Open WebUI 部署 Llama3-70B

该教程通过 Ollama 和 Open WebUI 工具来一键运行模型,仅需按步骤输入命令即可运行 Llama3-70B 大模型。虽然模型参数较大,但经过平台部署后使用单卡 A6000 即可使用,仅占用 1.07 GB 存储。

在线运行:https://go.hyper.ai/u4XHj

3. 在线教程丨刘强东数字人首秀交易额破 5 千万!用 GeneFace++ 生成实时说话数字人

GeneFace++ 作为一种通用且稳定的实时音频驱动 3D 说话人脸生成技术,可以通过改进唇形同步、视频质量和系统效率,实现实时说话人的生成。「GeneFace++ 数字人 Demo」教程现已上线hyper.ai 官网,并且为大家搭建好环境,简化了数字人的制作流程,无需担心环境配置、硬件需求和版本兼容等问题,点击在线运行即可一键启动。

在线运行:https://go.hyper.ai/4BwgN

社区文章精选

1. 【数学数据集汇总】天才博士陶哲轩力荐数据集!含代码、中文竞赛题目、正向逆向问答对等

干货来了!hyper.ai 汇总了 10 个数学分类数据集,内含天才数学家陶哲轩力荐的数据集资源,助力 AI for Math 的发展研究。

查看详细干货:https://go.hyper.ai/6Vhrb

2. 基于美日 627 例患者的临床数据,谷歌证实 AI 辅助肺癌筛查的群体有效性

基于 AI 的快速发展,谷歌团队研究了机器学习模型如何有效地将研究结果传达给放射科医生,评估了广义人工智能辅助系统在特定工作流程环境、设备和国家特定指南和评分/管理协议下对肺癌筛查工作流程的影响,并在美国和日本进行测试。结果表明,在人工智能辅助下,平均每位病例筛查时间可减少 14 秒。研究论文已经发表于「Radiology AI」期刊。

查看完整报道:https://go.hyper.ai/wiCl0

3. 【活动汇总】纽约大学 AI Meets Science;第十六届生物信息学和生物医学技术国际会议;Bio-IT World2024

HyperAI 超神经网罗了海内外 AI for Science 垂类会议,并整理会议信息与链接,一键直达官方主页,不错过任何一场重量级活动!本文为近期的活动汇总。

查看完整文章:https://go.hyper.ai/HTGNG

4. 纳米尺度下的单粒子追踪,厦门大学方宁团队用 AI 奏响「细胞里的摇滚」

厦门大学方宁教授团队基于深度学习研发了一种自动化、高速、多维的单粒子追踪系统,打破了细胞微环境中纳米颗粒旋转追踪的局限性,实现了在纳米尺度下,全方位、精准追踪活细胞内单分子/单个纳米颗粒。本文是该研究的详细解读和分享该论文已经发表于权威期刊「Nano Letters」。

查看完整报道:https://go.hyper.ai/G4k2e

5 . 解构海洋缺氧:浙大 GIS 实验室融合机器学习及卫星测绘,发布全球海表溶解氧综合建模框架

浙大 GIS 实验室研究人员将机器学习技术与卫星产品相结合,开发了一个全球海表溶解氧综合建模框架 DOsurface-Pred Framework,证实了即使在氧气充足的海表区域,其溶解氧含量也出现了下降趋势,而这种趋势主要归因于海表温度的变化。研究论文已经发表于「ACS Publications」。

查看完整报道:https://go.hyper.ai/NlRmn

热门百科词条精选

1. 故障词元 Glitch Token

2. 多模态大语言模型 MLLM

3. 掩码语言建模 MLM

4. 分组查询注意力 GQA

5. 变分自编码器 VAE

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://hyper.ai/wiki

B 站直播预告

Google 日前宣布将于当地时间 5 月 14 日举办 2024 年度 I/O 开发者大会,为了帮助大家深入了解,超神经直播间将持续直播「Google 专题」视频, 涉及:Google I/O 历年发布会、高管访谈、相关纪录片等丰富内容。

下表为小编为大家精选的内容预告↓↓↓

日期时间内容
4 月 29 日 星期一18:00Google 历年 I/O 发布会
4 月 30 日星期二18:00Google Cloud NEXT 历年大会
5 月 1 日星期三18:00TIME100 访谈Sundar Pichai
5 月 2 日星期四18:00Google 首席执行官谈中美人工智能竞赛
5 月 3 日星期五18:00AlphaGo 纪录片
5 月 4 日星期六18:00Google 纪录片背后创始人的故事
5 月 5 日星期日18:00BBC 纪录片没有 Google 的世界

超神经电视台 7×24h 不间断直播,点击即可收获 AI 领域的「电子榨菜」:

http://live.bilibili.com/26483094

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1400+ 公开数据集提供国内加速下载节点

  • 收录 300+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

这篇关于一键部署 Llama3 8B/70B!最高仅占1.07GB存储;COCONut上线,字节跳动推出的首个大规模全景图像分割数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/938090

相关文章

UnrealScriptIDE调试环境部署

先安装vs2010   再安装VSIsoShell.exe, 下载地址 https://pan.baidu.com/s/10kPNUuDGTbWXbz7Nos-1WA       fd3t   最后安装unside,下载地址 https://archive.codeplex.com/?p=uside  安装中间有一步选择Binary文件夹要选对路径。   安装好以后,启动 UDKDe

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

android一键分享功能部分实现

为什么叫做部分实现呢,其实是我只实现一部分的分享。如新浪微博,那还有没去实现的是微信分享。还有一部分奇怪的问题:我QQ分享跟QQ空间的分享功能,我都没配置key那些都是原本集成就有的key也可以实现分享,谁清楚的麻烦详解下。 实现分享功能我们可以去www.mob.com这个网站集成。免费的,而且还有短信验证功能。等这分享研究完后就研究下短信验证功能。 开始实现步骤(新浪分享,以下是本人自己实现

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

AI赋能天气:微软研究院发布首个大规模大气基础模型Aurora

编者按:气候变化日益加剧,高温、洪水、干旱,频率和强度不断增加的全球极端天气给整个人类社会都带来了难以估计的影响。这给现有的天气预测模型提出了更高的要求——这些模型要更准确地预测极端天气变化,为政府、企业和公众提供更可靠的信息,以便做出及时的准备和响应。为了应对这一挑战,微软研究院开发了首个大规模大气基础模型 Aurora,其超高的预测准确率、效率及计算速度,实现了目前最先进天气预测系统性能的显著

青龙面板部署通用教程,含服务器、路由器、X86等部署方法

1. 拉取镜像/更新镜像 docker pull whyour/qinglong:latest 2. 删除镜像 docker rmi whyour/qinglong:latest 3. 启动容器 普通服务器 docker run -dit \-v $PWD/ql/config:/ql/config \-v $PWD/ql/log:/ql/log \-v $PWD/ql/db:

宝塔面板部署青龙面板教程【简单易上手】

首先,你得有一台部署了宝塔面板的服务器(自己用本地电脑也可以)。 宝塔面板部署自行百度一下,很简单,这里就不走流程了,官网版本就可以,无需开心版。 首先,打开宝塔面板的软件商店,找到下图这个软件(Docker管理器)安装,青龙面板还是安装在docker里,这里依赖宝塔面板安装和管理docker。 安装完成后,进入SSH终端管理,输入代码安装青龙面板。ssh可以直接宝塔里操作,也可以安装ssh连接