一键部署Phi 3.5 mini+vision!多模态阅读基准数据集MRR-Benchmark上线,含550个问答对

本文主要是介绍一键部署Phi 3.5 mini+vision!多模态阅读基准数据集MRR-Benchmark上线,含550个问答对,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

小模型又又又卷起来了!微软开源三连发!一口气发布了 Phi 3.5 针对不同任务的 3 个模型,并在多个基准上超越了其他同类模型。

其中 Phi-3.5-mini-instruct 专为内存或算力受限的设备推出,小参数也能展现出强大的推理能力,代码生成、多语言理解等任务信手拈来。而 Phi-3.5-vision-instruct 则是多模态领域的翘楚,能同时处理文本和视觉信息,图像理解、视频摘要等任务不在话下。

HyperAI超神经现已上线 mini 版本和 vision 版本的模型部署教程,下拉文章获取链接~

9 月 2 日-9 月 6 日,hyper.ai 官网更新速览:

  • 优质教程精选:3 个

  • 优质公共数据集:10 个

  • 社区文章精选:3 篇

  • 热门百科词条:5 条

  • 9 月截稿顶会:5 个

访问官网:hyper.ai

给大家推荐一个线上学术分享活动,上海交通大学博士后周子宜将以「蛋白质语言模型的小样本学习方法」为题, 带来干货分享,点击即可预约观看 ⬇️

https://hdxu.cn/6Bjom

公共教程精选

1. 一键部署 Phi-3.5-mini-instruct

Phi-3.5-mini-instruct 支持 128K Token 的上下文长度,适合执行代码生成、数学问题求解和基于逻辑的推理等任务。该模型在多语言和多轮对话任务中表现出色,并在 RepoQA 基准测试中超越了同等级的其他模型。该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

直接使用:https://go.hyper.ai/F7smR

2. 一键部署 Phi-3.5-vision-instruct

Phi-3.5-vision-instruct 模型具备广泛的图像理解、光学字符识别 (OCR)、图表和表格解析、多图像或视频剪辑摘要等功能,非常适合多种 AI 驱动的应用。在图像和视频处理相关的基准测试中表现出显著的性能提升。模型与环境已经部署完毕,大家可根据教程指引直接使用大模型进行推理生成。

直接使用:https://go.hyper.ai/zN9Bx

3. 在线教程 | 1 分钟生成万字悬疑小说,LongWriter-glm4-9b 突破长文输出瓶颈

LongWriter 是清华大学开发的一个开源项目,使用长上下文大型语言模型 (LLM) 生成超长文本(超过 10,000 字)。该教程为模型一键部署 Demo,只需克隆并启动该容器,直接复制生成的 API 地址,即可对模型进行推理体验。

直接使用:https://go.hyper.ai/p6SiO

公共数据集精选

1. MRR-Benchmark 多模态阅读基准数据集

多模态阅读 (MMR) 基准包括 11 个不同任务中的 550 个带注释的问答对,涉及文本、字体、视觉元素、边界框、空间关系和基础,并具有精心设计的评估指标。

直接使用:https://go.hyper.ai/deAmf

2. EveDentify 瞳孔直径估计数据集

该数据集共包含 51 名参与者的 212,073 张图像,研究团队使用 Tobii 眼动仪收集准确的瞳孔直径测量数据,同时使用内置网络摄像头拍摄面部视频。数据集旨在解决在利用普通网络摄像头图像进行瞳孔直径估计时可用数据集的缺乏问题。

直接使用:https://go.hyper.ai/iHjxC

3. Traffic Road Obiect Detection 波兰交通道路物体检测数据集

该数据集包含波兰道路的 11k 个带注释图像,专门为物体检测任务而整理。数据是使用车载摄像头在波兰道路上收集的,主要在克拉科夫。图像捕捉了各种场景,包括不同的道路类型和各种照明条件(白天和夜晚)。

直接使用:https://go.hyper.ai/Sl0k5

4. C2A 灾难场景中的人类检测数据集

C2A (combined to application) 数据集包含 4 种灾难场景类型(火灾/烟雾、洪水、倒塌的建筑物/瓦砾和交通事故)和 5 种人体姿势类别(弯腰、跪下、躺下、坐下和直立)的共 10,215 张高分辨率图像,图像分辨率范围从 123×152 到 5184×3456 像素,以及超过 360,000 个带注释的人类实例。

直接使用:https://go.hyper.ai/15dMR

5. Skin Conditionsmage Dataset 6 种皮肤状态数据集

该数据集包含 6 种不同皮肤病的增强图像,分别为:痤疮、癌、湿疹、角化病、粟丘疹和酒渣鼻。每个类别包含 399 张图像,共 2,394 张图像。

直接使用:https://go.hyper.ai/tWO7x

6. Penn-Fudan 行人检测和分割数据集

这个数据集包含 170 张高分辨率的 RGB 图像,这些图片都是从视频序列中截取的,并且在每幅图像中有 0 到 6 个不等的行人目标。每个行人的位置都通过矩形框 (mask) 进行了精确标注,提供了边界框坐标信息,便于进行目标检测训练和测试。

直接使用:https://go.hyper.ai/1CqaN

7. Tecnalia 电机设备废物高光谱数据集

Tecnalia 高光谱数据集包含来自电机和电子设备废物的不同有色金属部分,如铜、黄铜、铝、不锈钢和白铜,图像在光谱范围 [415.05 纳米,1008.10 纳米] 内包含 76 个均匀分布的波长。

直接使用:https://go.hyper.ai/1TBGz

8. Car Crash Prediction 汽车碰撞或预测数据集

该数据集包含 10k 张行车记录仪的图像,所有图像均来自 100K Dashcam 视频。图像以 5 秒为间隔从视频中分离出来,作为单独的帧,数据集包含碰撞和无碰撞两个类,xlsx 文件中也提供了注释。

直接使用:https://go.hyper.ai/jV1hL

9. PKU-Market-PCB 印刷电路板瑕疵数据集

PKU-Market-PCB 是一个公共合成 PCB 数据集,包含 1,386 张图像,具有 6 种缺陷(漏孔、鼠咬、开路、短路、杂散、杂铜),可用于图像检测、分类和配准任务。

直接使用:https://go.hyper.ai/VnbpT

10. PKU-Market-Phone 手机屏幕表面缺陷分割数据集

该数据集包含 3 种类型的表面缺陷:油污、划痕和斑点。每类缺陷 400 张图片,总共 1.2k 张。缺陷是由研究团队模拟工业环境制造的。图像由工业相机采集,分辨率为 1920×1080。数据集划分为训练:验证:测试=6:2:2,数据集格式采用 PASCAL VOC 。

直接使用:https://go.hyper.ai/K6u2o

更多公共数据集,请访问:

https://hyper.ai/datasets

社区文章精选

1. 超全拆解AlphaFold 3,上海交大钟博子韬:极致利用数据,以原子精度预测所有生物分子结构,但并不完美

近日,在上海交通大学 AI for Bioengineering 暑期学校活动中,钟博子韬博士以「AlphaFold 3:原理,应用与展望」为题,系统性地梳理了他的学习心得,并广泛整理了来自科研界的众多相关研究成果,向大家分享了他对于 AlphaFold 3 的深刻洞察,本文是演讲的核心内容梳理。

查看完整报道:https://go.hyper.ai/Ln2Yv

2. 美国科学院院刊封面文章!中国团队发布可晶圆级生产的人工智能自适应微型光谱仪

复旦大学团队提出了一种新的微型化重构光谱仪设计,结合了传统光谱仪和计算重构光谱仪的优势,通过集成的自参考窄带滤波通道,使得人工智能算法可以在更高维度的参数空间进行光谱和算法参数的同时搜索。本文是对研究论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/GEKE4

3. 覆盖 7 百万问答数据,上海 AI Lab 发布 ChemLLM,专业能力比肩 GPT-4

上海人工智能实验室发布了化学大语言模型 ChemLLM。ChemLLM 擅长通过流畅的对话交互执行化学学科的各种任务,在核心任务上的性能与 GPT-4 相当,并在一般场景中表现出了与类似规模的 LLM 相媲美的性能。本文是对研究论文的详细解读与分享。

查看完整报道:https://go.hyper.ai/3bdMW

热门百科词条精选

1. 倒数排序融合 RRF

2. 学习率 Learning Rate

3. 核范数 Nuclear Norm

4. 帕累托前沿 Pareto Front

5. 数据增强 Data Augmentation

这里汇编了数百条 AI 相关词条,让你在这里读懂「人工智能」:

https://go.hyper.ai/wiki

在这里插入图片描述

一站式追踪人工智能学术顶会:https://go.hyper.ai/event

以上就是本周编辑精选的全部内容,如果你有想要收录 hyper.ai 官方网站的资源,也欢迎留言或投稿告诉我们哦!

下周再见!

关于 HyperAI超神经 (hyper.ai)

HyperAI超神经 (hyper.ai) 是国内领先的人工智能及高性能计算社区, 致力于成为国内数据科学领域的基础设施,为国内开发者提供丰富、优质的公共资源,截至目前已经:

  • 为 1300+ 公开数据集提供国内加速下载节点

  • 收录 400+ 经典及流行在线教程

  • 解读 100+ AI4Science 论文案例

  • 支持 500+ 相关词条查询

  • 托管国内首个完整的 Apache TVM 中文文档

访问官网开启学习之旅:

https://hyper.ai/

这篇关于一键部署Phi 3.5 mini+vision!多模态阅读基准数据集MRR-Benchmark上线,含550个问答对的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1143536

相关文章

闲置电脑也能活出第二春?鲁大师AiNAS让你动动手指就能轻松部署

对于大多数人而言,在这个“数据爆炸”的时代或多或少都遇到过存储告急的情况,这使得“存储焦虑”不再是个别现象,而将会是随着软件的不断臃肿而越来越普遍的情况。从不少手机厂商都开始将存储上限提升至1TB可以见得,我们似乎正处在互联网信息飞速增长的阶段,对于存储的需求也将会不断扩大。对于苹果用户而言,这一问题愈发严峻,毕竟512GB和1TB版本的iPhone可不是人人都消费得起的,因此成熟的外置存储方案开

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推