AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火

本文主要是介绍AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:AIbase - 智能匹配最适合您的AI产品和网站

QQ截图20240410151413.png

📰🤖📢AI新鲜事

OpenAI发布GPT-4-Turbo 正式版 自带读图能力

image.png

【AiBase提要:】

⭐GPT-4-Turbo正式版全面开放,可通过“gpt-4-turbo”来使用此模型,最新版本为“gpt-4-turbo-2024-04-09”

⭐GPT-4-Turbo是带有视觉能力的模型,可处理128k上下文。

⭐ 价格不变,输入$10.00/100万tokens,输出$30.00/100万tokens,读图:最低 $0.00085/ 图

接口信息:https://platform.openai.com/docs/models/continuous-model-upgrades

价格信息:https://openai.com/pricing

相关限制:https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-five

重磅!GPT-4API全面开放使用

【AiBase提要:】

⚙️ GPT-4具备更强的创造性,支持生成、编辑并共同迭代创意和技术写作任务。

🔍 GPT-4有更长的上下文处理能力,适用于创建长格式内容、扩展对话以及文档搜索和分析等场景。

🏢 企业如摩根士丹利已开始应用GPT-4,将其嵌入内部机器人,帮助财务人员查找资料并节省时间。

API详细使用说明地址:https://platform.openai.com/docs/guides/gpt

谷歌宣布Gemini1.5Pro开放API 新增多项功能

image.png

【AiBase提要:】

🎵 Gemini1.5Pro引入了原生音频理解能力,不需先转换为文本。

📄 Gemini1.5Pro扩展了输入模态范围,支持视频内容处理。

💻 Gemini API改进,加入系统指令引导模型响应和JSON模式。

详情点此查看:

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

SD3将于4月中旬发布!预计会有6种规模的模型

QQ截图20240410102202.png

【AiBase提要:】

⭐ SD3计划在四月中旬正式发布,已发布两篇关于SD3和SD3Turbo的论文

⭐ SD3可能拥有多达6种不同规模的模型,满足不同需求。

⭐ SD3具有80亿参数,适用于RTX4090,生成1024x1024图像需34秒。

SD3论文:https://arxiv.org/abs/2403.12015

SD3Turbo论文:https://arxiv.org/abs/2403.03206

更多SD3制作图像点此查看:https://sd3.art/

性能超H100!英特尔发布新一代人工智能芯片Gaudi3压力给到英伟达!

1.jpg

【AiBase提要:】

⭐ Gaudi3性能超英伟达H100,是最强AI芯片之一

⭐ Gaudi3能效是英伟达芯片的两倍多,速度也快

⭐ Gaudi3采用先进5nm工艺,配备128GB HBM2e内存

详细:

https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html#gs.7q25hh

Poe为AI机器人创建者引入了按消息定价的收入模式

【AiBase提要:】

⭐ Poe 推出了一种信息收费的收入模式

⭐ 新收入模式将有助于激励开发更多种类的机器人

⭐ 创作者可以为他们的机器人设置每条消息的价格,赚取收入。

刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

【AiBase提要:】

🌟 Mistral AI再次发布磁力链,解禁281GB的8x22B MoE模型。

🌟 Mistral AI靠一条磁力链掀起AI社区热潮。

🌟 新的MoE模型支持多语言、性能强大,旗舰版直接对标GPT-4。

详情:刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

抖音AI特效一键生成宫崎骏画风爆火

image.png

【AiBase提要:】

⭐ 电影宣传团队与抖音合作推出宫崎骏动画风格的AI特效,吸引200万用户参与。

⭐ 使用特效引发争议,支持者认为向宫崎骏致敬,反对者则认为违背大师意愿。

⭐ 争议中指出宫崎骏对AI动画技术的抵制,但实际视频并非AI技术。

详情:抖音AI特效一键生成宫崎骏画风爆火

Suno音乐攻占B站鬼畜区 “钢门松弛”成最热门题材

image.png

【AiBase提要:】

🎶 歌曲“你的钢门比较松弛”在B站引发热潮,吸引数百万网友关注。

🎤 AI音乐走红,Suno软件领衔鬼畜音乐创作,获得突破性成功。

📈 AI音乐评论区氛围和谐,网友以幽默和调侃方式互动,展现创意风采。

详情:Suno音乐攻占B站鬼畜区 “钢门松弛”成最热门题材

苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面

image.png

【AiBase提要:】

⭐️ Ferret-UI是专为移动UI屏幕设计的MLLLM,具备引用、定位和推理能力。

⭐️ 采用“任何分辨率”技术,提高模型对小型对象的理解精度。

⭐️ Ferret-UI通过对话能力在详细描述、交互对话和功能推断等任务中表现突出。

论文地址:https://arxiv.org/pdf/2404.05719.pdf

马云内网发声:肯定阿里变革一年成效 称 AI 时代刚刚到来

【AiBase提要:】

⭐ 马云肯定阿里新管理层勇气,称公司重回健康成长轨道

⭐ 马云认为阿里最核心变化是重回客户价值轨道

⭐ 马云预测互联网行业未来三至五年将发生翻天覆地变化,AI时代正当其时

🤖📱💼AI应用

百度网盘推出AI创意生成工具“超能画布”

微信截图_20240410111214.png

【AiBase提要:】

⭐ 独特的图像大模型和智能人脸融合算法

⭐ 提供丰富的背景、服装切换选项

⭐ 可对人物表情、发色进行局部重绘

体验地址:超能画布使用入口地址 Ai网站最新工具和软件app下载

现阶段有效白嫖(免登录) GPT-3.5的项目

image.png

1⃣Aurora https://github.com/aurora-develop/aurora

(各种花式白嫖,支持 Render/Vercel 等一键部署)

2⃣ChatGPT https://github.com/PawanOsman/ChatGPT

(支持 Docker & Android,很稳定)

3⃣FreeGPT35https://github.com/missuo/FreeGPT35

(参数多,支持 Nginx 反向代理)

谷歌将推全新AI视频工具Google Vids 集多种功能一体

1.png

【AiBase提要:】

📱 Google Vids集多种功能于一体,帮助用户轻松创作故事板。

🖼️ AI技术协助编辑内容,选择适合的场景、图片和音乐。

🎙️ 用户可为视频加上配音,提升视频个性化和专业度。

AI也可以生成延时视频了 MagicTime输入文本即可生成植物生长视频

image.png

【AiBase提要:】

⭐️MagicTime模型专注于生成变形时间延迟视频

⭐️生成的视频符合现实世界物理规律,可以生成比较自然的植物生长过程视频。

⭐️对提示的理解更准确,生成的质量也比较高

项目演示:MagicTime使用入口地址 Ai模型最新工具和软件app下载

代码:https://github.com/PKU-YuanGroup/MagicTime

DreamWalk:实现对图像生成风格和内容的精细控制

image.png

【AiBase提要:】

⭐ 用户可以更加自由地决定图像中哪部分应该更加强烈地体现某种风格

⭐ DreamWalk支持在不同风格间进行平滑过渡,保证生成图像更加和谐统一

⭐ 可将现实世界图像转换为特定风格的艺术作品,满足用户对多样化图像风格的需求

项目演示:DreamWalk使用入口地址 Ai模型最新工具和软件app下载

论文:https://arxiv.org/pdf/2404.03145.pdf

金山办公WPS365升级 推出 WPS AI 企业版和 WPS 协作

微信截图_20240409173433.png

【AiBase提要:】

⭐️ WPS365整合文档、AI和协作能力,实现一站式AI办公。

⭐️ WPS AI企业版降低使用大模型门槛,提供智能创作与数据分析功能。

⭐️ WPS365模式让用户通过一个产品高效完成所有工作,实现办公新质生产力。

——————

每日midjourney prompt:电商模特——比基尼

A Beautiful Chinese Girl with long dark hair,Wearing a green silk camisole shirt and a flowing skirt, sitting on rocks by the ocean, eyes closed, serene expression, realistic, photorealistic, detailed,8k --ar3:4--q2--s750

2_1712731778423_ai2023_A_Beautiful_Chinese_Girl_with_long_dark_hairWearing_a_gr_640afd7f-fbad-4f5f-821f-e248f1c0cf48.png

一个美丽的中国女孩,留着一头乌黑的长发,穿着绿色丝绸背心和飘逸的裙子,坐在海边的岩石上,闭着眼睛,表情安详,逼真,细节,8k

这篇关于AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/893916

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

4B参数秒杀GPT-3.5:MiniCPM 3.0惊艳登场!

​ 面壁智能 在 AI 的世界里,总有那么几个时刻让人惊叹不已。面壁智能推出的 MiniCPM 3.0,这个仅有4B参数的"小钢炮",正在以惊人的实力挑战着 GPT-3.5 这个曾经的AI巨人。 MiniCPM 3.0 MiniCPM 3.0 MiniCPM 3.0 目前的主要功能有: 长上下文功能:原生支持 32k 上下文长度,性能完美。我们引入了

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti