AI新工具(20240312) Midjourney官方发布角色一致性功能;免费且开源的简历制作工具;精确克隆语调、控制声音风格

本文主要是介绍AI新工具(20240312) Midjourney官方发布角色一致性功能;免费且开源的简历制作工具;精确克隆语调、控制声音风格,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1: Midjourney角色一致性功能

使人物画像在多方面高度一致成为可能。

在这里插入图片描述

Midjourney的角色一致性功能的使用方法如下:

  1. ⭐在你的输入指令后面加上 --cref URL,其中URL是你选择的角色图像的链接。

  2. ⭐你可以通过 --cw 参数来调整参照的强度,范围是从100到0。默认的强度是100 (--cw 100),这时会参考人物的脸部、发型和衣着。如果设置为强度0 (--cw 0),那么系统只会关注脸部。

  3. ⭐如果你想结合多个图像中的角色信息,可以使用多个URL,通过 --cref URL1 URL2 的方式。

  4. ⭐在web alpha版本中,将图片拖动或粘贴到想象工具栏,你会看到三个图标。选择这些图标之一,可以设置图片用作图像提示、风格参照或角色参照。如果你想让一张图像同时用于多个类别,只需按住Shift键再选择。

请注意,这个功能最适合用于Midjourney创作的角色图像,不太适合用于真人照片。此外,这项技术的精确度是有限的,它无法复制极其细微的特征。

地址:https://www.midjourney.com/home

2: Reactive Resume

免费且开源的简历制作工具,帮助您轻松创建、更新和分享您的简历

在这里插入图片描述

Reactive Resume 是一个免费且开源的简历制作工具,旨在简化创建、更新和分享简历的过程。这个平台非常注重用户隐私,没有任何用户跟踪或广告。如果你希望完全拥有自己的数据,Reactive Resume甚至支持在不到30秒内自我托管设置。

地址:https://github.com/AmruthPillai/Reactive-Resume

3: OpenVoice

能精确克隆语调、控制声音风格、跨语言克隆声音的技术

在这里插入图片描述

OpenVoice是一个现代化、高效且功能丰富的语音克隆技术。它能够精确克隆特定的语调色彩,并且在多种语言和口音之间生成对应的语音内容。接下来,我将使用通俗的语言,来详细介绍OpenVoice的主要功能,以及它可能被应用的场景。

地址:https://github.com/myshell-ai/OpenVoice

4: Fully Client-Side Chat Over Documents

完全本地运行的文档聊天应用,无需连接网络即可使用

在这里插入图片描述

Fully Client-Side Chat Over Documents是一种完全在客户端运行的文档上聊天的实现方式。现在,我将用通俗的语言向您详细介绍它的功能,并在什么样的情况下会使用这种技术。

地址:https://github.com/jacoblee93/fully-local-pdf-chatbot

5: Rnote

开源的基于矢量的绘图应用程序适用于草图、手写笔记及文档和图片标注

在这里插入图片描述

Rnote是一款开源的基于矢量的绘画应用,专为绘图、手写笔记以及注释文档和图片而设计。它尤其适合学生、教师以及拥有绘图平板的用户。通过提供PDF和图片的导入导出功能、无限画布以及适应大屏幕和小屏幕的自适应用户界面等特性,Rnote旨在提升用户的创作和学习效率。

地址:https://github.com/flxzt/rnote



![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/8b0b21100c73431b90b6907442b4ec47.png)

更多AI工具,参考国内AiBard123,Github-AiBard123

这篇关于AI新工具(20240312) Midjourney官方发布角色一致性功能;免费且开源的简历制作工具;精确克隆语调、控制声音风格的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/803849

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 基于表达式的权限控制

前言 spring security 3.0已经可以使用spring el表达式来控制授权,允许在表达式中使用复杂的布尔逻辑来控制访问的权限。 常见的表达式 Spring Security可用表达式对象的基类是SecurityExpressionRoot。 表达式描述hasRole([role])用户拥有制定的角色时返回true (Spring security默认会带有ROLE_前缀),去

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C++11第三弹:lambda表达式 | 新的类功能 | 模板的可变参数

🌈个人主页: 南桥几晴秋 🌈C++专栏: 南桥谈C++ 🌈C语言专栏: C语言学习系列 🌈Linux学习专栏: 南桥谈Linux 🌈数据结构学习专栏: 数据结构杂谈 🌈数据库学习专栏: 南桥谈MySQL 🌈Qt学习专栏: 南桥谈Qt 🌈菜鸡代码练习: 练习随想记录 🌈git学习: 南桥谈Git 🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈🌈�

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来