被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源

2023-12-24 14:38

本文主要是介绍被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

还记得被视频会议支配的恐惧么?

上一辈的老人在厨房准备香喷喷的食物,下一辈的孩子在一旁开心的玩游戏和玩具,只有你,上半身衣着光鲜头发整齐,下半身穿着睡裤光着脚,在视频会议软件里人模狗样,应付一个接一个无聊的会议主题。

天道有轮回,现在轮到 Work from Home 的歪果人民被视频办公逼疯了。

甚至有人吐槽:

我们活在 Zoom 创造的虚拟世界里,一天到晚都在 Zoom 中生活。

你以为在家办公可以回归生活了,实际上只是在 Zoom 里模拟人生。

那,能不能 “下线” 摸鱼?

会被老板发现。

不如体面点,造个机器人替我开会,我自己去撸猫猫玩动森。

好主意,美国一位叫 Matt Reed 的老哥说干就干,造出了专用于 Zoom 开会的替身:

Zoombot,Zoom 机器人,已开源,可试用,操作简便,流程一点都不复杂。

如何造出虚拟的我

用地球上已有的技术,要如何造出一个能在视频会议中出现的虚拟人?

要能听懂别人说啥,需要语音转文字、语义理解的技术;

要能回应别人的话,需要具备多轮对话和 TTS 能力;

说话的时候还得对口型和表情,需要用到 GAN;

而且讨论的是工作相关问题,需要准备工作相关业务领域的知识图谱;

如果开会的时候你不在,还需要总结下开会说了啥,老板有没有给自己布置新的任务,需要一个归纳总结的自然语言生成系统;

……

而且,效果一定要逼真,不能出纰漏被老板发现。

天,如果懂得这么多技术,为什么还要上班,自己创业不好嘛?

Matt 也不懂这么多,所以他采用了最简单粗暴的方式:

把自己的视频录下来,再一句一句设定好回复

反正 “职场黑话” 就那么几句,总有人靠 “嗯嗯”“好的”“稍等” 打天下。

于是 Matt 就用录屏软件把自己在电脑前的形象录下来,他用的是 Mac 的 QuickTime 录屏,然后设定回复:

-“你好吗?”
-“谢谢您关心。”

-“你明白了吗?”
-“我听不太清。”

-“拜拜!”
-“嗯嗯,我们之后再聊,大家注意安全。”

之后,设置一个虚拟网络摄像头,然后把 Zoom 的输入设置为这个虚拟网络摄像头,这样开视频会议的时候,传到同事们电脑里的视频就不再是摄像头当场录制的内容,而是 Matt 提前录好的视频了。

这样,有视频,有声音,一个开会机器人就完成了。

难道是负责搞笑的?

现在你可能有点怀疑了:

就这?真能瞒天过海么?当老板是傻子吧?

Matt 在和同事开会的时候试了试,同事们都笑疯了:

的确自动回复了,发言还很积极,但是这一帧一帧的效果、一个词一个词往出蹦的声音,似乎是个娱乐产品哈哈哈哈哈。

不得不说,这位 Matt 老哥,简直是摸鱼界的姜太公、职场稻草人、嘲讽老板大会小会开不停的模范!

见过那么多机器人,这位真是独一无二独领风骚独占鳌头。

出品方竟然是个广告公司

所以,用这个开会机器人糊弄老板的 Matt,现在失业保险领到了么?

你想多了,他可是一位连 Ian Goodfellow 都在关注的技术派创意达人。

就是不知道 “好人” Goodfellow 会不会给他指导一下,把 GAN 加入进来让开会机器人的视频更流畅。

Matt 的这个搞笑的开会机器人,其实是他工作的一部分,他在一家名叫 “红胡椒(redpepper)” 的创意公司担任创意技术专家。

 这个使用椅子的姿势挺有创意的

翻译一下,“创意公司” 大部分是 “提供很有创意的方案的广告公司”,比如你们熟悉的那家以 “开车” 广告闻名的日用产品,这些 “开车” 的创意就来自于广告公司环时互动。

所以,别看 Matt 创造了这么搞笑的神奇玩意儿,人家是在正经工作。

比如说,他们一度真的把 NLP 模型 GPT-2 胡编的那些菜谱给做成了菜。

GPT-2:

炸玉米土豆披萨,主厨小 Ed Berger 最近抓住了这个土豆披萨菜谱,它会很高兴知道它对你也有吸引力。干得好,主厨。作为开胃菜,把它们和 4 片切片草莓放在桌子上,然后一起吃。

红胡椒团队:

GPT-2:

?????????????????(这是菜名)
切 860 个洋葱,切成薄片
切芹菜碎末,切成薄片
香醋,打碎
醋盐,加一小撮辣椒
中草药,最好是刺山柑
50 克非乳制奶酪 + 糖蜜
给最底下的底层或土豆调味
营养成分:3400 磅科尔多瓦
每份容量;17.1 美元甲氧西林 1/2 苹果,粗磨

红胡椒团队:

为难他们了,这洋葱缩水有点严重。

传送门

最后,不瞒你说,这个搞笑的项目已经开源了。

需要的朋友(如果有),可以去 GitHub 自取:

https://github.com/mcreed/zoombot

推荐阅读:
听说玩这些游戏能提升编程能力?GitHub 重磅宣布:私有仓库将对外免费开放,不限人数!
小姐姐用动画图解 Git 命令,这也太秀了吧?!
逛 GitHub 没看过这 10 个开源项目,绝对血亏...霸榜 GitHub:去你丫的算法!

这篇关于被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/532128

相关文章

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

青龙面板2.9之Cdle傻妞机器人编译教程

看到有的朋友对傻妞机器人感兴趣,这里写一下傻妞机器人的编译教程。 第一步,这里以linux amd64为例,去官网下载安装go语言安装包: 第二步,输入下方指令 cd /usr/local && wget https://golang.google.cn/dl/go1.16.7.linux-amd64.tar.gz -O go1.16.7.linux-amd64.tar.gz

示例:推荐一个基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器

一、目的:基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器,感兴趣的可以去下方链接地址查看开源控件库地址。本控件封装的目的在于将第三方库的皮肤和样式封装到皮肤库中可统一设置样式,同时生成nuget方便调用 二、效果如下 三、环境 VS2022 Net7 四、使用方式 1、安装nuget包:H.Con

ULTRAINTERACT 数据集与 EURUS 模型:推动开源大型语言模型在推理领域的新进展

在人工智能的浪潮中,大型语言模型(LLMs)已经成为推动自然语言处理技术发展的关键力量。它们在理解、生成语言以及执行复杂任务方面展现出了巨大的潜力。然而,尽管在特定领域内取得了显著进展,现有的开源LLMs在处理多样化和高难度的推理任务时,仍然难以与最前沿的专有模型相媲美。这一差距不仅限制了开源模型的应用范围,也阻碍了整个领域的发展和创新。 推理任务,特别是那些需要综合运用数学知识、编程技能和逻辑

开源低代码平台,JeecgBoot v3.7.0 里程碑版本发布

项目介绍 JeecgBoot是一款企业级的低代码平台!前后端分离架构 SpringBoot2.x,SpringCloud,Ant Design&Vue3,Mybatis-plus,Shiro,JWT 支持微服务。强大的代码生成器让前后端代码一键生成! JeecgBoot引领低代码开发模式(OnlineCoding-> 代码生成-> 手工MERGE), 帮助解决Java项目70%的重复工作,让开

web前端不可错过的开发工具–Adobe Brackets(开源、简洁强大的HTML、CSS和JavaScript集成开发环境)

Adobe Brackets是一个开源的基于HTML/CSS/JavaScript开发,运行在native shell上的集成开发环境。该项目由Adobe创建和维护,根据MIT许可证发布。提供Windows和OS X平台支持。 Brackets的特点是简约、快捷,没有很多的视图或者面板,它的核心目标是减少在开发过程中那些效率低下的重复性工作,例如浏览器刷新,修改元素的样式,搜索功能等等。

基于动力学的六自由度机器人阻抗恒力跟踪控制

1.整个代码的控制流程图如下: 2.正逆运动学计算 略 3.动力学模型 采用拉格朗日法计算机械臂的动力学模型,其输入的是机械臂的关节角度、角速度和角加速度;其中M、C、G本别是计算的惯性力、科式力和重力项,相关部分如下: 4.RBF神经网络自适应参数调节 采用RBF自适应调节阻抗控制器参数,末端每个方向单独进行参数的调整,其中rbf的输入的是力和位置,输出的是阻抗控制器的参数,rb

论文阅读--Efficient Hybrid Zoom using Camera Fusion on Mobile Phones

这是谷歌影像团队 2023 年发表在 Siggraph Asia 上的一篇文章,主要介绍的是利用多摄融合的思路进行变焦。 单反相机因为卓越的硬件性能,可以非常方便的实现光学变焦。不过目前的智能手机,受制于物理空间的限制,还不能做到像单反一样的光学变焦。目前主流的智能手机,都是采用多摄的设计,一般来说一个主摄搭配一个长焦,为了实现主摄与长焦之间的变焦,目前都是采用数字变焦的方式,数字变焦相比于光学

基于RAG的知识库AI代理机器人,问题思考

基于RAG的知识库AI代理机器人,问题思考 知识库内容分类 对于普通非qa问答格式的知识内容 在分段存储时,需要手动调整,保证每个分段的内容意思完整,不被分割,当然段落也不宜过长,保证内容表达的意思到不可分割为止就行 对于qa问答格式的知识内容 通常需要对问题增加格外索引,因为fastgpt的模式是将问题和回答,作为完整的文本作为向量化的坐标,当问题和回答的内容过长时,使用问题向量化匹配

论坛开源项目推荐(12.25):菜单(Menu)

转自  http://www.cocoachina.com/applenews/devnews/2013/1225/7608.html 更多代码可到CocoaChina代码库查看:http://code.cocoachina.com/   SvpplyTable(可折叠可张开的菜单动画) 允许你简单地创建可折叠可张开的菜单动画效果,灵感来自于Svpply app。不同表格项