被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源

2023-12-24 14:38

本文主要是介绍被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

还记得被视频会议支配的恐惧么?

上一辈的老人在厨房准备香喷喷的食物,下一辈的孩子在一旁开心的玩游戏和玩具,只有你,上半身衣着光鲜头发整齐,下半身穿着睡裤光着脚,在视频会议软件里人模狗样,应付一个接一个无聊的会议主题。

天道有轮回,现在轮到 Work from Home 的歪果人民被视频办公逼疯了。

甚至有人吐槽:

我们活在 Zoom 创造的虚拟世界里,一天到晚都在 Zoom 中生活。

你以为在家办公可以回归生活了,实际上只是在 Zoom 里模拟人生。

那,能不能 “下线” 摸鱼?

会被老板发现。

不如体面点,造个机器人替我开会,我自己去撸猫猫玩动森。

好主意,美国一位叫 Matt Reed 的老哥说干就干,造出了专用于 Zoom 开会的替身:

Zoombot,Zoom 机器人,已开源,可试用,操作简便,流程一点都不复杂。

如何造出虚拟的我

用地球上已有的技术,要如何造出一个能在视频会议中出现的虚拟人?

要能听懂别人说啥,需要语音转文字、语义理解的技术;

要能回应别人的话,需要具备多轮对话和 TTS 能力;

说话的时候还得对口型和表情,需要用到 GAN;

而且讨论的是工作相关问题,需要准备工作相关业务领域的知识图谱;

如果开会的时候你不在,还需要总结下开会说了啥,老板有没有给自己布置新的任务,需要一个归纳总结的自然语言生成系统;

……

而且,效果一定要逼真,不能出纰漏被老板发现。

天,如果懂得这么多技术,为什么还要上班,自己创业不好嘛?

Matt 也不懂这么多,所以他采用了最简单粗暴的方式:

把自己的视频录下来,再一句一句设定好回复

反正 “职场黑话” 就那么几句,总有人靠 “嗯嗯”“好的”“稍等” 打天下。

于是 Matt 就用录屏软件把自己在电脑前的形象录下来,他用的是 Mac 的 QuickTime 录屏,然后设定回复:

-“你好吗?”
-“谢谢您关心。”

-“你明白了吗?”
-“我听不太清。”

-“拜拜!”
-“嗯嗯,我们之后再聊,大家注意安全。”

之后,设置一个虚拟网络摄像头,然后把 Zoom 的输入设置为这个虚拟网络摄像头,这样开视频会议的时候,传到同事们电脑里的视频就不再是摄像头当场录制的内容,而是 Matt 提前录好的视频了。

这样,有视频,有声音,一个开会机器人就完成了。

难道是负责搞笑的?

现在你可能有点怀疑了:

就这?真能瞒天过海么?当老板是傻子吧?

Matt 在和同事开会的时候试了试,同事们都笑疯了:

的确自动回复了,发言还很积极,但是这一帧一帧的效果、一个词一个词往出蹦的声音,似乎是个娱乐产品哈哈哈哈哈。

不得不说,这位 Matt 老哥,简直是摸鱼界的姜太公、职场稻草人、嘲讽老板大会小会开不停的模范!

见过那么多机器人,这位真是独一无二独领风骚独占鳌头。

出品方竟然是个广告公司

所以,用这个开会机器人糊弄老板的 Matt,现在失业保险领到了么?

你想多了,他可是一位连 Ian Goodfellow 都在关注的技术派创意达人。

就是不知道 “好人” Goodfellow 会不会给他指导一下,把 GAN 加入进来让开会机器人的视频更流畅。

Matt 的这个搞笑的开会机器人,其实是他工作的一部分,他在一家名叫 “红胡椒(redpepper)” 的创意公司担任创意技术专家。

 这个使用椅子的姿势挺有创意的

翻译一下,“创意公司” 大部分是 “提供很有创意的方案的广告公司”,比如你们熟悉的那家以 “开车” 广告闻名的日用产品,这些 “开车” 的创意就来自于广告公司环时互动。

所以,别看 Matt 创造了这么搞笑的神奇玩意儿,人家是在正经工作。

比如说,他们一度真的把 NLP 模型 GPT-2 胡编的那些菜谱给做成了菜。

GPT-2:

炸玉米土豆披萨,主厨小 Ed Berger 最近抓住了这个土豆披萨菜谱,它会很高兴知道它对你也有吸引力。干得好,主厨。作为开胃菜,把它们和 4 片切片草莓放在桌子上,然后一起吃。

红胡椒团队:

GPT-2:

?????????????????(这是菜名)
切 860 个洋葱,切成薄片
切芹菜碎末,切成薄片
香醋,打碎
醋盐,加一小撮辣椒
中草药,最好是刺山柑
50 克非乳制奶酪 + 糖蜜
给最底下的底层或土豆调味
营养成分:3400 磅科尔多瓦
每份容量;17.1 美元甲氧西林 1/2 苹果,粗磨

红胡椒团队:

为难他们了,这洋葱缩水有点严重。

传送门

最后,不瞒你说,这个搞笑的项目已经开源了。

需要的朋友(如果有),可以去 GitHub 自取:

https://github.com/mcreed/zoombot

推荐阅读:
听说玩这些游戏能提升编程能力?GitHub 重磅宣布:私有仓库将对外免费开放,不限人数!
小姐姐用动画图解 Git 命令,这也太秀了吧?!
逛 GitHub 没看过这 10 个开源项目,绝对血亏...霸榜 GitHub:去你丫的算法!

这篇关于被 Zoom 逼疯的歪果仁,造出了视频会议机器人,同事已笑疯丨开源的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/532128

相关文章

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

金融业开源技术 术语

金融业开源技术  术语 1  范围 本文件界定了金融业开源技术的常用术语。 本文件适用于金融业中涉及开源技术的相关标准及规范性文件制定和信息沟通等活动。

安全管理体系化的智慧油站开源了。

AI视频监控平台简介 AI视频监控平台是一款功能强大且简单易用的实时算法视频监控系统。它的愿景是最底层打通各大芯片厂商相互间的壁垒,省去繁琐重复的适配流程,实现芯片、算法、应用的全流程组合,从而大大减少企业级应用约95%的开发成本。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。摄像头管理模块用于多种终端设备、智能设备的接入及管理。平台支持包括摄像头等终端感知设备接入,为整个平台提

K8S(Kubernetes)开源的容器编排平台安装步骤详解

K8S(Kubernetes)是一个开源的容器编排平台,用于自动化部署、扩展和管理容器化应用程序。以下是K8S容器编排平台的安装步骤、使用方式及特点的概述: 安装步骤: 安装Docker:K8S需要基于Docker来运行容器化应用程序。首先要在所有节点上安装Docker引擎。 安装Kubernetes Master:在集群中选择一台主机作为Master节点,安装K8S的控制平面组件,如AP

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

HomeBank:开源免费的个人财务管理软件

在个人财务管理领域,找到一个既免费又开源的解决方案并非易事。HomeBank 正是这样一个项目,它不仅提供了强大的功能,还拥有一个活跃的社区,不断推动其发展和完善。 开源免费:HomeBank 是一个完全开源的项目,用户可以自由地使用、修改和分发。用户友好的界面:提供直观的图形用户界面,使得非技术用户也能轻松上手。数据导入支持:支持从 Quicken、Microsoft Money

开源分布式数据库中间件

转自:https://www.csdn.net/article/2015-07-16/2825228 MyCat:开源分布式数据库中间件 为什么需要MyCat? 虽然云计算时代,传统数据库存在着先天性的弊端,但是NoSQL数据库又无法将其替代。如果传统数据易于扩展,可切分,就可以避免单机(单库)的性能缺陷。 MyCat的目标就是:低成本地将现有的单机数据库和应用平滑迁移到“云”端

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

LLM系列 | 38:解读阿里开源语音多模态模型Qwen2-Audio

引言 模型概述 模型架构 训练方法 性能评估 实战演示 总结 引言 金山挂月窥禅径,沙鸟听经恋法门。 小伙伴们好,我是微信公众号《小窗幽记机器学习》的小编:卖铁观音的小男孩,今天这篇小作文主要是介绍阿里巴巴的语音多模态大模型Qwen2-Audio。近日,阿里巴巴Qwen团队发布了最新的大规模音频-语言模型Qwen2-Audio及其技术报告。该模型在音频理解和多模态交互

开源Apache服务器安全防护技术精要及实战

Apache 服务简介   Web服务器也称为WWW服务器或HTTP服务器(HTTPServer),它是Internet上最常见也是使用最频繁的服务器之一,Web服务器能够为用户提供网页浏览、论坛访问等等服务。   由于用户在通过Web浏览器访问信息资源的过程中,无须再关心一些技术性的细节,而且界面非常友好,因而Web在Internet上一推出就得到了爆炸性的发展。现在Web服务器已