OpenAI 研究科学家的 VR 观: 未来的路还很长

2023-11-10 12:59

本文主要是介绍OpenAI 研究科学家的 VR 观: 未来的路还很长,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

[转] http://36kr.com/p/5062616.html

VR曾经一度被炒得很火,但是现在消息并不多。这是为什么?VR的方向又应该在哪里?OpenAI 研究科学家的 VR 观:  未来的路还很长

编者按:VR现在是游戏的天下,这点没有人会不同意。但是这个方向一定对吗?VR的现在又有什么不足?Andrej Karpathy 是斯坦福大学的计算机科学博士,同时也是 OpenAI 的研究科学家,他从自身体验出发,表达了他的观点。

我第一次尝试VR是在20世纪90年代末。那时我还很年轻,所以现在有点儿记不清了。但我记得当时有一个类似研究实验室的地方,到处摆满了各种硬件、电线,中间有一个大椅子,一个大头盔,可以戴下来包裹住你的头。我观看了一段3分钟的演示影片,影片中事物都随着你的移动而移动,还有最基本的通过往下降来吓唬你。当时那个显示器分辨率低,有很强的幻影伪像,反应时间长,整体来说体验相当糟糕。我记得最后终于取下头盔时,我同时感觉到了恶心和…兴奋。当时我心里就想,这就是未来!我当时认为VR将会微型化,视觉保真度将飞速发展,VR设备,holodecks都会有进一步的发展。OpenAI 研究科学家的 VR 观:  未来的路还很长

然而,这些都没有发生。我再也没见过那套设备了。我很少在科技新闻头条中见到VR的身影。我还是不可以通过VR去朋友家玩。对于年轻的我来说,VR变成了尴尬的错误预测,类似的尴尬预测还有“我们肯定很快就会有飞行汽车/ 喷气飞行器的”。最终,关于数字世界的梦想完全从我的脑海中消失。随着时间的推移,我意识到技术进步太容易想象,但太难执行,VR就属于这一类。我必须耐心等待它的到来。OpenAI 研究科学家的 VR 观:  未来的路还很长

快进到2012年,你可以想象我有多兴奋——我看到了Oculus Kickstarter的系列广告。对于我来说这就是梦想成真:有人正在开发消费级的VR设备;Gabe Newell本人也支持这项行动!Starstruck,我兴奋地摸到了“回到项目”的按钮...但后来意识到我忘了自己的Kickstarter密码。我害怕这只是个“蒸汽软件”。他们最终承诺会发布消费者版,我决定等一等。

我不希望这是一个太长的故事。 太长的话就没人愿意去读了:我开始疯狂地检查Oculus的所有更新。它们被Facebook收购。我最终购买了Vive和Oculus消费者版本,然后Reddit上的讨论让我取消了后者。所以在2016年的一个中午,Vive被送到我的门口。我翘了班,打算玩一整天。我住在大学的一个小宿舍里,所以我将几乎所有的东西都从我的房间移动到客厅,以获得足够的空间。最后终于勉强达到要求的最小尺寸的房间规格。OpenAI 研究科学家的 VR 观:  未来的路还很长

难以见到的空房间的景象出现了。一切都清理好了,准备开始体验VR了。我那天玩了Vive大约2个小时,你知道吗?这...很酷。我关掉设备然后回到工作中。

“很酷。”

这是在我把我的Vive给我的朋友演示后,将一遍又一遍地听到的话。我曾A/B测试过我的演示的许多方面:我发布的游戏,它们的顺序,我该如何描述VR及其可能性,但都没有能改变这种反应。我的朋友会用它尝试一些游戏,然后,相当满意地把它还给我。他们坚持认为这“酷”,有些甚至是“惊天动地”,但很明显,他们并不太渴望再来一次。我后来发现,我的几百个朋友(大多数是科学/科技界人士)中,只有一个买了一套VR系统(我差点儿买了两个!几乎浪费了我所有的钱,我对不起博士“工资”)。似乎没有一个朋友很激动(超越很酷的第一次体验),而且不知道为什么,我也没有。OpenAI 研究科学家的 VR 观:  未来的路还很长

现在,我的Vive被遗弃在我房间的角落的一堆线中。我时不时用一次,希望可以体验最新和最伟大的更新,但是大部分时间里都是放在那儿生灰。我确实进行了很多的探索和尝试,所以我觉得我有资格介绍以下VR可以做什么。

VR功能做错了什么

价格过高。

我最早注意到的问题就是VR游戏很贵(比如,最高可能有59.99美元),我的某朋友对VR游戏的评价是很多游戏的“深度不够”。他们只是手机上价值0.99美元的游戏,现在进入VR就要卖29.99美元。我想我大概花了几百美金在这些游戏上了,但是我玩的总时长不超过10小时。还有很多游戏是直接从PC转移过来了,这样做的结果就是用户体验非常糟糕。很多游戏都标价过高,但是质量却非常差(有很多bug),所以最后我都花了大量时间在投诉退款上。幸运的是Steam很快就退款了,大概是知道自己的游戏不值那些钱吧。VR消费者需要特别注意这方面的问题。OpenAI 研究科学家的 VR 观:  未来的路还很长

VR的设计反常规。

我很惊讶有很多开发人员试图忽略新形状因素及其约束,例如,不要转换或旋转(或更糟,加速)相机,因为它会让人感到恶心。也许你认为这是常识,但超过50%的VR游戏中使用了这种加速旋转的镜头。例如,PlayStation VRShark Encounte的一项功能就是让鲨鱼可以猛烈地摇动笼子。说你感觉不到,这是不可能的。

会让人产生恶心的感受。

我还遇到过让视野变得很奇怪的游戏bug。游戏可以从3D视图快速切换“粘贴”到眼前的2D视图,或者会出现屏幕闪烁,或出现任何东西都沿着某个轴短暂地反转,或出现输入眼前的画面会莫名地切换,或出现相机将迅速旋转,或出现一些奇怪的东西。还有些非常糟糕的体验,比如让你不得不取下VR设备或者不得不坐下一段时间,或者放弃了整个晚上。 VR设备断开连接的方式也很奇怪,这可能会导致相机向某些方向随机移动。总之,为相机错误所付出的代价非常高。

如何正确开发VR

我发现,创造被人形容为“很酷”的体验其实不是很难。即使是拥有“脑冲击”的人的数量与平台的成功无关,但是真正困难的是让这个人想要再次有这样的体验。到目前为止,只有几个游戏已经实现了这种情况。它们分为三类:

1.全身体验。这类游戏如AudioShield和Holopoint这样的游戏。通常有一些背景音乐,你必须移动你的身体来完成游戏。我发现这些游戏非常有趣而且可以重复玩,每当我在跳舞/移动/感觉都感到真的很酷。我喜欢这些游戏的另外一个原因就是它们可以让你通过控制器(例如工作模拟器)实现操纵。如果你只使用VR的游戏手柄,那么你会错过很多美好的东西。

OpenAI 研究科学家的 VR 观:  未来的路还很长2.创意体验。这类游戏如TiltBrush等其他可以在这种新的形式下表现出创造力的app。TiltBrush就像过去的MSPaint一样,只有最基本的工具和功能,但我相信这样的应用程序还有很多潜力。

OpenAI 研究科学家的 VR 观:  未来的路还很长3.社交体验。这类有AltspaceVR,Rec Room, Keep Talking以及Nobody Explodes。这些体验最棒的是,开发者不必做太多复杂的事情就可以导入游戏,免去艰苦的工作。他们所要做的就是让人们参与进来,这些app的社交属性创造出了复杂性和可重复性。我在AltspaceVR度过了很多有趣的时间:在模拟的客厅里观看预定的视频,与人一起跳舞等。我在Altspace遇到了一个现实生活中的朋友,我们去散步,对着彼此投掷物体,这非常赞。OpenAI 研究科学家的 VR 观:  未来的路还很长

在我看来,能够吸引人的VR产品必须具备以上这些功能,最理想的就是能够综合具备以上所有功能。它们将可以连接多人,可以让用户创造和分享,并以创造性的方式实现全身体验。

什么是VR?

如果你看如今VR创造的体验,你就会发现,大多都是游戏。例如,我今天查看了100个“新发布”的VR,100%都是游戏。这可能是因为游戏可以更容易或更快地开发出来。

VR为游戏而建,就像PC是为游戏、电子表格或搜索烹饪食谱一样而建。

众所周知,预测未来新技术的使用非常困难。在1980年代,PC软件都是游戏和个人金融应用。有趣的是,今天所有的动作都是在一个单一的二进制应用程序(浏览器)中运行的,但我们看一看20个最流行的网站就能够发现他们集合了人类的基本需求:

信息:“我想知道一点儿事”

谷歌,YouTube,维基百科,Stack Overflow

社会/沟通:“我想和某人说话”

Google(gmail),Facebook,Twitter,Instagram

娱乐:“我想被逗乐”

YouTube,Reddit

但是特别的是这里最有价值的公司与游戏都没有什么关系,他们的所有产品都可以免费使用。 PC游戏市场仍然在那里,也运行良好,其在2016年的市场价值约为36亿美元,其中大部分是免费的在线游戏。我们可以看到移动市场反映出了类似的趋势。再看看最常用的应用程序:

信息:“我想知道一点儿事”

Google地图/搜索

社会/沟通:“我想和某人说话”

Facebook,Messenger,Snapchat,Instagram,WhatsApp,Gmail,Instagram

娱乐:“我想被逗乐”

YouTube,Pandora,Netflix,Spotify,苹果音乐

我们再次看,这里面只有很少的游戏,并且都是免费应用,其中几个应用程序展现出独特的优势以区分其现有的形式,如地图(GPS,指南针,...),特别是照片共享(照相机)。

长话短说,VR目前最常见的形式是游戏,但看看上面的趋势,我觉得通过游戏发展VR似乎不太可能。OpenAI 研究科学家的 VR 观:  未来的路还很长

这些都给了我们什么?

那么未来的VR是什么样的呢?从炒作曲线的角度来说,人们可能会认为在90年代的期望峰值之后,VR终于处于缓慢攀升的阶段了。但是我认为,某些技术(特别是上面的1)非常容易预测以及2)潜在影响力非常大)无论在这个领域发生了什么都可以经历多个周期。没有人想错过任何时候都可能出现的几百美金的B波。我认为我们现在的情况是:OpenAI 研究科学家的 VR 观:  未来的路还很长

AR(我非常了解的领域)也属于“容易预测和潜在影响力非常大”的类别,并且类似地经历了几个时期,然后是“AI冬天”。

为什么还没有?尽管VR可以让我像孩子一般地兴奋,但是在短期内,我对VR都较悲观。这里面还存在太多的问题。 VR不像电视在后台运行,你可以离开与朋友聊天或做饭吃饭。它不像一个手机,我可以放在周围,随便一瞥,就能得到一些即时满足。今天,VR是一个活动(你必须通过长序的非默认操作才能进入),它切断你与周围环境的联系,任何中断都是昂贵的(例如我打电话,或我需要吃或使用洗手间),同时VR也让你看起来相当傻。无法避免被冠上书呆子的称号,这件事情几年内都不能解决。OpenAI 研究科学家的 VR 观:  未来的路还很长

当它发生时。在中期(例如十年或二十年),我可以料想我们在硬件上取得了很大的进步,并解决了上述许多问题。例如,我们可以将VR做到脸手跟踪,高视觉保真度,极低跟踪误差率,外形像Ray-Ban太阳镜一样,让你看起来很酷,可以轻易地就体验到了。如果是这样,我有信心做出VR相关的杀手级应用程序的预测,包括:

  • 将具有上述特征(提供在现有技术上尚未“足够好”的功能,如身体/面部跟踪以及交互;允许用户创建和共享;社交第一)。

  • 免费。价格不再是59.99美金。你也可以以其他方式支付,比如付9.99美金买一个傻傻的周边帽子,或你的隐私。

  • 它将满足我们在一段时间内不断重复的基本人类需求:“我想知道一些事儿”,“我想和某人谈话”和“我想被逗乐”。它不会是任何具体的游戏。

或者,更有趣的是,可能是一款B2B的杀手级应用,如启用远程机器人工作,其中工人的命令被记录,并成为自主机器人系统训练的数据。这是我关于AI的短期内预测的核心部分,我可以到此为止了。

长远来看,有多少可能存在这样一个引人注目的平行数字宇宙(例如Ready Player One风格)世界,在那里人类好的那一部分将成为他们生活中的很大一部分。在这个时间尺度上,我相对乐观。毕竟,当AI在做所有的工作时,我们将需要在社交娱乐和游戏等形式上有一些人工困难。开玩笑——我认为这是结束一篇文章非常好的方式。

翻译来自:虫洞翻翻 译者ID:YLS


这篇关于OpenAI 研究科学家的 VR 观: 未来的路还很长的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/382776

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟 开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚 第一站:海量资源,应有尽有 走进“智听

国产游戏行业的崛起与挑战:技术创新引领未来

国产游戏行业的崛起与挑战:技术创新引领未来 近年来,国产游戏行业蓬勃发展,技术水平不断提升,许多优秀作品在国际市场上崭露头角。从画面渲染到物理引擎,从AI技术到服务器架构,国产游戏已实现质的飞跃。然而,面对全球游戏市场的激烈竞争,国产游戏技术仍然面临诸多挑战。本文将探讨这些挑战,并展望未来的机遇,深入分析IT技术的创新将如何推动行业发展。 国产游戏技术现状 国产游戏在画面渲染、物理引擎、AI

一种改进的red5集群方案的应用、基于Red5服务器集群负载均衡调度算法研究

转自: 一种改进的red5集群方案的应用: http://wenku.baidu.com/link?url=jYQ1wNwHVBqJ-5XCYq0PRligp6Y5q6BYXyISUsF56My8DP8dc9CZ4pZvpPz1abxJn8fojMrL0IyfmMHStpvkotqC1RWlRMGnzVL1X4IPOa_  基于Red5服务器集群负载均衡调度算法研究 http://ww

生信圆桌x生信分析平台:助力生物信息学研究的综合工具

介绍 少走弯路,高效分析;了解生信云,访问 【生信圆桌x生信专用云服务器】 : www.tebteb.cc 生物信息学的迅速发展催生了众多生信分析平台,这些平台通过集成各种生物信息学工具和算法,极大地简化了数据处理和分析流程,使研究人员能够更高效地从海量生物数据中提取有价值的信息。这些平台通常具备友好的用户界面和强大的计算能力,支持不同类型的生物数据分析,如基因组、转录组、蛋白质组等。

开题报告中的研究方法设计:AI能帮你做什么?

AIPaperGPT,论文写作神器~ https://www.aipapergpt.com/ 大家都准备开题报告了吗?研究方法部分是不是已经让你头疼到抓狂? 别急,这可是大多数人都会遇到的难题!尤其是研究方法设计这一块,选定性还是定量,怎么搞才能符合老师的要求? 每次到这儿,头脑一片空白。 好消息是,现在AI工具火得一塌糊涂,比如ChatGPT,居然能帮你在研究方法这块儿上出点主意。是不

研究人员在RSA大会上演示利用恶意JPEG图片入侵企业内网

安全研究人员Marcus Murray在正在旧金山举行的RSA大会上公布了一种利用恶意JPEG图片入侵企业网络内部Windows服务器的新方法。  攻击流程及漏洞分析 最近,安全专家兼渗透测试员Marcus Murray发现了一种利用恶意JPEG图片来攻击Windows服务器的新方法,利用该方法还可以在目标网络中进行特权提升。几天前,在旧金山举行的RSA大会上,该Marcus现场展示了攻击流程,

未来工作趋势:零工小程序在共享经济中的作用

经济在不断发展的同时,科技也在飞速发展。零工经济作为一种新兴的工作模式,正在全球范围内迅速崛起。特别是在中国,随着数字经济的蓬勃发展和共享经济模式的深入推广,零工小程序在促进就业、提升资源利用效率方面显示出了巨大的潜力和价值。 一、零工经济的定义及现状 零工经济是指通过临时性、自由职业或项目制的工作形式,利用互联网平台快速匹配供需双方的新型经济模式。这种模式打破了传统全职工作的界限,为劳动

Science Robotics 首尔国立大学研究团队推出BBEX外骨骼,实现多维力量支持!

重复性举起物体可能会对脊柱和背部肌肉造成损伤,由此引发的腰椎损伤是工业环境等工作场所中一个普遍且令人关注的问题。为了减轻这类伤害,有研究人员已经研发出在举起任务中为工人提供辅助的背部支撑装置。然而,现有的这类装置通常无法在非对称性的举重过程中提供多维度的力量支持。此外,针对整个人体脊柱的设备安全性验证也一直是一个缺失的环节。 据探索前沿科技边界,传递前沿科技成果的X-robot投稿,来自首尔国立

AI模型的未来之路:全能与专精的博弈与共生

人工智能(AI)领域正迅速发展,伴随着技术的不断进步,AI模型的应用范围也在不断扩展。当前,AI模型的设计和使用面临两个主要趋势:全能型模型和专精型模型。这两者之间的博弈与共生将塑造未来的AI技术格局。本文将从以下七个方面探讨AI模型的未来之路,并提供实用的代码示例,以助于研究人员和从业者更好地理解和应用这些技术。 一、AI模型的全面评估与比较 1.1 全能型模型 全能型AI模型旨在在多