撕开黑幕!AI担任拳击比赛裁判;思维导图工程图表工具大合辑;CVPR视觉-语言的预训练最新进展;游戏开发资源列表;前沿论文 | ShowMeAI资讯日报

本文主要是介绍撕开黑幕!AI担任拳击比赛裁判;思维导图工程图表工具大合辑;CVPR视觉-语言的预训练最新进展;游戏开发资源列表;前沿论文 | ShowMeAI资讯日报,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

👀日报合辑 | 📆电子月刊 | 🔔公众号下载资料 | 🍩@韩信子

📢 DeepStrike:人工智能担任拳击比赛裁判

https://superinnovators.com/2022/10/ai-boxing-judge/

拳击评分容易出现人为错判、腐败或法官带有偏见的故意操纵。2016 年里约奥运会拳击锦标赛就被调查发现了贿赂的证据。丹麦初创公司 Jabbr 的机器学习工程师开发了一个名为 DeepStrike 的 AI 模型,自动分析了使用摄像头分析拳击比赛的性能。

DeepStrike 使用深度学习来衡量 50 个指标,包括出拳类型、出拳落点、质量、步法、侵略性、压力等。这项创新可用于取代拳击裁判,确保结果公平,也可以为运动员提供训练数据统计与分析,帮助提升运动员成绩。

工具&框架

🚧 『WeTextProcessing』为中文设计的文本规则化和文本反规则化工具包

https://github.com/wenet-e2e/WeTextProcessing

WeTextProcessing 是一个为中文设计的,可以把文本规则化(比如一些阿拉伯数字的日期、时间和数量转化为中文)和反规则化的工具包。

🚧 『Python Outlier Detection Thresholding (PyThresh)』 Python离群点检测阈值决策库

https://github.com/KulikDM/pythresh

PyThresh 是一个 Python 工具包,用于对单变量/多变量数据中的离群点检测分数进行阈值化。它可以与 PyOD 协同工作,具有类似的语法和数据结构,区别在于 PyThresh 是用来对离群点检测产生的分数进行阈值处理的,它不需要设置边界阈值,也无需定义异常值数量。

这个工具库下的离群点检测分数遵循这个规则:分数越高,它是数据集中的离群点的概率就越高。所有的阈值函数都返回一个二进制数组,其中 liers 和 outliers 分别用 0 和 1 表示。

PyThresh 包括 30 多种阈值处理算法。这些算法的范围从使用简单的统计分析(如Z-score)到涉及图论和拓扑学的更复杂的数学方法。

🚧 『Zshot』零样本和少样本命名实体识别与关系识别

https://github.com/IBM/zshot

https://ibm.github.io/zshot/

Zshot 是一个高度可定制的框架,用于零样本和少样本的命名实体识别。可以在指代抽取、将文本指代与维基百科中的实体联系起来等场景发挥作用。

🚧 『CORL (Clean Offline Reinforcement Learning)』最新强化学习算法的单文件高质量实现

https://github.com/tinkoff-ai/CORL

CORL 是一个离线强化学习库,为 SOTA ORL 算法提供了高质量和易于理解的单文件实现。每个实现都有一个便于研究的代码库支持,能运行或调整成千上万的实验。

博文&分享

👍 『Serverless ML』从模型和特征开始,构建AI预测Serverless机器学习应用·课程

https://github.com/featurestoreorg/serverless-ml-course

无需成为 Kubernetes 或云计算方面的专家,即可构建端到端服务,并借助 ML 模型做出智能决策。无服务器 ML 可以轻松构建使用 ML 模型进行预测的系统。

只需要能够编写可以作为管道运行的 Python 程序,管道生成的功能和模型由无服务器功能存储/模型注册表管理。课程还将展示如何通过编写 Python 和一些 HTML 来构建 UI。课程包括以下模块:

  • Pandas and ML Pipelines in Python, Write your first serverless App(Python 中的 Pandas 和 ML 管道,编写你的第一个无服务器应用程序
  • Data modeling and the Feature Store, The Credit-card fraud prediction service(数据建模和特征存储,信用卡欺诈预测服务
  • Training Pipelines, Inference Pipelines, and the Model Registry(训练管道、推理管道和模型注册表
  • Bring a Prediction Service to Life with a User Interface(通过用户界面实现预测服务
  • Automated Testing and Versioning of features and models(功能和模型的自动化测试和版本控制
  • Real-time serverless machine learning systems, Project presentation(实时无服务器机器学习系统,项目介绍

👍 『Recent Advanced in Vision-and-Language Pre-training』CVPR2022 Tutorial | 视觉-语言的预训练 · 最新进展

https://vlp-tutorial.github.io/2022/

人类通过许多渠道感知世界,例如眼睛看到的图像或耳朵听到的声音。尽管任何单个通道都可能不完整或嘈杂,但人类可以自然地对齐和融合从多个通道收集的信息,以便掌握更好地理解世界所需的关键概念。

人工智能的核心愿望之一是开发算法,使计算机能够有效地从多模态(或多通道)数据中学习。这些数据类似于从视觉和语言中获得的视觉和声音,帮助人类理解我们周围的世界。视觉-语言 (Vision-and-Language,VL) 是一个受欢迎的研究领域,位于计算机视觉和自然语言处理 (NLP) 的结合处,旨在实现这一目标。

受 NLP 中语言模型预训练的巨大成功的启发,视觉和语言预训练(VLP)最近引起了关注。在本教程中,我们将介绍 VLP 前沿的最新方法和原则,包括:

  • 基于区域特征和端到端图像文本预训练
  • 统一的视觉语言建模
  • 扩展到视频语言预训练
  • 从语言监督中学习视觉模型
  • 视觉合成

数据&资源

🔥 『Awesome Diagramming』软件工程团队图表工具大列表

https://github.com/shubhamgrg04/awesome-diagramming

图表可以提供软件设计高级概览,序列图、系统架构图、ER图、甘特图等是工程团队使用最广泛的图表。Repo 考虑了免费、开源、便捷、代码/手绘、视觉外观等要素,汇总了最常用的可视化图表软件。

🔥 『Awesome-Game』游戏开发资源大列表

https://github.com/killop/anything_about_game

这是一份游戏开发资源的大列表,囊括了非常丰富的内容!以下选取部分主题,有需求的读者可以访问上方GitHub连接:

  • News(新闻
  • Person/Social/Blogs(人物/社交/博客
  • Game-Company(游戏公司
  • Game-Asset(游戏资产
  • Game-Design-Tool(游戏设计工具
  • Animation(动画
  • 3D Rendering Software/Plugin(3D 渲染软件/插件
  • Game-Server-framework(游戏服务器框架
  • AI-ML(人工智能-机器学习
  • File Systems(文件系统
  • GameEngine Design(游戏引擎设计
  • GameAI(游戏人工智能
  • Game-Math(游戏数学
  • Game-BenchMark/Metric/Tool(游戏基准/公制/工具
  • ComputerGraphics && Shading(计算机图形 && 阴影
  • DataStruct-Algorithms(数据结构与算法
  • 文案排版
  • 游戏策划
  • ······

研究&论文

可以点击 这里 回复关键字 日报,免费获取整理好的论文合辑。

科研进展

  • 2022.09.27 『文本生成』 EditEval: An Instruction-Based Benchmark for Text Improvements
  • 2022.10.04 『音频分类』 Learning the Spectrogram Temporal Resolution for Audio Classification
  • 2022.10.04 『表征学习』 One Transformer Can Understand Both 2D & 3D Molecular Data

⚡ 论文:EditEval: An Instruction-Based Benchmark for Text Improvements

论文时间:27 Sep 2022

领域任务:Text Generation,文本生成

论文地址:https://arxiv.org/abs/2209.13331

代码实现:https://github.com/facebookresearch/editeval

论文作者:Jane Dwivedi-Yu, Timo Schick, Zhengbao Jiang, Maria Lomeli, Patrick Lewis, Gautier Izacard, Edouard Grave, Sebastian Riedel, Fabio Petroni

论文简介:Evaluation of text generation to date has primarily focused on content created sequentially, rather than improvements on a piece of text./迄今为止,对文本生成的评价主要集中在按顺序创建的内容上,而不是对一段文本的改进。

论文摘要:迄今为止,对文本生成的评价主要集中在按顺序创建的内容上,而不是对一段文本的改进。然而,写作自然是一个迭代和增量的过程,需要不同模块技能的专业知识,如修复过时的信息或使风格更加一致。即便如此,对一个模型执行这些技能的能力和编辑能力的全面评价仍然是稀缺的。我们提出了EditEval:一个基于指令的基准和评估套件,利用高质量的现有和新的数据集来自动评估编辑能力,如使文本更有凝聚力和改写。我们评估了几个预训练的模型,这表明InstructGPT和PEER表现最好,但大多数基线都低于监督的SOTA,特别是在中和和更新信息时。我们的分析还表明,常用的编辑任务指标并不总是有很好的相关性,对具有最高性能的提示的优化并不一定意味着对不同模型有最强的鲁棒性。通过发布这个基准和一个公开的排行榜挑战,我们希望能开启未来的研究,开发出能够进行迭代和更可控的编辑的模型。

⚡ 论文:Learning the Spectrogram Temporal Resolution for Audio Classification

论文时间:4 Oct 2022

领域任务:Audio Classification, Classification,音频分类分类

论文地址:https://arxiv.org/abs/2210.01719

代码实现:https://github.com/haoheliu/diffres-python

论文作者:Haohe Liu, Xubo Liu, Qiuqiang Kong, Wenwu Wang, Mark D. Plumbley

论文简介:Starting from a high-temporal-resolution spectrogram such as one-millisecond hop size, we show that DiffRes can improve classification accuracy with the same computational complexity./从高时间分辨率的频谱图开始,如一毫秒的跳动大小,我们表明DiffRes可以在相同的计算复杂度下提高分类精度。

论文摘要:音频频谱图是一种时间-频率表示,已被广泛用于音频分类。频谱图的时间分辨率取决于跳数大小。以前的工作一般认为跳数应该是一个恒定的值,如10毫秒。然而,对于不同类型的声音,固定的跳跃大小或分辨率并不总是最佳的。本文提出了一种新的方法,即DiffRes,它能使可区分的时间分辨率学习,以提高音频分类模型的性能。给定一个用固定跳数计算的频谱图,DiffRes合并非必要的时间帧,同时保留重要的帧。DiffRes作为音频谱图和分类器之间的一个 "插入 "模块,可以进行端到端的优化。我们在Mel-spectrogram上评估了DiffRes,然后是最先进的分类器骨架,并将其应用于五个不同的子任务。与使用固定分辨率的mel-spectrogram相比,基于DiffRes的方法可以在特征层面减少至少25%的时间维度的情况下达到相同或更好的分类精度,这同时也减轻了计算成本。从高时间分辨率的频谱图开始,如一毫秒的跳动大小,我们表明DiffRes可以在相同的计算复杂性下提高分类精度。

⚡ 论文:One Transformer Can Understand Both 2D & 3D Molecular Data

论文时间:4 Oct 2022

领域任务:Graph Regression, Representation Learning,图回归表征学习

论文地址:https://arxiv.org/abs/2210.01765

代码实现:https://github.com/lsj2408/Transformer-M

论文作者:Shengjie Luo, Tianlang Chen, Yixian Xu, Shuxin Zheng, Tie-Yan Liu, LiWei Wang, Di He

论文简介:To achieve this goal, in this work, we develop a novel Transformer-based Molecular model called Transformer-M, which can take molecular data of 2D or 3D formats as input and generate meaningful semantic representations./为了实现这一目标,在这项工作中,我们开发了一种新型的基于Transformer的分子模型,称为Transformer-M,它可以将二维或三维格式的分子数据作为输入,并生成有意义的语义表示。

论文摘要:与通常具有独特格式的视觉和语言数据不同,分子可以自然地使用不同的化学配方来描述。人们可以把分子看作是一个二维图形,或者把它定义为位于三维空间中的原子集合。对于分子表征的学习,以前的大多数工作只为特定的数据格式设计了神经网络,使得学到的模型对其他数据格式可能会失败。我们认为一个通用的化学神经网络模型应该能够处理跨数据模式的分子任务。为了实现这一目标,在这项工作中,我们开发了一个新的基于Transformer的分子模型,称为Transformer-M,它可以将二维或三维格式的分子数据作为输入,并产生有意义的语义表示。使用标准的Transformer作为骨干架构,Transformer-M开发了两个分离的通道来编码二维和三维结构信息,并将它们与网络模块中的原子特征结合起来。当输入的数据为特定格式时,相应的通道将被激活,而另一个通道将被禁用。通过对具有适当设计的监督信号的二维和三维分子数据进行训练,Transformer-M自动学会利用来自不同数据模式的知识,并正确捕捉表征。我们对Transformer-M进行了广泛的实验。所有的经验结果表明,Transformer-M可以同时在二维和三维任务上取得强大的性能,这表明它具有广泛的适用性。代码和模型将在https://github.com/lsj2408/Transformer-M 上公开。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!

◉ 点击 日报合辑,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。

◉ 点击 电子月刊,快速浏览月度合辑。

◉ 点击 这里 ,回复关键字 日报 免费获取AI电子月刊与论文 / 电子书等资料包。

这篇关于撕开黑幕!AI担任拳击比赛裁判;思维导图工程图表工具大合辑;CVPR视觉-语言的预训练最新进展;游戏开发资源列表;前沿论文 | ShowMeAI资讯日报的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/316528

相关文章

如何突破底层思维方式的牢笼

我始终认为,牛人和普通人的根本区别在于思维方式的不同,而非知识多少、阅历多少。 在这个世界上总有一帮神一样的人物存在。就像读到的那句话:“人类就像是一条历史长河中的鱼,只有某几条鱼跳出河面,看到世界的法则,但是却无法改变,当那几条鱼中有跳上岸,进化了,改变河道流向,那样才能改变法则。”  最近一段时间一直在不断寻在内心的东西,同时也在不断的去反省和否定自己的一些思维模式,尝试重

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

一道经典Python程序样例带你飞速掌握Python的字典和列表

Python中的列表(list)和字典(dict)是两种常用的数据结构,它们在数据组织和存储方面有很大的不同。 列表(List) 列表是Python中的一种有序集合,可以随时添加和删除其中的元素。列表中的元素可以是任何数据类型,包括数字、字符串、其他列表等。列表使用方括号[]表示,元素之间用逗号,分隔。 定义和使用 # 定义一个列表 fruits = ['apple', 'banana

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

高仿精仿愤怒的小鸟android版游戏源码

这是一款很完美的高仿精仿愤怒的小鸟android版游戏源码,大家可以研究一下吧、 为了报复偷走鸟蛋的肥猪们,鸟儿以自己的身体为武器,仿佛炮弹一样去攻击肥猪们的堡垒。游戏是十分卡通的2D画面,看着愤怒的红色小鸟,奋不顾身的往绿色的肥猪的堡垒砸去,那种奇妙的感觉还真是令人感到很欢乐。而游戏的配乐同样充满了欢乐的感觉,轻松的节奏,欢快的风格。 源码下载

【新闻】AI程序员要来了吗?阿里云官宣

内容提要 6 月 21 日,在阿里云上海 AI 峰会上,阿里云宣布推出首个AI 程序员。 据介绍,这个AI程序员具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。 近段时间以来,有关AI的实践应用突破不断,全球开发者加速研发步伐。有业内人士坦言,随着大模型性能逐渐提升,AI应