100+开箱即用的AI工具箱;程序员150岁长寿指南;『地理空间数据科学』课程资料;Graphic数据可视化图表库;前沿论文 | ShowMeAI资讯日报

本文主要是介绍100+开箱即用的AI工具箱;程序员150岁长寿指南;『地理空间数据科学』课程资料;Graphic数据可视化图表库;前沿论文 | ShowMeAI资讯日报,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

工具&框架

🚧 『Lite.AI.ToolKit』开箱即用的C++ AI工具箱

https://github.com/DefTruth/lite.ai.toolkit

Lite.Ai.ToolKit 是一个根据个人兴趣整理的C++工具箱,包括 100+ 流行的开源 AI 模型,盖目标检测、人脸检测、人脸识别、语义分割、抠图等领域。对用户友好,开箱即用。

🚧 『Colossal AI』整合高效并行技术的 AI 大模型训练系统

https://github.com/hpcaitech/ColossalAI

Colossal AI 提供了一系列并行训练组件,提供的工具可以在几行代码内快速开始分布式训练和推理,使其像普通的单GPU模型一样简单。

🚧 『solo-learn』Pytorch Lightning 无监督视觉表示学习自监督方法库

https://github.com/lavoiems/simplicial-embeddings

本 Repo 是『Simplicial Embeddings for Self-supervised Learning and Downstream Classification』一文的配套代码,是自我监督学习库『solo-learn』的一个分支。

🚧 『DeepVision3D』点云理解的开源工具箱

https://github.com/dvlab-research/DeepVision3D

DeepVision3D 是 Deep Vision Lab 开发的用于点云理解的开源工具箱,集成了流行的公开 3D 代码库,包括OpenPCDet、 MMDetection3D,并开发了 DVClassification 和 DVSegmentation,以促进对室外/室内物体检测、形状分类和语义分割等多种 3D 理解任务的研究。

🚧 『Graphic』数据可视化图表工具库

https://github.com/entronad/graphic

Graphic 是一个数据可视化语法和 Flutter 图表库,对美感和实用性做了很好的平衡,并且具有高度交互性和可定制性,可以轻松定制自己的元素、工具提示、注释等。

博文&分享

👍 『多传感器定位融合』学习笔记

https://github.com/kahowang/sensor-fusion-for-localization-and-mapping

👍 『健康学习到150岁』人体系统调优不完全指南

https://github.com/zijie0/HumanSystemOptimization

https://hubermanlab.com/

通过一系列的学习,逐渐有种学习了各种人类的“组成和操作原理”的感觉。通过一系列的工具和实践,我们也可以像调优软件程序那样来“调优”我们自身的人体系统。这篇文章就来介绍睡眠、饮食、心态与动力、学习与专注、长寿等相关的知识内容。

数据&资源

🔥 『SOTA Deep Anomaly Detection』最新异常检测算法实现大列表

https://github.com/GuansongPang/SOTA-Deep-Anomaly-Detection

Repo 是文献中 SOTA 深度异常检测方法的实现集合,持续更新中。

🔥 『Geospatial Data Science』地理空间数据科学·课程资料

https://github.com/mszell/geospatialdatascience

https://learnit.itu.dk/local/coursebase/view.php?ciid=940

本 Repo 是课程『Geospatial Data Science』的学习资料,课程介绍了基于数据科学的地理空间数据分析方法,包括GIS的数据结构和原理、地图投影和测量、收集和预处理大规模地理空间数据、最先进的 GDS 计算工具、空间网络分析、地理空间数据科学家可用的主要方法、这些技术在应用环境中的实际应用等。

研究&论文

可以点击 这里 回复关键字日报,免费获取整理好的论文合辑。

科研进展

  • 2022.07.08 『计算机视觉』 An Improved One millisecond Mobile Backbone
  • 2022.07.26 『计算机视觉』 Monocular 3D Object Detection with Depth from Motion
  • 2022.07.27 『计算机视觉』 AvatarPoser: Articulated Full-Body Pose Tracking from Sparse Motion Sensing
  • 2022.07.25 『计算机视觉』 CelebV-HQ: A Large-Scale Video Facial Attributes Dataset

⚡ 论文:An Improved One millisecond Mobile Backbone

论文时间:8 Jun 2022

所属领域计算机视觉

对应任务:Image Classification,object-detection,Object Detection,Semantic Segmentation,图像分类,物体检测,目标检测,语义分割

论文地址:https://arxiv.org/abs/2206.04040

代码实现:https://github.com/apple/ml-mobileone,https://github.com/federicopozzi33/MobileOne-PyTorch

论文作者:Pavan Kumar Anasosalu Vasu, James Gabriel, Jeff Zhu, Oncel Tuzel, Anurag Ranjan

论文简介:Furthermore, we show that our model generalizes to multiple tasks - image classification, object detection, and semantic segmentation with significant improvements in latency and accuracy as compared to existing efficient architectures when deployed on a mobile device./此外,我们还表明,我们的模型可以通用于多种任务–图像分类、物体检测和语义分割,与现有的高效架构相比,部署在移动设备上的延迟和准确性都有明显的改善。

论文摘要:用于移动设备的高效神经网络骨干通常针对FLOPs或参数计数等指标进行优化。然而,当部署在移动设备上时,这些指标可能与网络的延迟没有什么关联。因此,我们通过在移动设备上部署几个适合移动的网络,对不同的指标进行了广泛的分析。我们识别并分析了近期高效神经网络的架构和优化瓶颈,并提供了缓解这些瓶颈的方法。为此,我们设计了一个高效的骨干网络MobileOne,其变体在iPhone12上的推理时间低于1毫秒,在ImageNet上的准确率高达75.9%。我们表明,MobileOne在高效的架构中实现了最先进的性能,同时在移动端上快了许多倍。我们最好的模型在ImageNet上获得了与MobileFormer相似的性能,同时速度快了38倍。在相似的延迟下,我们的模型在ImageNet上获得了比EfficientNet高出2.3%的最高准确率。此外,我们还表明,我们的模型可以通用于多种任务–图像分类、对象检测和语义分割,与现有的高效架构相比,在部署在移动设备上时,延迟和准确率都有明显的改善。

⚡ 论文:Monocular 3D Object Detection with Depth from Motion

论文时间:26 Jul 2022

所属领域:计算机视觉

对应任务:3D Object Detection,Depth Estimation,Monocular 3D Object Detection,object-detection,Object Detection,三维物体检测,深度估计,单目三维物体检测,物体检测,物体检测

论文地址:https://arxiv.org/abs/2207.12988

代码实现:https://github.com/tai-wang/depth-from-motion

论文作者:Tai Wang, Jiangmiao Pang, Dahua Lin

论文简介:Perceiving 3D objects from monocular inputs is crucial for robotic systems, given its economy compared to multi-sensor settings./从单目输入中感知3D物体对机器人系统至关重要,因为与多传感器设置相比,它更经济。

论文摘要:从单目输入感知三维物体对于机器人系统来说是至关重要的,因为与多传感器设置相比,它是经济的。这是很困难的,因为单一图像不能为预测绝对深度值提供任何线索。在双目3D物体检测方法的启发下,我们利用摄像机自我运动提供的强大几何结构来进行准确的物体深度估计和检测。我们首先对这个一般的双视角案例进行了理论分析,并注意到两个挑战。1)多个估计的累积误差使直接预测难以实现;2)由静态摄像机和匹配模糊性造成的固有困境。因此,我们建立了具有几何感知成本量的立体对应关系,作为深度估计的替代方法,并进一步用单眼理解来补偿它,以解决第二个问题。我们的框架被命名为 “来自运动的深度”(DfM),然后使用所建立的几何体将二维图像特征提升到三维空间,并检测其中的三维物体。我们还提出了一个无姿态的DfM,以使其在摄像机姿态不可用时也能使用。我们的框架在KITTI基准上以很大的幅度超越了最先进的方法。详细的定量和定性分析也验证了我们的理论结论。代码将发布在https://github.com/Tai-Wang/Depth-from-Motion 。

⚡ 论文:AvatarPoser: Articulated Full-Body Pose Tracking from Sparse Motion Sensing

论文时间:27 Jul 2022

所属领域:计算机视觉

对应任务:Mixed Reality,Pose Estimation,Pose Tracking,混合现实,姿势估计,姿势跟踪

论文地址:https://arxiv.org/abs/2207.13784

代码实现:https://github.com/eth-siplab/avatarposer

论文作者:Jiaxi Jiang, Paul Streli, Huajian Qiu, Andreas Fender, Larissa Laich, Patrick Snape, Christian Holz

论文简介:In this paper, we present AvatarPoser, the first learning-based method that predicts full-body poses in world coordinates using only motion input from the user’s head and hands./在本文中,我们介绍了AvatarPoser,这是第一个基于学习的方法,只用用户的头和手的运动输入就能预测世界坐标中的全身姿势。

论文摘要:今天的混合现实头戴式显示器追踪用户在世界空间中的头部姿势,以及用户在增强现实和虚拟现实场景中的双手互动。虽然这足以支持用户的输入,但不幸的是,它将用户的虚拟表现仅仅局限于他们的上半身。因此,目前的系统求助于浮动的虚拟化身,其局限性在协作环境中尤为明显。为了从稀疏的输入源中估计全身的姿势,先前的工作在骨盆或下半身加入了额外的跟踪器和传感器,这增加了设置的复杂性并限制了在移动环境中的实际应用。在本文中,我们提出了AvatarPoser,这是第一个基于学习的方法,只用用户的头和手的运动输入就能预测世界坐标中的全身姿势。我们的方法建立在Transformer编码器的基础上,从输入信号中提取深层特征,并将全局运动与学习的局部关节方向解耦,以指导姿势估计。为了获得类似于运动捕捉动画的准确的全身运动,我们使用反运动学的优化程序来完善手臂关节的位置,以匹配原始跟踪输入。在我们的评估中,AvatarPoser在大型运动捕捉数据集(AMASS)的评估中取得了新的最先进的结果。同时,我们的方法的推理速度支持实时操作,为Metaverse应用提供了一个实用的界面来支持整体的虚拟化身控制和表现。

⚡ 论文:CelebV-HQ: A Large-Scale Video Facial Attributes Dataset

论文时间:25 Jul 2022

所属领域计算机视觉

对应任务:Face Generation,Unconditional Video Generation,Video Generation,人脸生成,无约束视频生成,视频生成

论文地址:https://arxiv.org/abs/2207.12393

代码实现:https://github.com/celebv-hq/celebv-hq

论文作者:Hao Zhu, Wayne Wu, Wentao Zhu, Liming Jiang, Siwei Tang, Li Zhang, Ziwei Liu, Chen Change Loy

论文简介:Large-scale datasets have played indispensable roles in the recent success of face generation/editing and significantly facilitated the advances of emerging research fields./大规模的数据集在最近的人脸生成/编辑的成功中发挥了不可或缺的作用,并大大促进了新兴研究领域的进步。

论文摘要:大型数据集在近期人脸生成/编辑的成功中发挥了不可或缺的作用,并极大地促进了新兴研究领域的发展。然而,学术界仍然缺乏一个具有多样化面部属性注释的视频数据集,这对人脸相关视频的研究至关重要。在这项工作中,我们提出了一个具有丰富面部属性注释的大规模、高质量和多样化的视频数据集,名为高质量名人视频数据集(CelebV-HQ)。CelebV-HQ包含35,666个分辨率至少为512x512的视频片段,涉及15,653个身份。所有的片段都是用83个面部属性手动标注的,涵盖了外观、动作和情绪。我们从年龄、种族、亮度稳定性、运动平滑度、头部姿势多样性和数据质量等方面进行了综合分析,以证明CelebV-HQ的多样性和时间一致性。此外,它的多功能性和潜力在两个代表性的任务上得到了验证,即无条件视频生成和视频面部属性编辑。此外,我们设想了CelebV-HQ的未来潜力,以及它将给相关研究方向带来的新机遇和挑战。数据、代码和模型是公开可用的。项目页面:https://celebv-hq.github.io 。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

这篇关于100+开箱即用的AI工具箱;程序员150岁长寿指南;『地理空间数据科学』课程资料;Graphic数据可视化图表库;前沿论文 | ShowMeAI资讯日报的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/197071

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

三国地理揭秘:为何北伐之路如此艰难,为何诸葛亮无法攻克陇右小城?

俗话说:天时不如地利,不是随便说说,诸葛亮六出祁山,连关中陇右的几座小城都攻不下来,行军山高路险,无法携带和建造攻城器械,是最难的,所以在汉中,无论从哪一方进攻,防守方都是一夫当关,万夫莫开;再加上千里运粮,根本不需要打,司马懿只需要坚守城池拼消耗就能不战而屈人之兵。 另一边,洛阳的虎牢关,一旦突破,洛阳就无险可守,这样的进军路线,才是顺势而为的用兵之道。 读历史的时候我们常常看到某一方势

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提供了许多比 AWT 更好的屏幕显示元素,更加灵活和可定制,具有更好的跨平台性能。 组件和容器 Java Swing 提供了许多