港大专题

【可控图像生成系列论文(二)】MimicBrush 港大、阿里、蚂蚁集团合作论文解读2

【可控图像生成系列论文(一)】简要介绍了论文的整体流程和方法,本文则将就整体方法、模型结构、训练数据和纹理迁移进行详细介绍。 1.整体方法 MimicBrush 的整体框架如下图所示。为了实现模仿编辑,作者设计了一种具有双扩散模型的架构,并以自监督的方式进行训练。视频数据本身包含自然一致的内容,同时也展示了视觉变化,例如同一只狗的不同姿势。 因此,作者从视频片段中随机选择两个帧作为 M

福布斯2021年十大最佳人工智能硕士课程,清华、港大入选

来源:AI科技评论 本文约2400字,建议阅读5分钟 本文为你分享福布斯网站发布的“2021年十大最佳人工智能和数据科学硕士项目”榜单。 如今,人工智能成为科技和商业领域最热门的话题,而数据科学领域则是作为其工作原理的基础大放光彩。数据科学的课程现在都包含了强大的人工智能,一些机构也已经在提供人工智能专业的本科学位。 越来越多的学院和大学开设了这些课程,这表明了整个行业的期望,对于那些接受过

港大计算机系课程作业

Github 链接包含 COMP8501 Advanced topics in computer graphics 和 COMP9102 Data Management and Information Retrieval 课程作业。 https://github.com/louiswng/HKUCS-Coursework COMP8501 Assignment1 Please accompl

柳叶刀:港大研究发现新冠病毒可通过动物传人

视学算法报道   编辑:拉燕 时光 【新智元导读】 香港这波疫情爆发,仓鼠也在其中添乱搞鬼?看看顶会「柳叶刀」上的专家怎么说。 香港疫情爆发的罪魁祸首之一,竟然是下面这个萌萌哒的小动物? 仓鼠带给人们欢乐、慰藉、陪伴,以及...... 新冠病毒! 3月12日,医学顶级期刊「柳叶刀」上的一篇名为「案例研究:SARS-CoV-2型delta变异病毒(AY.127)从宠物仓鼠传播到人,

港大与TikTok合作研发Depth Anything,从单张图像解锁深度信息,引领MDE新纪元

单目深度估计:挑战与机遇 单目深度估计(MDE)在机器人、自动驾驶、虚拟现实等领域中具有广泛的应用。然而,由于其依赖于精确的深度信息,且面临着数据集构建困难、样本标注成本高等挑战,使得MDE技术的发展步伐受限。 Depth Anything的技术创新 由香港大学和TikTok合作研发的Depth Anything模型在MDE领域是一次重要突破。该模型的创新之处在于有效利用了大规模

港大、TikTok推出任意图像的深度估计大模型Depth Anything,致敬Segment Anything

目录 前言         1.摘要 2.方法 3.实验结果 4.总结 前言                 人类有两只眼睛来估计视觉环境的深度信息,但机器人和 VR 头社等设备却往往没有这样的「配置」,往往只能靠单个摄像头或单张图像来估计深度。这个任务也被称为单目深度估计(MDE)。         近日,TikTok发布一项新型AI技术“DepthAnything”,该

CVPR 2022 | 刷新4个SOTA!港大字节开源ReferFormer: 语言作为查询的参考视频目标分割框架...

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 在本文中,来自香港大学和字节跳动的研究者们提出了一种基于Transformer的参考视频目标分割新框架ReferFormer。其将语言描述视为查询条件,直接在视频中查找目标对象,除此之外,通过实例序列的整体输出自然地完成目标物体的跟踪,无需进行任何后处理。ReferFormer在四个参考视频目标分割数据集上都取得了当前最优的

GNN论文周报 | 来自剑桥、港大、华中科大等机构前沿论文研究

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 图神经网络(GNN)是一类专门针对图结构数据的神经网络模型,在社交网络分析、知识图谱等领域中取得了不错的效果。近来,相关研究人员在GNN的可解释性、架构搜索、对比学习等方面做了很多探究。 本周精选了10篇GNN领域的优秀论文,来自剑桥、港大、华中科大等机构。 为了方便大家阅读,只列出了论文标题、作者、链接等信息,如果感兴趣可点击“

超越Swin!百度港大提出BOAT:双边局部注意力视觉Transformer

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 转载自:机器之心  |  作者:马昊宇 在这项研究中,来自百度研究院和香港大学的研究者重新思考了局部自注意力机制,提出了特征空间局部注意力(feature-space local attention或简称FSLA)。 Vision Transformer 舍弃了 ConvNet 先验信息,通过引入自注意力机制对远距离特征

港大计算机系教授中科大毕业的吗,26岁任中科大教授,攻破世界数学难题!他的家庭背景曝光...

陈杲的父亲陈钱林 “神童”的开挂人生 这名一开始就在学术界惊艳众人的“90后”男孩,其“开挂”一般的人生,其实从小就已经开启。 陈钱林校长曾在多篇文章中介绍过自己的一对龙凤胎——儿子陈杲、女儿陈杳。“女儿取‘杳’,寓意‘深远和含蓄’;儿子取‘杲’,寓意‘阳光和自信’。”两个孩子在成长过程中,天资聪颖的特性不断闪现。在科学有效的家庭教育引导之下,俩人都在各自的学业上不断“跳跃”。 据陈钱林校长介