近年来,人工智能芯片巨头NVIDIA与AMD的竞争愈发激烈。尽管NVIDIA在AI计算解决方案市场占据主导地位,但在2023年末,AMD推出号称全球最快的AI芯片Instinct MI300X后,开始对NVIDIA构成了挑战。然而,经过一段时间的市场检验,Richard's Research Blog的一项分析表明,虽然AMD的MI300X成本显著高于NVIDIA的H200,但在推理生产应用方
随着技术的不断进步和市场需求的变化,AMD 在处理器领域一直保持着强劲的竞争力。其最新旗舰级CPU——代号为Strix Point的Ryzen AI 300系列处理器,标志着AMD Zen 5微架构的首次亮相。本文将从技术特点和市场策略两个方面对Zen 5进行全面解析。 技术特点 1. IPC提升与资源扩展 Zen 5相比其前代Zen 4,在每周期指令数(IPC)上实现了16%的增长。这一显
(52VR润饰原译文并重新进行编辑) 如果你曾通过 PC VR 头显来体验虚拟现实,你就会知道它们有能够提供一种所谓的“临场感”,亦即身临其境的感觉。如果你的PC无法及时渲染下一帧的影像,临场感就会被破坏,甚至消失。更糟糕的是,如果系统一直无法跟上,连续的掉帧将会令头显用户感到极其不舒服。为了避免这样的问题,VR规格的PC需要足够好、足够快速的CPU和GPU,以及合适
AMD CEO Lisa Su(苏姿丰)绝对称得上是芯片届的风云人物,尤其是进入了AI新时代,她的声望达到了十年来最高点。翻看其成长历史,苏姿丰在麻省理工学院获得电气工程博士学位后(在麻省理工学院学习八年半,获得三个电气工程学位),在德州仪器开始了她的职业生涯,她在开发绝缘体上硅晶体管技术方面发挥了重要作用。随后,苏姿丰在 IBM 工作了 12 年,领导了半导体铜互连的开发,领导开发了 PlayS
AMD in Action: Unveiling the Power of Application Tracing and Profiling — ROCm Blogs 导言 Rocprof是一款强大的工具,设计用于分析和优化基于AMD ROCm平台上运行的HIP程序的性能,帮助开发者找出并解决性能瓶颈。Rocprof提供了多种性能数据,包括性能计数器、硬件追踪和运行时API/活动追踪等。
Accelerating Large Language Models with Flash Attention on AMD GPUs — ROCm Blogs 引言 在这篇博客文章中,我们将指导您如何在AMD GPU上安装Flash Attention,并提供与在PyTorch中标准SDPA比较其性能的基准测试。我们还将测量Hugging Face中多个大型语言模型(LLM)的端到端预填