GPU编程(零): 老黄和他的核弹们

2023-10-24 13:08
文章标签 编程 gpu 核弹 老黄

本文主要是介绍GPU编程(零): 老黄和他的核弹们,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 前言
  • GeForce RTX 20发布会
  • NVIDIA与老黄
  • 发家史
  • 最后

前言

这次要开始GPU编程系列, 其实主要是CUDA编程. 对深度学习或者并行计算感兴趣的小伙伴可以关注下这个系列哦~


GeForce RTX 20发布会

油管GeForce RTX 20发布会

GeForce RTX 20发布会

2018年8月21日0点, NVIDIA在德国科隆举办了为期两个多小时的新显卡发布会, 黄仁勋在会上总结了NVIDIA在图形产业上的成果和历史, 并且发布了新一代基于图灵架构的显卡: GeForce RTX 2080TiGeForce RTX 2080GeForce RTX 2070. 代号TU10x, 是第一款使用即时光线跟踪功能, 模拟光线反射, 同时核心原是为深度学习而设计.

GeForce RTX 20发布会


NVIDIA与老黄

NVIDIA创立于1993年1月, 是一家以设计和销售图形处理器为主的无厂半导体公司. NVIDIA亦会设计游戏机核心, 例如Xbox和PlayStation. NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列, 为专业CGI工作站而设计的Quadro系列, 以及为服务器和高效运算而设计的Tesla系列, 虽然起家于PC计算机的显卡业务, 英伟达也曾涉及行动芯片Tegra的设计, 但智能机市场对此响应不大, 不过近年却利用这些研发经验, 目前朝向人工智能和机器视觉的市场发展, 也是图形处理器上重要的开发工具CUDA的发明者. 不过NVIDIA的发展过程也是非议不断, 批评多集中于滥用排他性商业合作、不正当营销方式、对业界开放标准和自由软件运动的拒斥等.
NVIDIA的总部设在美国加利福尼亚州的圣克拉拉位于硅谷的中心位置.

黄仁勋、克里斯·马拉科夫斯基和卡蒂斯·普里姆于1993年4月美国加州创办了NVIDIA(随后成为德拉威州企业). NVIDIA保持低调到1997-1998年, 当时它发布了RIVA个人计算机绘图处理器产品线. 并于1999年1月在纳斯达克挂牌上市; 同年5月, 售出第一千万个绘图处理器. 于2000年收购了一代王者3dfx的知识产权. 3dfx是1990年代中期其中一间最大的图形处理器厂商. NVIDIA与许多OEM厂商, 和一些组织创建起密切关系, 最知名的包括台积电. 2002年2月, NVIDIA售出第一亿个绘图处理器.

老黄和他的核弹们

目前NVIDIA和AMD供应了市场上大部分独立显卡. NVIDIA最著名的GeForce绘图处理器产品线于1999年首次亮相. 现在GeForce产品线已经扩展至桌面型和笔记本电脑. 移动设备方面, NVIDIA拥有Tegra产品线. 它能提供高性能, 同时保持低电源消耗. 此类产品通常用于无线通信设备.


发家史

但是老黄的创业路走得还是比较艰辛的.

  • 1993年4月, 从集成电路生产商LSI Logic出来的老黄, 联合Sun公司两位年轻工程师克里斯·马拉科夫斯基卡蒂斯·普里姆共同创立了NVIDIA, 他们的初衷是研发一种专用芯片, 用来加快电子游戏中3D图像的渲染速度, 带来更逼真的显示效果.
    两年之后, 推出了第一款产品, 首款面向游戏主机的多媒体加速器–NV1, 这款加速器集图形处理、声卡及游戏操作杆等功能于一体, 一经发布便吸引了当时最大游戏制造商世嘉的目光. 世嘉决定在其第六代家用游戏机“土星”和个人电脑上采用NV1.
    但是同年, 微软推出了Windows 95, 图形芯片主流市场从游戏主机转向PC, 同时还发布了Direct3D标准. 英伟达采用的是二次方程纹理贴图作为立体图形实现方式, 无法兼容行业通用标准, 因此市场销量快速下降.
    两年后, NVIDIA发布了两款失败的产品后, CEO黄仁勋领悟到公司要继续生存, 就必须作出改变. 他雇佣了David Kirk, 作为首席科学家. David Kirk原本是属于软件开发商Crystal Dynamics, 一间提供优良视觉质量的公司. 他基于对着色的熟悉, 将NVIDIA的3D硬件经验合并起来, 使NVIDIA得以翻身. NVIDIA陆续推出RIVA128、RIVA128ZX、RIVATNT等图形处理器. 这些新产品不仅支持微软Direct3D和OpenGL标准, 在能效上也超越了竞争对手3Dfx的Voodoo和ATI的Rage Pro, 加上价格低廉, 逐渐获得了整机厂的青睐. 1999年1月, 在纳斯达克挂牌上市. 同年8月,英伟达推出第一款以GeForce命名的显示核心–GeForce 256, 并首次提出GPU概念. 次年底, 英伟达以7000万美元现金、100万股公司股票, 将3Dfx收入囊中, 正式成为行业老大.
  • 到这里, 老黄眼看就要一统江湖了. 好景不长, 还是和微软相关.
    众所周知, 微软花了一大笔钱进军游戏主机行业. 2000年, 微软请英伟达研发Xbox图形芯片、SoundStorm声音芯片以及主板解决方案. 但是微软时限只有一年, Xbox发布前两个月才开始生产. 最终, 微软被迫推迟首发, 错过先机, 败给了索尼PS2. 微软失了先机, 后来英伟达又出了品控问题. 微软便把订单交给了英伟达的竞争对手ATI(后被AMD收购). 这次合作失败让NVIDIA付出了惨痛代价, 不仅2003年营收减少, 还错过了微软DirectX 9规格确立的重要消息, 直接导致当年推出的GeForce FX由于兼容性问题败给ATI的Radeon 9700. 这和第一次NV1的折戟非常相似. 更不幸的是, GeForce FX还存在运行温度过高的问题, 引发多次自燃事故, 黄仁勋一度被游戏玩家调侃为"两弹元勋". 除了巨硬, 英特尔也开始扶持ATI. NVIDIA为了实现突围, 一方面主动去找微软和解, 争取再次合作; 另一方面失去Xbox订单, 努力拿下了索尼PS3订单. 此外, 继续推出高性能芯片压倒ATI, 同时还和英特尔达成了专利交叉许可协议. 可以说很卧薪尝胆了.
  • 眼看要一统江湖的老黄就这样被微软和英特尔打压得说不出话来. 所以就算是在硅谷, 创业也是很艰难的.
    2007年, 英伟达首席科学家David Kirk说服了老黄, 投入大量资源研发出了能够让GPU变得通用化的CUDA(Compute Unified Device Architecture)技术, 就是如今GPU编程的核心, 并让每一颗英伟达GPU都支持CUDA. 这一疯狂举动成本巨大. 由于必须在硬件产品设计中增加相关CUDA逻辑电路, 使得芯片面积增大、散热增加、成本上升、故障率增高; 同时, 还要保证每款产品的软件驱动都支持CUDA, 这简直是不给NVIDIA的程序猿活路. 2008年, AMD收购NVIDIA老对手ATI, 形成了CPU整合GPU的新解决方案.
    Intel也终止了与英伟达的合作, 在自家芯片组中集成了3D图形加速器.
    2012年, 深度神经网络技术在通用GPU的支持下实现重大突破, 包括计算机视觉、语音识别、自然语言处理, 以及各个领域的人工智能技术都得到了快速发展的条件. 英伟达的数据中心业务也蒸蒸日上, 为大大小小的公司提供强大计算力支持.
    在2016年10月20日任天堂发布了Switch, 用的是英伟达定制的Tegra X1系统芯片.

Switch


最后

喜欢记得点赞哦, 暗中关注我也是可以的~

这篇关于GPU编程(零): 老黄和他的核弹们的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/275367

相关文章

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

Java并发编程必备之Synchronized关键字深入解析

《Java并发编程必备之Synchronized关键字深入解析》本文我们深入探索了Java中的Synchronized关键字,包括其互斥性和可重入性的特性,文章详细介绍了Synchronized的三种... 目录一、前言二、Synchronized关键字2.1 Synchronized的特性1. 互斥2.

Python异步编程中asyncio.gather的并发控制详解

《Python异步编程中asyncio.gather的并发控制详解》在Python异步编程生态中,asyncio.gather是并发任务调度的核心工具,本文将通过实际场景和代码示例,展示如何结合信号量... 目录一、asyncio.gather的原始行为解析二、信号量控制法:给并发装上"节流阀"三、进阶控制

C#多线程编程中导致死锁的常见陷阱和避免方法

《C#多线程编程中导致死锁的常见陷阱和避免方法》在C#多线程编程中,死锁(Deadlock)是一种常见的、令人头疼的错误,死锁通常发生在多个线程试图获取多个资源的锁时,导致相互等待对方释放资源,最终形... 目录引言1. 什么是死锁?死锁的典型条件:2. 导致死锁的常见原因2.1 锁的顺序问题错误示例:不同

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

C#反射编程之GetConstructor()方法解读

《C#反射编程之GetConstructor()方法解读》C#中Type类的GetConstructor()方法用于获取指定类型的构造函数,该方法有多个重载版本,可以根据不同的参数获取不同特性的构造函... 目录C# GetConstructor()方法有4个重载以GetConstructor(Type[]

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

如何用GPU算力卡P100玩黑神话悟空?

精力有限,只记录关键信息,希望未来能够有助于其他人。 文章目录 综述背景评估游戏性能需求显卡需求CPU和内存系统需求主机需求显式需求 实操硬件安装安装操作系统Win11安装驱动修改注册表选择程序使用什么GPU 安装黑神话悟空其他 综述 用P100 + PCIe Gen3.0 + Dell720服务器(32C64G),运行黑神话悟空画质中等流畅运行。 背景 假设有一张P100-