GPU编程(零): 老黄和他的核弹们

2023-10-24 13:08
文章标签 编程 gpu 核弹 老黄

本文主要是介绍GPU编程(零): 老黄和他的核弹们,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 前言
  • GeForce RTX 20发布会
  • NVIDIA与老黄
  • 发家史
  • 最后

前言

这次要开始GPU编程系列, 其实主要是CUDA编程. 对深度学习或者并行计算感兴趣的小伙伴可以关注下这个系列哦~


GeForce RTX 20发布会

油管GeForce RTX 20发布会

GeForce RTX 20发布会

2018年8月21日0点, NVIDIA在德国科隆举办了为期两个多小时的新显卡发布会, 黄仁勋在会上总结了NVIDIA在图形产业上的成果和历史, 并且发布了新一代基于图灵架构的显卡: GeForce RTX 2080TiGeForce RTX 2080GeForce RTX 2070. 代号TU10x, 是第一款使用即时光线跟踪功能, 模拟光线反射, 同时核心原是为深度学习而设计.

GeForce RTX 20发布会


NVIDIA与老黄

NVIDIA创立于1993年1月, 是一家以设计和销售图形处理器为主的无厂半导体公司. NVIDIA亦会设计游戏机核心, 例如Xbox和PlayStation. NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列, 为专业CGI工作站而设计的Quadro系列, 以及为服务器和高效运算而设计的Tesla系列, 虽然起家于PC计算机的显卡业务, 英伟达也曾涉及行动芯片Tegra的设计, 但智能机市场对此响应不大, 不过近年却利用这些研发经验, 目前朝向人工智能和机器视觉的市场发展, 也是图形处理器上重要的开发工具CUDA的发明者. 不过NVIDIA的发展过程也是非议不断, 批评多集中于滥用排他性商业合作、不正当营销方式、对业界开放标准和自由软件运动的拒斥等.
NVIDIA的总部设在美国加利福尼亚州的圣克拉拉位于硅谷的中心位置.

黄仁勋、克里斯·马拉科夫斯基和卡蒂斯·普里姆于1993年4月美国加州创办了NVIDIA(随后成为德拉威州企业). NVIDIA保持低调到1997-1998年, 当时它发布了RIVA个人计算机绘图处理器产品线. 并于1999年1月在纳斯达克挂牌上市; 同年5月, 售出第一千万个绘图处理器. 于2000年收购了一代王者3dfx的知识产权. 3dfx是1990年代中期其中一间最大的图形处理器厂商. NVIDIA与许多OEM厂商, 和一些组织创建起密切关系, 最知名的包括台积电. 2002年2月, NVIDIA售出第一亿个绘图处理器.

老黄和他的核弹们

目前NVIDIA和AMD供应了市场上大部分独立显卡. NVIDIA最著名的GeForce绘图处理器产品线于1999年首次亮相. 现在GeForce产品线已经扩展至桌面型和笔记本电脑. 移动设备方面, NVIDIA拥有Tegra产品线. 它能提供高性能, 同时保持低电源消耗. 此类产品通常用于无线通信设备.


发家史

但是老黄的创业路走得还是比较艰辛的.

  • 1993年4月, 从集成电路生产商LSI Logic出来的老黄, 联合Sun公司两位年轻工程师克里斯·马拉科夫斯基卡蒂斯·普里姆共同创立了NVIDIA, 他们的初衷是研发一种专用芯片, 用来加快电子游戏中3D图像的渲染速度, 带来更逼真的显示效果.
    两年之后, 推出了第一款产品, 首款面向游戏主机的多媒体加速器–NV1, 这款加速器集图形处理、声卡及游戏操作杆等功能于一体, 一经发布便吸引了当时最大游戏制造商世嘉的目光. 世嘉决定在其第六代家用游戏机“土星”和个人电脑上采用NV1.
    但是同年, 微软推出了Windows 95, 图形芯片主流市场从游戏主机转向PC, 同时还发布了Direct3D标准. 英伟达采用的是二次方程纹理贴图作为立体图形实现方式, 无法兼容行业通用标准, 因此市场销量快速下降.
    两年后, NVIDIA发布了两款失败的产品后, CEO黄仁勋领悟到公司要继续生存, 就必须作出改变. 他雇佣了David Kirk, 作为首席科学家. David Kirk原本是属于软件开发商Crystal Dynamics, 一间提供优良视觉质量的公司. 他基于对着色的熟悉, 将NVIDIA的3D硬件经验合并起来, 使NVIDIA得以翻身. NVIDIA陆续推出RIVA128、RIVA128ZX、RIVATNT等图形处理器. 这些新产品不仅支持微软Direct3D和OpenGL标准, 在能效上也超越了竞争对手3Dfx的Voodoo和ATI的Rage Pro, 加上价格低廉, 逐渐获得了整机厂的青睐. 1999年1月, 在纳斯达克挂牌上市. 同年8月,英伟达推出第一款以GeForce命名的显示核心–GeForce 256, 并首次提出GPU概念. 次年底, 英伟达以7000万美元现金、100万股公司股票, 将3Dfx收入囊中, 正式成为行业老大.
  • 到这里, 老黄眼看就要一统江湖了. 好景不长, 还是和微软相关.
    众所周知, 微软花了一大笔钱进军游戏主机行业. 2000年, 微软请英伟达研发Xbox图形芯片、SoundStorm声音芯片以及主板解决方案. 但是微软时限只有一年, Xbox发布前两个月才开始生产. 最终, 微软被迫推迟首发, 错过先机, 败给了索尼PS2. 微软失了先机, 后来英伟达又出了品控问题. 微软便把订单交给了英伟达的竞争对手ATI(后被AMD收购). 这次合作失败让NVIDIA付出了惨痛代价, 不仅2003年营收减少, 还错过了微软DirectX 9规格确立的重要消息, 直接导致当年推出的GeForce FX由于兼容性问题败给ATI的Radeon 9700. 这和第一次NV1的折戟非常相似. 更不幸的是, GeForce FX还存在运行温度过高的问题, 引发多次自燃事故, 黄仁勋一度被游戏玩家调侃为"两弹元勋". 除了巨硬, 英特尔也开始扶持ATI. NVIDIA为了实现突围, 一方面主动去找微软和解, 争取再次合作; 另一方面失去Xbox订单, 努力拿下了索尼PS3订单. 此外, 继续推出高性能芯片压倒ATI, 同时还和英特尔达成了专利交叉许可协议. 可以说很卧薪尝胆了.
  • 眼看要一统江湖的老黄就这样被微软和英特尔打压得说不出话来. 所以就算是在硅谷, 创业也是很艰难的.
    2007年, 英伟达首席科学家David Kirk说服了老黄, 投入大量资源研发出了能够让GPU变得通用化的CUDA(Compute Unified Device Architecture)技术, 就是如今GPU编程的核心, 并让每一颗英伟达GPU都支持CUDA. 这一疯狂举动成本巨大. 由于必须在硬件产品设计中增加相关CUDA逻辑电路, 使得芯片面积增大、散热增加、成本上升、故障率增高; 同时, 还要保证每款产品的软件驱动都支持CUDA, 这简直是不给NVIDIA的程序猿活路. 2008年, AMD收购NVIDIA老对手ATI, 形成了CPU整合GPU的新解决方案.
    Intel也终止了与英伟达的合作, 在自家芯片组中集成了3D图形加速器.
    2012年, 深度神经网络技术在通用GPU的支持下实现重大突破, 包括计算机视觉、语音识别、自然语言处理, 以及各个领域的人工智能技术都得到了快速发展的条件. 英伟达的数据中心业务也蒸蒸日上, 为大大小小的公司提供强大计算力支持.
    在2016年10月20日任天堂发布了Switch, 用的是英伟达定制的Tegra X1系统芯片.

Switch


最后

喜欢记得点赞哦, 暗中关注我也是可以的~

这篇关于GPU编程(零): 老黄和他的核弹们的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/275367

相关文章

Linux 网络编程 --- 应用层

一、自定义协议和序列化反序列化 代码: 序列化反序列化实现网络版本计算器 二、HTTP协议 1、谈两个简单的预备知识 https://www.baidu.com/ --- 域名 --- 域名解析 --- IP地址 http的端口号为80端口,https的端口号为443 url为统一资源定位符。CSDNhttps://mp.csdn.net/mp_blog/creation/editor

【Python编程】Linux创建虚拟环境并配置与notebook相连接

1.创建 使用 venv 创建虚拟环境。例如,在当前目录下创建一个名为 myenv 的虚拟环境: python3 -m venv myenv 2.激活 激活虚拟环境使其成为当前终端会话的活动环境。运行: source myenv/bin/activate 3.与notebook连接 在虚拟环境中,使用 pip 安装 Jupyter 和 ipykernel: pip instal

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

如何用GPU算力卡P100玩黑神话悟空?

精力有限,只记录关键信息,希望未来能够有助于其他人。 文章目录 综述背景评估游戏性能需求显卡需求CPU和内存系统需求主机需求显式需求 实操硬件安装安装操作系统Win11安装驱动修改注册表选择程序使用什么GPU 安装黑神话悟空其他 综述 用P100 + PCIe Gen3.0 + Dell720服务器(32C64G),运行黑神话悟空画质中等流畅运行。 背景 假设有一张P100-

【编程底层思考】垃圾收集机制,GC算法,垃圾收集器类型概述

Java的垃圾收集(Garbage Collection,GC)机制是Java语言的一大特色,它负责自动管理内存的回收,释放不再使用的对象所占用的内存。以下是对Java垃圾收集机制的详细介绍: 一、垃圾收集机制概述: 对象存活判断:垃圾收集器定期检查堆内存中的对象,判断哪些对象是“垃圾”,即不再被任何引用链直接或间接引用的对象。内存回收:将判断为垃圾的对象占用的内存进行回收,以便重新使用。

Go Playground 在线编程环境

For all examples in this and the next chapter, we will use Go Playground. Go Playground represents a web service that can run programs written in Go. It can be opened in a web browser using the follow

深入理解RxJava:响应式编程的现代方式

在当今的软件开发世界中,异步编程和事件驱动的架构变得越来越重要。RxJava,作为响应式编程(Reactive Programming)的一个流行库,为Java和Android开发者提供了一种强大的方式来处理异步任务和事件流。本文将深入探讨RxJava的核心概念、优势以及如何在实际项目中应用它。 文章目录 💯 什么是RxJava?💯 响应式编程的优势💯 RxJava的核心概念

函数式编程思想

我们经常会用到各种各样的编程思想,例如面向过程、面向对象。不过笔者在该博客简单介绍一下函数式编程思想. 如果对函数式编程思想进行概括,就是f(x) = na(x) , y=uf(x)…至于其他的编程思想,可能是y=a(x)+b(x)+c(x)…,也有可能是y=f(x)=f(x)/a + f(x)/b+f(x)/c… 面向过程的指令式编程 面向过程,简单理解就是y=a(x)+b(x)+c(x)

Java并发编程之——BlockingQueue(队列)

一、什么是BlockingQueue BlockingQueue即阻塞队列,从阻塞这个词可以看出,在某些情况下对阻塞队列的访问可能会造成阻塞。被阻塞的情况主要有如下两种: 1. 当队列满了的时候进行入队列操作2. 当队列空了的时候进行出队列操作123 因此,当一个线程试图对一个已经满了的队列进行入队列操作时,它将会被阻塞,除非有另一个线程做了出队列操作;同样,当一个线程试图对一个空

生信代码入门:从零开始掌握生物信息学编程技能

少走弯路,高效分析;了解生信云,访问 【生信圆桌x生信专用云服务器】 : www.tebteb.cc 介绍 生物信息学是一个高度跨学科的领域,结合了生物学、计算机科学和统计学。随着高通量测序技术的发展,海量的生物数据需要通过编程来进行处理和分析。因此,掌握生信编程技能,成为每一个生物信息学研究者的必备能力。 生信代码入门,旨在帮助初学者从零开始学习生物信息学中的编程基础。通过学习常用