橘子百科-橘子都知道橘子百科-橘子都知道

东京是不是日本首都 东京不是日本的首都吗

东京是不是日本首都 东京不是日本的首都吗 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮(cháo)”最(zuì)大(dà)赢家之一、英伟(wěi)达背后的那个身穿黑色皮衣的(de)男人(rén)又来了。

  前脚才交出亮眼业绩狂拉股价(jià),英伟达CEO黄仁勋(xūn)后脚就在(zài)昨日(rì)的COMPUTEX大会上宣布,“我(wǒ)们(men)已到达生成(chéng)式AI引爆点(diǎn)。从此(cǐ),全世界的每个角(jiǎo)落(luò),都会有计算需求。”

  如今英伟达掌握着全(quán)球多家科技公司(sī)“算力(lì)命脉”,而在这场大会(huì)上(shàng),黄仁勋激情演(yǎn)讲(jiǎng)2个小时,甩出了多项重磅新发(fā)布,包(bāo)括算力“杀器”DGX GH200超(chāo)级计算机、针对游戏的(de)ACE代(dài)工服(fú)务、MGX服务(wù)器规(guī)范等(děng)内容。

  算(suàn)力(lì)“杀器”:DGX GH200超(chāo)级计算机(jī)+GH200超级芯片

  先(xiān)看(kàn)“集成了英伟达最先进加速计算和网(wǎng)络技术(shù)”的DGX GH200人工智能(néng)超级计算(suàn)机

  这款超算专为(wèi)大规模生成式AI的负载所设计,由(yóu)256块GH200超级芯片(piàn)组(zǔ)成(chéng),拥有1 exaflop超凡(fán)AI性能、144TB内存(是英伟达目前DGX A100系统的近500倍)、150英里光纤、2000多个风扇。

  DGX GH200重达40000磅(bàng)(约合18143千克),堪比四只成(chéng)年大(dà)象的体重。

  预计DGX GH200将于今年(nián)年底投(tóu)入问(wèn)世,英伟达暂未(wèi)公布价格,而谷歌云、Meta与微软将(jiāng)是首批用户(hù)

  同时,英伟达也正在打造自(zì)家基(jī)于DGX GH200的大型AI超(chāo)级计算机NVIDIA Helios,以支持(chí)其(qí)研究和开发团队的(de)工作(zuò)。其中采用4个DGX GH200系统、1024颗Grace Hopper超级(jí)芯片(piàn),每个都将与英伟达Quantum-2 InfiniBand网络连(lián)接(jiē),带宽高达(dá)400Gb/s,将于(yú)今年年底上线。

  值得一提(tí)的是,黄仁勋(xūn)透(tòu)露,DGX GH200集成的GH200 Grace Hopper超级芯片已(yǐ)进(jìn)入全(quán)面(m东京是不是日本首都 东京不是日本的首都吗iàn)生(shēng)产

  “拉踩”CPU:成本、功耗(hào)、处理数据量不如GPU

  在本次大(dà)会上,黄(huáng)仁(rén)勋还(hái)“拉踩”了一波CPU。他从(cóng)功耗、处理数据量(liàng)等(děng)方面,指出(chū)使用(yòng)GPU胜过CPU。

  举(jǔ)例(lì)来(lái)说,花费1000万美元(yuán),可以建设(shè)一(yī)个有(yǒu)960颗CPU的数(shù)据中心,其可处理1X LMM(大语言模型)数据量,需要(yào)11GWh功耗;

  同(tóng)东京是不是日本首都 东京不是日本的首都吗样成(chéng)本下,也可以建设(shè)一个有(yǒu)48个(gè)GPU的数(shù)据中(zhōng)心,其可处(chù)理(lǐ)44X LLM数(shù)据量(liàng),仅需要3.2GWh功耗(hào)。

  若只(zhǐ)想处理1X LMM数(shù)据量,则只需40万美元,便可拥有一个搭(dā)载2个GPU、功耗仅0.13GWh的数据(jù)中心。

  “买越(yuè)多(duō),省越多(The more you buy, the more you save)。”黄仁勋再次表示(shì)。

  同时,他也(yě)列出了数据中心成本(běn)公(gōng)式:数据中心(xīn)总持有成本=f[成本(芯片(piàn)、系统(tǒng)、硬件生态系统)、吞(tūn)吐量(liàng)(GPU、Algo软(ruǎn)件、网(wǎng)络、系统(tǒng)软件(jiàn)、软(ruǎn)件生态系统(tǒng))、使用率(Algo Lib, 软件生态系统(tǒng))、采购运(yùn)营、生命周期最佳化、电力]

  ACE代工服务:用AI激(jī)活(huó)NPC生命

  游戏(xì)一直是备(bèi)受关(guān)注的一大AI应(yīng)用落地领域(yù)。英伟达也在大会上宣(xuān)布,推出面(miàn)向游戏的定制AI模型(xíng)代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家角色(sè)(NPC)更智能且不断进(jìn)化的(de)对话(huà)技能,中间件、工具和(hé)游戏(xì)开发者可使(shǐ)用(yòng)它来构(gòu)建和(hé)部(bù)署定制的语音、对话和(hé)动(dòng)画AI模型

  其中(zhōng)包括:英伟达NeMo,使用(yòng)专有数据构建、定制(zhì)和(hé)部署(shǔ)语言模(mó)型;英伟达Riva,用(yòng)于自动语音识别(bié)和文本转(zhuǎn)语音实现实时语音(yīn)对话;英伟达Omniverse Audio2Face,用于即时创建游戏角色表情动画,以匹配任何语音(yīn)轨道(dào)。

  开发(fā)人员可选择集成(chéng)整个(gè)NVIDIA ACE for Games解决方(fāng)案,也可仅使(shǐ)用(yòng)需要的(de)组件(jiàn)。

  新参考(kǎo)工作流(liú)程(chéng):帮助建设数字化智能工(gōng)厂

  黄仁勋表示,全球(qiú)电子制(zhì)造商(shāng)正在使(shǐ)用一(yī)种(zhǒng)全新的综(zōng)合参考工作流(liú)程推进工业数字化(huà)工作,该工作流程结合了英(yīng)伟(wěi)达用于(yú)生(shēng)成式AI、3D协作、仿真和自主机(jī)器(qì)的技(jì)术,包括:

  英伟达Omniverse,其连接了顶(dǐng)级计(jì)算机辅助设(shè)计应(yīng)用以及(jí)生成式AI的API和(hé)前沿(yán)框架;用于模拟和测试机(jī)器人的英伟达(dá)Isaac Sim应用程序;英伟达Metropolis视(shì)觉AI框架,用于(yú)自(zì)动光学(xué)检测。

  同时,黄仁勋现场展示了一(yī)个完全数(shù)字化(huà)的(de)智能工厂的演(yǎn)示。

  目前富士康工业(yè)互联(lián)网、宜鼎国际、和硕、广达和(hé)纬(wěi)创(chuàng)正(zhèng)在使用这(zhè)一参(cān)考工作流程,具体用(yòng)例包括电路板质保(bǎo)检测(cè)点自(zì)动(dòng)化、光学(xué)检测自动(dòng)化、建(jiàn)设虚拟工(gōng)厂、模拟协作机器人、构建及运(yùn)营数字(zì)孪生(shēng)等。

  MGX服务(wù)器(qì)规范:快速高效构建百余种服务器配置

  英伟达发布NVIDIA MGX服务器规范,为系统制造商提供模块化(huà)参考架构,满(mǎn)足各(gè)种规(guī)模(mó)的数据中心需求。系(xì)统(tǒng)制造商可使(shǐ)用它快(kuài)速且(qiě)经济高效地(dì)构建100多种服务器(qì)配置,以适应广泛的(de)AI、HPC及NVIDIA Omniverse应用。

  MGX支持英伟(wěi)达全(quán)系列GPU、CPU、DPU和网络适配器(qì)、各种x86、完整(zhěng)软件(jiàn)堆栈及(jí)Arm处理器,还(hái)可集成(chéng)到云和企业数据中心中。

  华硕、和硕(shuò)、QCT、超微(Supermicro)等都将采(cǎi)用(yòng)MGX构建下(xià)一代加速(sù)计算机,可将开(kāi)发成本削(xuē)减多(duō)达3/4,并将开发时间缩短(duǎn)2/3至仅需6个月(yuè)

  其中,QCT和(hé)超微基(jī)于MGX的设(shè)计将(jiāng)于(yú)8月(yuè)面(miàn)世。超微昨日公布(bù)的(de)ARS-221GL-NR系统将采用Grace CPU,而QCT的S74G-2U系统将采用Grace Hopper。

  推出Spectrum-X网络平(píng)台 构建超大(dà)规(guī)模生成式AI超级计(jì)算机Israel-1

  另外,黄(huáng)仁(rén)勋宣布推出NVIDIA Spectrum-X网络平台,旨在提高基于以太网的AI云(yún)的性能和效率(lǜ)。

  相比传统(tǒng)以(yǐ)太(tài)网(wǎng)结构,Spectrum-X可实(shí)现1.7倍(bèi)的整(zhěng)体AI性(xìng)能和能效提升(shēng),并具有高度(dù)通用性,可用于各种AI应用。它(tā)使用完全基于标(biāo)准(zhǔn)的以太网,并可与基于以太(tài)网的堆(duī)栈(zhàn)互操作。该(gāi)平台(tái)支持256个200Gb/s端口,通过(guò)单个交换机连接,或(huò)在两层leaf-spine拓扑中(zhōng)提供(gōng)16000个端口,以支持AI云增长和扩展,在保持性能的(de)同时最大限度(dù)减(jiǎn)少(shǎo)网(wǎng)络(luò)延迟(chí)。

  全球(qiú)领先云计(jì)算(suàn)提供商正在采用Spectrum-X平(píng)台扩展(zhǎn)生(shēng)成式AI服务,而Spectrum-X、Spectrum-4交换(huàn)机(jī)、BlueField-3 DPU等已在戴尔、联想等系统制造(zào)商处提供。

  此外,作为Spectrum-X参考设计的(de)蓝(lán)图(tú)和测试平台,英伟达正构建一台超大规模生(shēng)成(chéng)式AI超(chāo)级计(jì)算机Israel-1。这(zhè)台AI超算价(jià)值数亿美元,将采用(yòng)戴尔PowerEdge XE9680服务器、英(yīng)伟达HGX H100超(chāo)级计算平台、内置(zhì)BlueField-3 DPU和Spectrum-4交换机的(de)Spectrum-X平台。

  结语

  “40年(nián)来,我们创造了PC、互联网、移动、云,现在是人工(gōng)智能时代。你(nǐ)会创造(zào)什么?不管是什么,都要像我们一样追赶它。要(yào)奔跑(pǎo),不(bù)要走。要么为了(le)食物奔跑,要么(me)作为食物奔跑。”

  在5月27日的台湾大(dà)学发表了毕(bì)业典礼演讲上,黄仁勋再次强调了(le)掌握AI技术的重(zhòng)要性:很多人担心,AI会(huì)抢走(zǒu)自己的(de)工作。但真正会(huì)抢走(zǒu)你饭碗的,是掌握了AI技术的人。

  他表示,从(cóng)各(gè)方面来(lái)看,AI的兴盛是计算机产业的再生契(qì)机。在下个十年,我们(men)的产业将(jiāng)使用新型AI电脑(nǎo),取(qǔ)代价值万亿美元的传统电脑。

  而从昨日(rì)大会(huì)上黄仁勋的(de)展示中,人(rén)工智能时代的未来轮廓似乎(hū)已逐渐浮现(xiàn)。

未经允许不得转载:橘子百科-橘子都知道 东京是不是日本首都 东京不是日本的首都吗

评论

5+2=