东京是不是日本首都东京不是日本的首都吗-橘子百科-橘子都知道

东京是不是日本首都东京不是日本的首都吗 “AI春晚”英伟达放大招：亮算力“杀器”、助游戏“捏人”；黄仁勋帮算账：GPU多买多省

　　“AI热潮(cháo)”最(zuì)大(dà)赢家之一、英伟(wěi)达背后的那个身穿黑色皮衣的(de)男人(rén)又来了。

　　前脚才交出亮眼业绩狂拉股价(jià)，英伟达CEO黄仁勋(xūn)后脚就在(zài)昨日(rì)的COMPUTEX大会上宣布，“我(wǒ)们(men)已到达生成(chéng)式AI引爆点(diǎn)。从此(cǐ)，全世界的每个角(jiǎo)落(luò)，都会有计算需求。”

　　如今英伟达掌握着全(quán)球多家科技公司(sī)“算力(lì)命脉”，而在这场大会(huì)上(shàng)，黄仁勋激情演(yǎn)讲(jiǎng)2个小时，甩出了多项重磅新发(fā)布，包(bāo)括算力“杀器”DGX GH200超(chāo)级计算机、针对游戏的(de)ACE代(dài)工服(fú)务、MGX服务(wù)器规(guī)范等(děng)内容。

　　算(suàn)力(lì)“杀器”：DGX GH200超(chāo)级计算机(jī)+GH200超级芯片

　　先(xiān)看(kàn)“集成了英伟达最先进加速计算和网(wǎng)络技术(shù)”的DGX GH200人工智能(néng)超级计算(suàn)机。

　　这款超算专为(wèi)大规模生成式AI的负载所设计，由(yóu)256块GH200超级芯片(piàn)组(zǔ)成(chéng)，拥有1 exaflop超凡(fán)AI性能、144TB内存（是英伟达目前DGX A100系统的近500倍）、150英里光纤、2000多个风扇。

　　DGX GH200重达40000磅(bàng)（约合18143千克），堪比四只成(chéng)年大(dà)象的体重。

　　预计DGX GH200将于今年(nián)年底投(tóu)入问(wèn)世，英伟达暂未(wèi)公布价格，而谷歌云、Meta与微软将(jiāng)是首批用户(hù)。

　　同时，英伟达也正在打造自(zì)家基(jī)于DGX GH200的大型AI超(chāo)级计算机NVIDIA Helios，以支持(chí)其(qí)研究和开发团队的(de)工作(zuò)。其中采用4个DGX GH200系统、1024颗Grace Hopper超级(jí)芯片(piàn)，每个都将与英伟达Quantum-2 InfiniBand网络连(lián)接(jiē)，带宽高达(dá)400Gb/s，将于(yú)今年年底上线。

　　值得一提(tí)的是，黄仁勋(xūn)透(tòu)露，DGX GH200集成的GH200 Grace Hopper超级芯片已(yǐ)进(jìn)入全(quán)面(m东京是不是日本首都东京不是日本的首都吗iàn)生(shēng)产。

　　“拉踩”CPU：成本、功耗(hào)、处理数据量不如GPU

　　在本次大(dà)会上，黄(huáng)仁(rén)勋还(hái)“拉踩”了一波CPU。他从(cóng)功耗、处理数据量(liàng)等(děng)方面，指出(chū)使用(yòng)GPU胜过CPU。

　　举(jǔ)例(lì)来(lái)说，花费1000万美元(yuán)，可以建设(shè)一(yī)个有(yǒu)960颗CPU的数(shù)据中心，其可处理1X LMM（大语言模型）数据量，需要(yào)11GWh功耗；

　　同(tóng)东京是不是日本首都东京不是日本的首都吗样成(chéng)本下，也可以建设(shè)一个有(yǒu)48个(gè)GPU的数(shù)据中(zhōng)心，其可处(chù)理(lǐ)44X LLM数(shù)据量(liàng)，仅需要3.2GWh功耗(hào)。

　　若只(zhǐ)想处理1X LMM数(shù)据量，则只需40万美元，便可拥有一个搭(dā)载2个GPU、功耗仅0.13GWh的数据(jù)中心。

　　“买越(yuè)多(duō)，省越多（The more you buy， the more you save）。”黄仁勋再次表示(shì)。

　　同时，他也(yě)列出了数据中心成本(běn)公(gōng)式：数据中心(xīn)总持有成本=f[成本（芯片(piàn)、系统(tǒng)、硬件生态系统）、吞(tūn)吐量(liàng)（GPU、Algo软(ruǎn)件、网(wǎng)络、系统(tǒng)软件(jiàn)、软(ruǎn)件生态系统(tǒng)）、使用率（Algo Lib，软件生态系统(tǒng)）、采购运(yùn)营、生命周期最佳化、电力]。

　　ACE代工服务：用AI激(jī)活(huó)NPC生命

　　游戏(xì)一直是备(bèi)受关(guān)注的一大AI应(yīng)用落地领域(yù)。英伟达也在大会上宣(xuān)布，推出面(miàn)向游戏的定制AI模型(xíng)代工服务NVIDIA Avatar Cloud Engine（ACE）。

　　它能赋予非玩家角色(sè)（NPC）更智能且不断进(jìn)化的(de)对话(huà)技能，中间件、工具和(hé)游戏(xì)开发者可使(shǐ)用(yòng)它来构(gòu)建和(hé)部(bù)署定制的语音、对话和(hé)动(dòng)画AI模型。

　　其中(zhōng)包括：英伟达NeMo，使用(yòng)专有数据构建、定制(zhì)和(hé)部署(shǔ)语言模(mó)型；英伟达Riva，用(yòng)于自动语音识别(bié)和文本转(zhuǎn)语音实现实时语音(yīn)对话；英伟达Omniverse Audio2Face，用于即时创建游戏角色表情动画，以匹配任何语音(yīn)轨道(dào)。

　　开发(fā)人员可选择集成(chéng)整个(gè)NVIDIA ACE for Games解决方(fāng)案，也可仅使(shǐ)用(yòng)需要的(de)组件(jiàn)。

　　新参考(kǎo)工作流(liú)程(chéng)：帮助建设数字化智能工(gōng)厂

　　黄仁勋表示，全球(qiú)电子制(zhì)造商(shāng)正在使(shǐ)用一(yī)种(zhǒng)全新的综(zōng)合参考工作流(liú)程推进工业数字化(huà)工作，该工作流程结合了英(yīng)伟(wěi)达用于(yú)生(shēng)成式AI、3D协作、仿真和自主机(jī)器(qì)的技(jì)术，包括：

　　英伟达Omniverse，其连接了顶(dǐng)级计(jì)算机辅助设(shè)计应(yīng)用以及(jí)生成式AI的API和(hé)前沿(yán)框架；用于模拟和测试机(jī)器人的英伟达(dá)Isaac Sim应用程序；英伟达Metropolis视(shì)觉AI框架，用于(yú)自(zì)动光学(xué)检测。

　　同时，黄仁勋现场展示了一(yī)个完全数(shù)字化(huà)的(de)智能工厂的演(yǎn)示。

　　目前富士康工业(yè)互联(lián)网、宜鼎国际、和硕、广达和(hé)纬(wěi)创(chuàng)正(zhèng)在使用这(zhè)一参(cān)考工作流程，具体用(yòng)例包括电路板质保(bǎo)检测(cè)点自(zì)动(dòng)化、光学(xué)检测自动(dòng)化、建(jiàn)设虚拟工(gōng)厂、模拟协作机器人、构建及运(yùn)营数字(zì)孪生(shēng)等。

　　MGX服务(wù)器(qì)规范：快速高效构建百余种服务器配置

　　英伟达发布NVIDIA MGX服务器规范，为系统制造商提供模块化(huà)参考架构，满(mǎn)足各(gè)种规(guī)模(mó)的数据中心需求。系(xì)统(tǒng)制造商可使(shǐ)用它快(kuài)速且(qiě)经济高效地(dì)构建100多种服务器(qì)配置，以适应广泛的(de)AI、HPC及NVIDIA Omniverse应用。

　　MGX支持英伟(wěi)达全(quán)系列GPU、CPU、DPU和网络适配器(qì)、各种x86、完整(zhěng)软件(jiàn)堆栈及(jí)Arm处理器，还(hái)可集成(chéng)到云和企业数据中心中。

　　华硕、和硕(shuò)、QCT、超微（Supermicro）等都将采(cǎi)用(yòng)MGX构建下(xià)一代加速(sù)计算机，可将开(kāi)发成本削(xuē)减多(duō)达3/4，并将开发时间缩短(duǎn)2/3至仅需6个月(yuè)。

　　其中，QCT和(hé)超微基(jī)于MGX的设(shè)计将(jiāng)于(yú)8月(yuè)面(miàn)世。超微昨日公布(bù)的(de)ARS-221GL-NR系统将采用Grace CPU，而QCT的S74G-2U系统将采用Grace Hopper。

　　推出Spectrum-X网络平(píng)台构建超大(dà)规(guī)模生成式AI超级计(jì)算机Israel-1

　　另外，黄(huáng)仁(rén)勋宣布推出NVIDIA Spectrum-X网络平台，旨在提高基于以太网的AI云(yún)的性能和效率(lǜ)。

　　相比传统(tǒng)以(yǐ)太(tài)网(wǎng)结构，Spectrum-X可实(shí)现1.7倍(bèi)的整(zhěng)体AI性(xìng)能和能效提升(shēng)，并具有高度(dù)通用性，可用于各种AI应用。它(tā)使用完全基于标(biāo)准(zhǔn)的以太网，并可与基于以太(tài)网的堆(duī)栈(zhàn)互操作。该(gāi)平台(tái)支持256个200Gb/s端口，通过(guò)单个交换机连接，或(huò)在两层leaf-spine拓扑中(zhōng)提供(gōng)16000个端口，以支持AI云增长和扩展，在保持性能的(de)同时最大限度(dù)减(jiǎn)少(shǎo)网(wǎng)络(luò)延迟(chí)。

　　全球(qiú)领先云计(jì)算(suàn)提供商正在采用Spectrum-X平(píng)台扩展(zhǎn)生(shēng)成式AI服务，而Spectrum-X、Spectrum-4交换(huàn)机(jī)、BlueField-3 DPU等已在戴尔、联想等系统制造(zào)商处提供。

　　此外，作为Spectrum-X参考设计的(de)蓝(lán)图(tú)和测试平台，英伟达正构建一台超大规模生(shēng)成(chéng)式AI超(chāo)级计(jì)算机Israel-1。这(zhè)台AI超算价(jià)值数亿美元，将采用(yòng)戴尔PowerEdge XE9680服务器、英(yīng)伟达HGX H100超(chāo)级计算平台、内置(zhì)BlueField-3 DPU和Spectrum-4交换机的(de)Spectrum-X平台。

　　结语

　　“40年(nián)来，我们创造了PC、互联网、移动、云，现在是人工(gōng)智能时代。你(nǐ)会创造(zào)什么？不管是什么，都要像我们一样追赶它。要(yào)奔跑(pǎo)，不(bù)要走。要么为了(le)食物奔跑，要么(me)作为食物奔跑。”

　　在5月27日的台湾大(dà)学发表了毕(bì)业典礼演讲上，黄仁勋再次强调了(le)掌握AI技术的重(zhòng)要性：很多人担心，AI会(huì)抢走(zǒu)自己的(de)工作。但真正会(huì)抢走(zǒu)你饭碗的，是掌握了AI技术的人。

　　他表示，从(cóng)各(gè)方面来(lái)看，AI的兴盛是计算机产业的再生契(qì)机。在下个十年，我们(men)的产业将(jiāng)使用新型AI电脑(nǎo)，取(qǔ)代价值万亿美元的传统电脑。

　　而从昨日(rì)大会(huì)上黄仁勋的(de)展示中，人(rén)工智能时代的未来轮廓似乎(hū)已逐渐浮现(xiàn)。

未经允许不得转载：橘子百科-橘子都知道东京是不是日本首都东京不是日本的首都吗