三大改造的内容和意义，简述三大改造的内容-橘子百科-橘子都知道

三大改造的内容和意义，简述三大改造的内容 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机(jī)器人ChatGPT火爆(bào)以来(lái)，微软公司创始人(rén)比(bǐ)尔·盖茨已多次公开(kāi)谈论人工智能话题。在(zài)最近的(de)一次采访中，他再(zài)次表示：“AI可能会(huì)让科(kē)技行业迎来(lái)一(yī)次剧烈的(de)洗牌”。

这个结(jié)论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访(fǎng)时提(tí)出的(de)。

他预期，AI的发展可能会威胁到谷(gǔ)歌(gē)的市占率，因为微软在AI方面(miàn)的行动相当迅速。而(ér)最终科技巨头将把AI整(zhěng)合成用(yòng)户的“全(quán)能助手”，包揽(lǎn)一切应用，与人们进行沟(gōu)通并提供建议，可以取(qǔ)代亚马(mǎ)逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的到(dào)来可能尚需时日，但(dàn)由ControlNet引发的又(yòu)一次(cì)AI绘画浪潮，让AIGC在ChatGPT的话题(tí)热点包围中杀出重围。

ChatGPT之后又一应用杀疯了，AIGC或进入可(kě)控期，将洗牌科技行业(yè)？_黑料正能(néng)量

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可控靠近(jìn)

以AI绘画为代表的AIGC上一次爆火的时候，还是2022年8月，在美国科罗(luó)拉多(duō)州(zhōu)举办的新兴数字艺(yì)术家(jiā)竞赛中，一(yī)幅名为《太空歌剧院》的作品获奖。

随后各大(dà)厂商(shāng)的AI绘画软件(jiàn)被广大网友熟知并体(tǐ)验，Stable Diffusion便(biàn)是其(qí)中代表。

用户们(men)可(kě)以在应用中输入一组(zǔ)关键词或者一张(zhāng)照(zhào)片，就(jiù)能获得一幅AI创作(zuò)的画作(zuò)。

作(zuò)画的关(guān)键就(jiù)是所输入的文本。同一组关键(jiàn)词也(yě)可以创(chuàng)作出很(hěn)多张风格不(bù)一样的画作，这让创作(zuò)的过(guò)程就像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不(bù)确定的(de)惊喜，他们(men)会将(jiāng)生成的美(měi)图(tú)当(dāng)做头像。而另一部分喜欢翻(fān)看AI绘画(huà)的“翻车”作品。在社交媒体上，许(xǔ)多用户分享AI“翻车(chē)现场(chǎng)”，例如(rú)，一位网友的小狗照片被AI画成(chéng)了“肌肉(ròu)男”，还有网(wǎng)友的个人照片(piàn)被AI识(shí)别(bié)成了建筑。

而如今(jīn)随着ControlNet的出(chū)现与加持，以往AI绘画的填(tián)写关键词游(yóu)戏(xì)可能要被颠覆了(le)。

ControlNet是一位正在(zài)斯坦福(fú)读博的中国人张吕敏创作的(de)一种基于控制点(diǎn)的图像(xiàng)变形算法(fǎ)，主(zhǔ)要用于数字图像处理、计算机视觉和计(jì)算机图形(xíng)学(xué)等领域。

其SD插件一经(jīng)发布，在短短的两天(tiān)内便成为了AI绘画领(lǐng)域(yù)最新的热点。

在此之前，大家用了(le)很多方法(fǎ)想(xiǎng)让AI生成的结果尽可能的符合(hé)要求(qiú)，但是都不尽如(rú)人意，它的出(chū)现代表着(zhe)AI生成开(kāi)始进入真正的(de)可控时期。

因为ControlNet可以直接提取画面(miàn)的构图，人(rén)物的姿势和画(huà)面的深度信(xìn)息(xī)等。有了它的帮助，就(jiù)不用(yòng)频繁的用提(tí)示词来碰运气，抽(chōu)盲盒式(shì)的(de)创作(zuò)了(le)。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画加了“魔法”，不少博主的(de)作品已经获得了大量的浏览量，“viggo”就是其中之一(yī)，他用朋友的(de)照(zhào)片直(zhí)接带她们走进动漫世界。

viggo先用(yòng)StableDiffusion图片(piàn)转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找到对(duì)应的关键(jiàn)词；最后用ControlNet插(chā)件绑定骨(gǔ)骼开始换关(guān)键(jiàn)词试效果。

通过图片(piàn)就可以看出来(lái)，效(xiào)果(guǒ)十分惊艳。

更(gèng)厉(lì)害的(de)是，除了真实的照片，草图也可以(yǐ)加上“魔法”，知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现(xiàn)线稿转全彩(cǎi)图。大神张吕敏其(qí)本(běn)尊也亲自回应。

不得不说当下(xià)AIGC已经变得(dé)越来越强(qiáng)大(dà)，甚至输出的作品都已经能(néng)以(yǐ)假(jiǎ)乱(luàn)真(zhēn)了。

难辨虚实，AIGC技术(shù)力爆发

警惕安全问题(tí)

近日，“苏(sū)州金鸡湖有游(yóu)艇party”的消息火遍网络(luò)，而经过警方辟谣这所谓(wèi)的“party”可能是全国第(dì)一起AI绘图诈骗。

由(yóu)于这(zhè)个活动里面给出的美(měi)女(nǚ)照片(piàn)都(dōu)是(shì)AI制(zhì)作的真人照片绘图，因(yīn)为太逼真，被大家当成真事传播了(le)。

不(bù)过仔(zǎi)细观察(chá)可以(yǐ)发现(xiàn)，活(huó)动(dòng)发起者提供的(de)照片中有个很大的漏洞可以发现并非真人，而(ér)是AI绘(huì)图，那便是图(tú)片中女性的(de)手(shǒu)指部分有的存在异(yì)常。

ChatGPT之后又一应用(yòng)杀(shā)疯了，AIGC或进(jìn)入可控期，将(jiāng)洗牌科技(jì)行(xíng)业？_黑(hēi)料正能量

有(yǒu)行业人事表示：“现在因为手(shǒu)指(zhǐ)部分的绘画算法比(bǐ)较复杂，AI还不太会画人的手，但最新看到的图(tú)片(piàn)已(yǐ)经有越来越完(wán)美的AI模(mó)型(xíng)出现，以后可能就完(wán)全没有漏洞了。”

类似的(de)AI作图(tú)诈(zhà)骗在国外也已有(yǒu)发生(shēng)。据(jù)英(yīng)国广播公司报道，土(tǔ)耳其地(dì)震期间，有Tiktok用户使用AI合成了儿童受灾(zāi)的假照片发(fā)布到网(wǎng)络，以(yǐ)此(cǐ)诱骗(piàn)善良的(de)人打赏“捐助”从(cóng)而(ér)实施诈骗(piàn)。

目前随着技术(shù)发展，AIGC已(yǐ)经能做出真(zhēn)人(rén)照(zhào)片般的绘图效果，如(rú)果这样的图片被用(yòng)来诈骗，将非(fēi)常可怕。

此外AIGC还引(yǐn)发了很多(duō)担忧，一(yī)方面(miàn)，批判者认(rèn)为AI在“学(xué)习(xí)”了大量前人的(de)作品之后，其创作没有任何情绪和灵(líng)魂，难以(yǐ)和人类(lèi)的艺术创(chuàng)作(zuò)相提(tí)并论。

另(lìng)一方(fāng)面，AIGC背后的版权、目(mù)前都并没(méi)有得(dé)到有(yǒu)效的解决，还(hái)有AIGC会不会代替人类“至高无上”的(de)创意。

马斯(sī)克(kè)也强调，人工智能的(de)安全问题(tí)需要得到重视，太晚就来不及了(le)。

AIGC下(xià)一站除了视(shì)频，还有远方

技术都是有两(liǎng)面性(xìng)的，潜(qián)在的危害并不能掩盖其光辉的贡献。现在看(kàn)来，人工智能技(jì)术(shù)将是第四(sì)次工(gōng)业革命的(de)核心驱动力(lì)量(liàng)，将创造新的增(zēng)长(zhǎng)奇迹。

过去一年，人工智(zhì)能在技术和(hé)商业层(céng)面都(dōu)有了巨大(dà)进展，AI绘画就是人工智能技术发生方(fāng)向性(xìng)改变(biàn)的(de)一个(gè)代表。其(qí)下一站或许就是视频。

此前，Meta和谷歌先后(hòu)发布了(le)几条引爆科技(jì)圈的短视频。这些视频(pín)引(yǐn)发关注并非(fēi)内容做(zuò)得多优秀，反而都非常简(jiǎn)单，比(bǐ)如一匹正(zhèng)在喝水的马，一只画画的玩具(jù)熊(xióng)，或者一段(duàn)骑摩(mó)托车的第一视角录像，随便一(yī)个有手机(jī)的人都可以随(suí)手(shǒu)录下一段(duàn)。

但这些短视(shì)频的(de)创作方式(shì)非常(cháng)简单，创作(zuò)者仅仅需要(yào)向AI输(shū)入一(yī)段话，甚至只是说一(yī)下要求，AI就(jiù)可(kě)以根(gēn)据(jù)需要生(shēng)成(chéng)一(yī)段视频。

谷歌发布的(de)两(liǎng)个AI生成(chéng)视频分别来自于(yú)Imagen Video和Phenaki，前者(zhě)主(zhǔ)要突出的是高清，与(yǔ)Meta的Make-A-Video没有太(tài)多的(de)差别。

在(zài)Make-A-Video公布了AI生成(chéng)的(de)视频后，AI圈就已经玩了一波梗，一个(gè)能够做出更(gèng)高(gāo)清(qīng)视频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋点(diǎn)。

Phenaki更加(jiā)令人震惊(jīng)的地(dì)方在于(yú)，它可以制(zhì)作(zuò)出(chū)超过(guò)2分(fēn)钟的(de)连贯的也有(yǒu)确(què)切内容(róng)的视频，这才是真正让人(rén)们(men)感到惊喜的地方。因为无论AI生(shēng)成的视频多么高清，也(yě)只能是为内容生产者提供一个灵(líng)感(gǎn)，一个素材，一个过场动(dòng)画。

不(bù)过能够(gòu)制作出有具体剧情内容的视频就意味着，一些视频创(chuàng)作由(yóu)AI代替人工(gōng)完成已经初步(bù)有(yǒu)了(le)可能。

当下AI的(de)发展速度已经(jīng)超过大(dà)部(bù)分人的想象。内容产业(yè)的本质是供(gōng)给创造需求，AIGC作为全新的内容生产方式，可(kě)以为内容(róng)产业带来更新(xīn)的内容风格(gé)、更快的(de)生产速度(dù)，更(gèng)低(dī)的生产成本，这无疑会驱动内容(róng)产业的大(dà)爆发。

除了AI绘(huì)图、视频(pín)，AIGC技(jì)术还能应用于音乐、代码、机器人动作等多种内容形式(shì)的生成(chéng)。不难(nán)发现该项技术不仅(jǐn)在游戏(xì)等行业能(néng)得到有效(xiào)应用，对于下(xià)一代互联网(wǎng)各种(zhǒng)元素(sù)的构(gòu)建亦有(yǒu)关(guān)键意(yì)义(yì)。

从商业化(huà)的角度来看，文化娱乐、教育、传媒等诸多领(lǐng)域，本身就(jiù)对(duì)基(jī)于AI的可视化内(nèi)容有强烈需求。

因此，AI绘画(huà)及视频或(huò)不是结果，而只(zhǐ)是AI进程中的一块重(zhòng)要(yào)拼图，有望在技术更新(xīn)的加持下(xià)实现更大的应用价值。

AI从理解内容，走向了可以生成内容，甚至能够(gòu)创造出(chū)独(dú)立价值和独立视角的(de)内容。AIGC的再次出圈，更代(dài)表着(zhe)未来的先进生产力即将(jiāng)到来。

紧抓大(dà)模型与算力，牢(láo)固AIGC底座

从(cóng)技(jì)术的发(fā)展也可以(yǐ)看出，在语(yǔ)言(yán)大模型(xíng)、图像大模型之后，多模态大模(mó)型已经成(chéng)为了新的趋势。

大模型被誉(yù)为当前人工智能发(fā)展的智能(néng)底座(zuò)，是(shì)全球竞争最激烈(liè)的研究方(fāng)向之一，包括谷歌、亚马逊、百度、阿里、腾讯等众多(duō)头(tóu)部企业都在(zài)竞相(xiāng)发力。

不过(guò)训练大模型的确价格(gé)不菲，以国盛证券发布(bù)的《ChatGPT需要多(duō)少算(suàn)力》报告(gào)估算，GPT-3训(xùn)练一次的成本约为140万(wàn)美元。而对于一些更(gèng)大(dà)的LLM(大(dà)型(xíng)语言模型(xíng))，训(xùn)练成(chéng)本则介于200万美元至1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月(yuè)的(de)独立访客平均数1300万计算(suàn)，其对应芯片需求(qiú)为3万多片英伟达(dá)A100 GPU，初始投入成本约为8亿(yì)美(měi)元，每日仅电费就在5万美元左右。

此(cǐ)外不论是ChatGPT还是AIGC，都离不(bù)开庞大算(suàn)力支持。在关(guān)注各类(lèi)大模型的发展(zhǎn)同(tóng)时，更应(yīng)该关注算力网(wǎng)络的建设。

算力网络正(zhèng)驱(qū)动AI产业发展进入史(shǐ)诗级加速进程，让AIGC及通用AI这一人工智(zhì)能发展的终极(jí)目标离得更(gèng)近。

因为(wèi)算(suàn)力可(kě)以对突(tū)破性(xìng)技术创新提供(gōng)大力的支持。这方面，多模态大模型是典型(xíng)。作为面(miàn)向未(wèi)来强人工(gōng)智能、通(tōng)用人工智能的重(zhòng)要技术创(chuàng)新，多模(mó)态大模型(xíng)已经(jīng)在人工智能领域提出了很多年(nián)，业(yè)界也有不(bù)少技术突破，但是，多模态(tài)大模型进一步往下走(zǒu)，算力需求呈几何式上升，一般的(de)算力基础设(shè)施很快将难以胜(shèng)任。

从图像(xiàng)、文字、语音单(dān)独(dú)一项的训(xùn)练，到双(shuāng)模态、三模(mó)态的跃迁，让人工智(zhì)能可以灵活应对不同模(mó)态的转(zhuǎn)化(huà)、像人与世界交互(hù)一样自(zì)然，这(zhè)方面(miàn)，由(yóu)算力(lì)网络来驱(qū)动将有明(míng)显优(yōu)势。