鲜衣怒马少年时,不负韶华行且知，鲜衣怒马少年时全诗谁写的-橘子百科-橘子都知道

鲜衣怒马少年时,不负韶华行且知，鲜衣怒马少年时全诗谁写的 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天(tiān)机器人(rén)ChatGPT火爆以来(lái)，微(wēi)软(ruǎn)公(gōng)司创(chuàng)始(shǐ)人比尔·盖茨已多次公开谈(tán)论人工智能话题。在最近的一次采访中，他(tā)再次表示：“AI可能会让科技行业迎(yíng)来一次剧烈的(de)洗(xǐ)牌(pái)”。

这(zhè)个结论是他在当地时间2月(yuè)20日接受《In Good Company》节目(mù)专访时提出的(de)。

他预期，AI的发展(zhǎn)可能会威胁到(dào)谷歌的市占(zhàn)率(lǜ)，因为(wèi)微软在AI方面(miàn)的行动(dòng)相当迅速。而(ér)最(zuì)终科技巨头将把AI整合成(chéng)用户的“全能助手”，包(bāo)揽一切应用，与人们进行沟通(tōng)并提供建议(yì)，可(kě)以(yǐ)取(qǔ)代亚马逊、Siri或(huò)Outlook等应用。

大佬口中全能(néng)助手的到来(lái)可能尚需时(shí)日，但由ControlNet引发的又一次AI绘画浪潮，让AIGC在(zài)ChatGPT的话题热点包围中杀(shā)出重围。

ChatGPT之后又一(yī)应用杀疯了(le)，AIGC或进入(rù)可控期，将洗牌科技行业？_黑料(liào)正能(néng)量(liàng)

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的(de)AIGC上一次爆火的时候(hòu)，还(hái)是2022年8月，在美国科罗拉多州(zhōu)举办的新(xīn)兴数字艺术家竞赛中，一幅名为《太空(kōng)歌(gē)剧院(yuàn)》的作品获奖。

随后各大厂商的(de)AI绘画软件被广大网友熟知并体(tǐ)验，Stable Diffusion便是其中代表(biǎo)。

用户们可以在应(yīng)用(yòng)中输入一(yī)组关键词或者一(yī)张照片，就(jiù)能获得一(yī)幅(fú)AI创作(zuò)的画作。

作(zuò)画(huà)的关(guān)键就是所输(shū)入的文(wén)本。同一组(zǔ)关(guān)键词也可以(yǐ)创作出很多张风格(gé)不一样(yàng)的画作，这让创作的过程就(jiù)像开盲盒。

很多(duō)用户很(hěn)喜欢这种(zhǒng)不确(què)定的(de)惊喜，他们会将(jiāng)生(shēng)成(chéng)的美(měi)图当做头像。而另(lìng)一部分(fēn)喜欢翻(fān)看AI绘画(huà)的“翻(fān)车”作品。在社交媒体上，许(xǔ)多用户分享(xiǎng)AI“翻车现场”，例如，一位网(wǎng)友的小(xiǎo)狗(gǒu)照片被AI画成了(le)“肌肉男”，还(hái)有网友的个人照(zhào)片被AI识(shí)别成了建(jiàn)筑(zhù)。

而(ér)如今随(suí)着ControlNet的(de)出(chū)现(xiàn)与加(jiā)持，以往AI绘画的填写关键(jiàn)词游戏可能(néng)要被颠(diān)覆(fù)了(le)。

ControlNet是(shì)一位正在斯坦福读博(bó)的中国人张(zhāng)吕敏创作(zuò)的一种基于控制点(diǎn)的(de)图像变形算法(fǎ)，主要(yào)用(yòng)于数(shù)字图像(xiàng)处理(lǐ)、计(jì)算(suàn)机视觉和(hé)计算(suàn)机图形(xíng)学等领域。

其SD插件(jiàn)一经发布，在短短的两天(tiān)内便成(chéng)为了AI绘画领(lǐng)域最新的(de)热点。

在此(cǐ)之前，大家用了(le)很多方法想(xiǎng)让AI生成的(de)结果尽(jǐn)可能(néng)的符合要求，但是(shì)都不(bù)尽如(rú)人(rén)意，它的出(chū)现代表着AI生成开(kāi)始进入(rù)真正的(de)可控时期。

因为ControlNet可(kě)以直接提(tí)取(qǔ)画(huà)面的构(gòu)图，人物的姿势和画面(miàn)的深(shēn)度信息等。有了(le)它的(de)帮助，就不用频繁的用(yòng)提(tí)示词来碰运气，抽盲盒式的创作了。

通(tōng)俗的(de)说ControlNet相当于给AI绘画加了“魔法”，不少博(bó)主的作品已(yǐ)经获得了(le)大量(liàng)的浏览量，“viggo”就是(shì)其中(zhōng)之(zhī)一，他用(yòng)朋(péng)友的照(zhào)片(piàn)直接带她们走进动漫世界(jiè)。

viggo先用StableDiffusion图片转文(wén)字。

再用(yòng)Text2Prompt插件(jiàn)拓展(zhǎn)找到对应的关键词；最后用ControlNet插(chā)件绑定骨骼开始换关键词试效果。

通过图片就可以看出来，效果十分惊艳。

更厉害的是，除(chú)了真实的照片(piàn)，草图(tú)也可以加上“魔法”，知乎(hū)大牛“DevPoint”和“逗(dòu)砂”介绍(shào)到ControlNet还能实现(xiàn)线稿转全彩图(tú)。大(dà)神张吕敏(mǐn)其本尊也(yě)亲(qīn)自(zì)回应。

不得(dé)不(bù)说当下AIGC已经(jīng)变(biàn)得越(yuè)来越强(qiáng)大，甚至(zhì)输出的作品都已经(jīng)能(néng)以假(jiǎ)乱真了。

难辨(biàn)虚实，AIGC技术力爆发(fā)

警(jǐng)惕安全问题鲜衣怒马少年时,不负韶华行且知，鲜衣怒马少年时全诗谁写的ong>

近(jìn)日(rì)，“苏州(zhōu)金鸡湖有游艇(tǐng)party”的(de)消息火遍网络，而经过警方辟谣这所谓的“party”可能(néng)是全国(guó)第一起AI绘图诈骗。

由于这个活动里面给(gěi)出的(de)美女照片都(dōu)是AI制作的真(zhēn)人照片绘(huì)图，因为太逼真(zhēn)，被大家当成真事(shì)传播了。

不过仔(zǎi)细观察可以发现(xiàn)，活动发起者(zhě)提供的照片中有个很大(dà)的漏洞可以发(fā)现并非(fēi)真人，而是AI绘图，那(nà)便是图片(piàn)中(zhōng)女性的手(shǒu)指(zhǐ)部分有的(de)存在(zài)异常(cháng)。

有行业人事(shì)表示(shì)：“现在(zài)因为手指部分的绘画算(suàn)法(fǎ)比较复杂，AI还不太会画人的手，但最新看到的图片(piàn)已经有越(yuè)来越完美(měi)的AI模型出现(xiàn)，以后可能就(jiù)完全(quán)没(méi)有漏洞了。”

类似的AI作图诈骗在国(guó)外也(yě)已有(yǒu)发生。据英国广播公司报道，土耳其地震期间，有Tiktok用(yòng)户使(shǐ)用AI合成了儿童受灾的假照片发(fā)布到网(wǎng)络(luò)，以此诱骗善(shàn)良的人打赏“捐助”从而实(shí)施诈(zhà)骗(piàn)。

目(mù)前随着(zhe)技术(shù)发展，AIGC已经能做出真人照片般的绘图效果(guǒ)，如果这样的图片被用来(lái)诈(zhà)骗，将非(fēi)常可(kě)怕。

此外AIGC还引发了(le)很多担忧(yōu)，一方面，批判者认为AI在“学习(xí)”了大量前人的(de)作(zuò)品之(zhī)后，其创(chuàng)作没有任(rèn)何情绪和灵魂，难以和人类(lèi)的艺(yì)术创作相提并论。

另一方面，AIGC背后的(de)版权、目前都(dōu)并没有得到有效的解决，还有(yǒu)AIGC会不会代替人类“至高无(wú)上”的(de)创意。

马斯克也强调，人(rén)工智能(néng)的安全问题需要得到重视，太(tài)晚就来不及了。

03

AIGC下一站除了(le)视频，还有远方

技(jì)术都是有两面性(xìng)的，潜在的(de)危(wēi)害并不能(néng)掩盖其(qí)光辉的贡献。现在看来，人(rén)工智能技术将(jiāng)是第四次工业革(gé)命的核心驱动力量，将创造新的增长(zhǎng)奇迹。

过去(qù)一年，人(rén)工智能在技术和(hé)商业层面都有了(le)巨大进展，AI绘画就(jiù)是人工智能技术发生方向(xiàng)性(xìng)改(gǎi)变(biàn)的一(yī)个代(dài)表。其(qí)下一站或许就是视频。

此前，Meta和谷歌先后发布(bù)了几条(tiáo)引爆科技(jì)圈的(de)短(duǎn)视(shì)频。这些视频(pín)引发关注并非内(nèi)容做得多优(yōu)秀，反而都非常简(jiǎn)单，比(bǐ)如一匹(pǐ)正在(zài)喝水的马，一(yī)只画画的玩具熊，或者一段骑摩托车(chē)的第一视角(jiǎo)录(lù)像，随便一个有(yǒu)手(shǒu)机(jī)的人都(dōu)可以(yǐ)随手(shǒu)录下一段。

但这些短视频的创作方式非常简单，创作者仅仅需要向AI输入(rù)一段话，甚至只是说(shuō)一下要求，AI就可(kě)以根(gēn)据需(xū)要(yào)生成一段视频。

谷歌发布的两(liǎng)个AI生(shēng)成视(shì)频(pín)分别来自于Imagen Video和Phenaki，前者主要突出的是(shì)高清，与Meta的Make-A-Video没有太多的差别(bié)。

在Make-A-Video公布了(le)AI生(shēng)成的(de)视频后，AI圈(quān)就(jiù)已经玩了(le)一(yī)波梗，一个能够(gòu)做出(chū)更(gèng)高清视频的AI还不足(zú)以在(zài)短(duǎn)时间内(nèi)戳(chuō)中兴奋(fèn)点。

Phenaki更加令人震惊(jīng)的地方在于，它可以制作出超过2分钟的连贯的也有确切(qiè)内容(róng)的(de)视频，这才是真正(zhèng)让人们感到惊(jīng)喜的地(dì)方。因(yīn)为(wèi)无论AI生(shēng)成(chéng)的视频多么高清(qīng)，也只能是为(wèi)内容生产(chǎn)者(zhě)提供一个灵感，一个素材，一(yī)个(gè)过场(chǎng)动画。

不过能够(gòu)制作出(chū)有(yǒu)具体剧情内容的(de)视频就意味着，一些(xiē)视频创作由AI代替人工完(wán)成已经初步(bù)有了可能。

当下(xià)AI的发展速(sù)度已(yǐ)经超(chāo)过大部分人的想象。内容产业的本(běn)质是供(gōng)给创造需求，AIGC作为全新的内(nèi)容生产(chǎn)方式(shì)，可(kě)以为(wèi)内容产业带来(lái)更新的(de)内容(róng)风格、更快的生(shēng)产(chǎn)速度，更低(dī)的(de)生产成本，这无疑会驱(qū)动内(nèi)容产业的(de)大爆发。

除了AI绘(huì)图、视频，AIGC技(jì)术还(hái)能应用于(yú)音乐(lè)、代码(mǎ)、机(jī)器(qì)人动作等多(duō)种内(nèi)容(róng)形式(shì)的生成。不难发(fā)现(xiàn)该项技(jì)术(shù)不仅在游戏等行业能得到有效应用，对于(yú)下(xià)一代(dài)互联网各种元素的构建亦(yì)有关键意义。

从商业(yè)化的(de)角度来看，文化娱乐、教育、传媒(méi)等诸多领域，本身就对基(jī)于AI的可视化内(nèi)容有强烈需求。

因(yīn)此，AI绘画及视频或(huò)不是结果，而(ér)只是AI进程中的(de)一块(kuài)重要拼图，有(yǒu)望(wàng)在技(jì)术(shù)更新(xīn)的加(jiā)持下实现更(gèng)大的应用价值。

AI从(cóng)理解(jiě)内容，走(zǒu)向了可(kě)以生成内容，甚(shèn)至能够创造出独立价值(zhí)和(hé)独(dú)立(lì)视(shì)角的内容。AIGC的(de)再次(cì)出圈，更代表着未来的先进生产力(lì)即将到来。

04

紧(jǐn)抓大模型与算力，牢固AIGC底座

从技术的(de)发展也可以看出(chū)，在语(yǔ)言大模型、图像大模型之后，多模态大模型已经成为了新的趋势。

大(dà)模型(xíng)被誉为当前(qián)人工智能(néng)发展(zhǎn)的智能底座，是全球竞争最(zuì)激烈的研究方向之一，包括谷歌、亚马(mǎ)逊、百度、阿里、腾讯等众多头部企业都在(zài)竞相发力。

不过训练大模型的(de)确(què)价(jià)格不菲，以(yǐ)国盛证券发布的《ChatGPT需(xū)要多少算(suàn)力》报告估算，GPT-3训练(liàn)一次的成本(běn)约为140万美元。而对(duì)于一些(xiē)更(gèng)大(dà)的(de)LLM(大型语言模型)，训练成本则介于200万美元至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的(de)独立(lì)访客(kè)平均数1300万计算(suàn)，其(qí)对(duì)应芯片需求为3万多片英伟(wěi)达A100 GPU，初始投入(rù)成(chéng)本(běn)约为(wèi)8亿(yì)美元(yuán)，每日仅电费就在(zài)5万美元左右。

此外不论是ChatGPT还是AIGC，都离(lí)不(bù)开庞大算力支持。在关注各类大模型的发展(zhǎn)同时，更应该关注算(suàn)力网络的(de)建(jiàn)设。

算力网络正驱动AI产业(yè)发展进(jìn)入史诗级加速进程，让AIGC及通(tōng)用AI这一人工(gōng)智能发展的终(zhōng)极目(mù)标离得(dé)更近。

因为(wèi)算力可以对突(tū)破性技术创新(xīn)提供(gōng)大力的支持。这方面，多模态大模型是典型(xíng)。作为面向未来强人工智能、通用人工智能的重要技术创新，多模态大模(mó)型已经在人(rén)工(gōng)智(zhì)能领域提(tí)出了很多年(nián)，业界(jiè)也有不(bù)少技术突破，但是，多模态大模型进一步往(wǎng)下走，算力(lì)需求呈(chéng)几(jǐ)何式上升，一般的算力(lì)基础(chǔ)设施很快将难以(yǐ)胜任。

从图(tú)像(xiàng)、文字(zì)、语音单独一项的训练(liàn)，到双模态、三模态(tài)的跃迁，让人工(gōng)智能可以灵活应对(duì)不同模态的(de)转化、像人与(yǔ)世界交互一样自然，这方面，由(yóu)算力(lì)网络来驱动将有明显(xiǎn)优势。

此外，还(hái)有很多需要爆发式增长的(de)算力来(lái)支撑(chēng)的技(jì)术创(chuàng)新，将(jiāng)在人工智能算力(lì)网(wǎng)络支撑下(xià)快速推进。

AIGC已(yǐ)经露(lù)出曙光，期待在大模(mó)型和大算(suàn)力的支持下(xià)AIGC能持续颠覆内(nèi)容(róng)生产的方式，将(jiāng)创造的边际成本降低(dī)，让万众受(shòu)益(yì)。

未经允许不得转载：橘子百科-橘子都知道鲜衣怒马少年时,不负韶华行且知，鲜衣怒马少年时全诗谁写的