两斤大概有多重参照物，2斤有多重？-橘子百科-橘子都知道

两斤大概有多重参照物，2斤有多重？ ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人(rén)ChatGPT火爆(bào)以(yǐ)来，微软公司创始人比尔(ěr)·盖茨已多次公开谈(tán)论人(rén)工智能话(huà)题(tí)。在(zài)最近(jìn)的一次采访中(zhōng)，他再次(cì)表示(shì)：“AI可(kě)能会让(ràng)科(kē)技(jì)行业迎来一次剧烈的洗牌(pái)”。

这(zhè)个(gè)结论是他在当地(dì)时(shí)间(jiān)2月20日接(jiē)受《In Good Company》节(jié)目(mù)专访时提出的。

他预期(qī)，AI的发展可能会(huì)威胁到谷歌(gē)的市占率，因为微(wēi)软在AI方面的(de)行(xíng)动相(xiāng)当迅(xùn)速(sù)。而最终科技巨头(tóu)将把AI整(zhěng)合成用户的“全能助手”，包揽一切应(yīng)用，与(yǔ)人们进行沟通并提供建议(yì)，可以(yǐ)取代亚马逊、Siri或Outlook等(děng)应用。

大佬口(kǒu)中全能助手的到来(lái)可(kě)能尚(shàng)需时日，但(dàn)由ControlNet引发的又一次AI绘画浪潮，让AIGC在(zài)ChatGPT的话题(tí)热(rè)点包(bāo)围中杀出重围。

ChatGPT之(zhī)后又一应用杀疯了(le)，AIGC或(huò)进入(rù)可控期，将洗(xǐ)牌科技行业？_黑(hēi)料(liào)正(zhèng)能量

ControlNet颠覆AI绘画新(xīn)玩法(fǎ)

AIGC向可控靠近

以AI绘画(huà)为代表的(de)AIGC上一次爆火的时候，还(hái)是2022年8月，在美国科罗拉多州举(jǔ)办的新兴数字艺术(shù)家竞赛中，一幅(fú)名(míng)为《太空歌剧院》的作(zuò)品获(huò)奖。

随后各大(dà)厂商(shāng)的AI绘画软件被广大(dà)网(wǎng)友熟知并体验，Stable Diffusion便是其中(zhōng)代表。

用户们(men)可以(yǐ)在应用中输入一(yī)组关键词或者一(yī)张(zhāng)照(zhào)片，就能获得一(yī)幅AI创作的画作。

作画的关键就(jiù)是所输入的文本。同一组(zǔ)关键词也可以(yǐ)创(chuàng)作出很多张风格不一样的(de)画作，这让创(chuàng)作的过程就(jiù)像开盲盒。

很多用(yòng)户很(hěn)喜欢这(zhè)种不确定的(de)惊喜(xǐ)，他们会将生成的美(měi)图当(dāng)做(zuò)头像。而(ér)另一(yī)部分喜欢翻(fān)看AI绘(huì)画的(de)“翻车”作品。在社交(jiāo)媒(méi)体上，许多用(yòng)户分享AI“翻车(chē)现场”，例如，一位网友的(de)小狗照片被AI画(huà)成了“肌肉男”，还有(yǒu)网友的(de)个人(rén)照片被(bèi)AI识别(bié)成了建筑。

而如今随着ControlNet的出现与加持，以(yǐ)往AI绘画的填写关键(jiàn)词游(yóu)戏可能要被颠覆了(le)。

ControlNet是一位正在斯坦福(fú)读博的(de)中国人张吕敏创(chuàng)作的一(yī)种基于控制点(diǎn)的(de)图像变形(xíng)算法，主要用(yòng)于(yú)数字(zì)图像处理、计算机视觉和计算机(jī)图(tú)形学(xué)等领域(yù)。

其(qí)SD插件(jiàn)一经发(fā)布，在短(duǎn)短(duǎn)的两天内便(biàn)成为了AI绘(huì)画领域最(zuì)新的热点。

在此(cǐ)之前，大家用了(le)很多(duō)方法想让AI生成的结(jié)果尽可能的符合要求，但是都(dōu)不尽(jǐn)如人(rén)意，它的出现代表着AI生成开(kāi)始进入真正的可控时期。

因为ControlNet可以直接提取画面的构图，人物的姿势和(hé)画面的(de)深度信息等。有了它的帮(bāng)助(zhù)，就不用频(pín)繁的用提示(shì)词来碰运气，抽盲盒式(shì)的创作了(le)。

通俗的说ControlNet相当于(yú)给AI绘画加了“魔法”，不少博主的作品(pǐn)已经获得了大量的浏览量，“viggo”就是其中之一，他用朋友的照片直接带(dài)她们走进动漫世(shì)界。

viggo先(xiān)用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展找到对应的关键词；最后用ControlNet插件绑定骨骼开始换(huàn)关键(jiàn)词试(shì)效果。

通过图片就(jiù)可以看(kàn)出来，效果(guǒ)十(shí)分惊艳。

更厉(lì)害的是，除了真实的(de)照片，草图也(yě)可(kě)以(yǐ)加上“魔(mó)法”，知乎大(dà)牛“DevPoint”和“逗(dòu)砂”介绍到(dào)ControlNet还能(néng)实现线稿转全彩(cǎi)图。大神张吕敏其本尊(zūn)也(yě)亲自回(huí)应。

不(bù)得不(bù)说当下AIGC已经(jīng)变得越来越强大，甚(shèn)至输出的作品都已经(jīng)能以假乱真了(le)。

难辨虚实，AIGC技术(shù)力爆(bào)发

警惕安全问题

近日(rì)，“苏州金鸡湖有游艇party”的消(xiāo)息火遍网络，而(ér)经过(guò)警(jǐng)方辟谣(yáo)这所谓的“party”可能(néng)是全(quán)国(guó)第一起AI绘图诈骗。

由于这个活动里(lǐ)面给出的美女照片都是AI制(zhì)作的真人照片绘图，因为(wèi)太逼真(zhēn)，被大家当成真(zhēn)事传播了。

不(bù)过仔细观(guān)察可以发现，活动发起者(zhě)提供的照片中(zhōng)有(yǒu)个很(hěn)大的(de)漏洞(dòng)可以发(fā)现(xiàn)并非(fēi)真人，而是AI绘图，那便是(shì)图片中女(nǚ)性的手指(zhǐ)部分有的存在异常(cháng)。

ChatGPT之后又一应(yīng)用杀疯了，AIGC或进(jìn)入可控期(qī)，将洗牌科技行业？_黑料正能量(liàng)

有行业人事表示：“现(xiàn)在因为手指部分的(de)绘画算(suàn)法比较复杂，AI还不太会画人(rén)的手，但最新看到的图片已(yǐ)经有越来越完美的AI模型出(chū)现，以后可(kě)能就(jiù)完全没有漏洞了。”

类似的AI作图诈(zhà)骗(piàn)在国外也(yě)已(yǐ)有发生。据(jù)英国(guó)广播公(gōng)司报道(dào)，土耳其地震期间(jiān)，有Tiktok用(yòng)户使用AI合(hé)成了儿童受灾(zāi)的(de)假照片发布到网络(luò)，以(yǐ)此诱骗善良的人打赏“捐助”从而(ér)实施诈骗(piàn)。

目前随着技(jì)术发展，AIGC已经能做出(chū)真人照片般(bān)的绘图效果(guǒ)，如果这样的图片被用来诈骗，将(jiāng)非常可怕。

此外AIGC还引发(fā)了很多担忧，一(yī)方(fāng)面，批判者认为AI在“学习”了(le)大量前人(rén)的作品之后，其创作(zuò)没有(yǒu)任何情(qíng)绪(xù)和灵魂(hún)，难以和人类的艺术创作(zuò)相(xiāng)提(tí)并论。

另一方面，AIGC背后的版权、目前都并(bìng)没有得(dé)到有效的解决，还有AIGC会不会代替人类“至(zhì)高无上”的创意(yì)。

马斯克也强调，人工智(zhì)能(néng)的(de)安全问(wèn)题需要得到(dào)重(zhòng)视，太晚就来不及了。

AIGC下(xià)一站除了视频，还(hái)有远方

技术都是有两(liǎng)面(miàn)性的，潜在的危害并不能掩盖其光辉的贡献。现在看来，人工(gōng)智能技术将(jiāng)是第四次工业革命的核(hé)心驱(qū)动力量，将(jiāng)创造新的(de)增长奇(qí)迹。

过去一年，人工智能在技术(shù)和(hé)商(shāng)业层面都有了巨大进展，AI绘画就是(shì)人(rén)工智能技(jì)术发生方向性改变的一(yī)个代(dài)表。其下一站或许就是(shì)视频。

此(cǐ)前(qián)，Meta和谷(gǔ)歌先(xiān)后发布了几(jǐ)条引爆科技圈的(de)短视频。这些视频引发关注(zhù)并(bìng)非内容做得多(duō)优秀，反(fǎn)而(ér)都(dōu)非常简(jiǎn)单(dān)，比如一匹正在喝水的(de)马(mǎ)，一只画画的玩具熊(xióng)，或(huò)者一段(duàn)骑摩托车的第一视角(jiǎo)录像，随便一个有(yǒu)手机(jī)的人都可以(yǐ)随(suí)手录下一(yī)段。

但(dàn)这(zhè)些短视频的创作方式非(fēi)常简单，创作者仅仅(jǐn)需要(yào)向AI输(shū)入一段(duàn)话(huà)，甚至只是说一下要求，AI就可以根据需要(yào)生成一段视频(pín)。

谷(gǔ)歌发布(bù)的两个(gè)AI生(shēng)成视频分(fēn)别(bié)来(lái)自(zì)于(yú)Imagen Video和Phenaki，前者主要突出的是高清，与Meta的Make-A-Video没有(yǒu)太多(duō)的差别。

在Make-A-Video公布了(le)AI生成的视频后，AI圈就已经玩了一波梗，一个能够做出更高清视频的AI还不足(zú)以(yǐ)在(zài)短(duǎn)时间(jiān)内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令人震(zhèn)惊(jīng)的地方在于(yú)，它(tā)可(kě)以制(zhì)作(zuò)出超过2分(fēn)钟(zhōng)的连贯的也有确切(qiè)内容的视频，这(zhè)才是真正让人(rén)们(men)感到惊喜的地方。因为无论AI生成的(de)视频(pín)多么高清(qīng)，也只(zhǐ)能是为(wèi)内容生产者提供一个灵感，一个素(sù)材，一个过场动画。

不过(guò)能够制作出有具(jù)体(tǐ)剧情内容的视(shì)频就意(yì)味着，一些(xiē)视频创作(zuò)由AI代(dài)替人工(gōng)完(wán)成(chéng)已经初步(bù)有(两斤大概有多重参照物，2斤有多重？yǒu)了可(kě)能。

当下(xià)AI的发展速度(dù)已(yǐ)经超(chāo)过(guò)大(dà)部分人的想象。内(nèi)容产业的本(běn)质是供(gōng)给创(chuàng)造需求，AIGC作为全新的(de)内容生产方(fāng)式，可(kě)以为内容产(chǎn)业带来更(gèng)新的内容风格(gé)、更快的生(shēng)产速度(dù)，更低的(de)生(shēng)产成本(běn)，这(zhè)无疑会驱动内容产(chǎn)业的(de)大爆(bào)发。

除了(le)AI绘图、视频(pín)，AIGC技术还能应用(yòng)于音乐、代码、机器人动作等多种内容形式(shì)的生成。不难发现该项技术不(bù)仅在游戏等行业(yè)能得到(dào)有效应用，对于下一代互联网各种元素的构(gòu)建亦有关键意义。

从商业化的角(jiǎo)度来看，文化娱(yú)乐(lè)、教育(yù)、传媒(méi)等诸多领(lǐng)域，本(běn)身就(jiù)对基于AI的可视化内(nèi)容(róng)有强烈(liè)需求。

因此，AI绘画(huà)及视频(pín)或不(bù)是结果(guǒ)，而只(zhǐ)是AI进程中的一块重要拼图(tú)，有望在技术更新的(de)加持下实(shí)现更大的应用价值。

AI从理解内容(róng)，走向了可以(yǐ)生(shēng)成内容，甚至(zhì)能够(gòu)创造出(chū)独(dú)立价值(zhí)和独立视角的内容。AIGC的再次出圈，更代表着(zhe)未来(lái)的先进生产力即将到来。

紧抓大模(mó)型与算力，牢固AIGC底座

从技术的(de)发(fā)展也可以看出，在语言大(dà)模(mó)型、图(tú)像大模型之后，多模态(tài)大模型已经成为了新的趋势。

大模型被(bèi)誉为当前人工智(zhì)能发(fā)展的智能(néng)底座，是全球竞(jìng)争(zhēng)最激(jī)烈的研(yán)究方向之(zhī)一，包括谷歌、亚马(mǎ)逊、百度、阿里、腾讯等众多(duō)头部(bù)企业都在竞相(xiāng)发力。

不(bù)过(guò)训(xùn)练(liàn)大模型(xíng)的确价格(gé)不菲，以国盛(shèng)证券发(fā)布的《ChatGPT需要多(duō)少(shǎo)算(suàn)力》报告(gào)估算，GPT-3训练一次的(de)成本约为140万美元。而对于一些更大的LLM(大型语言模型)，训练成(chéng)本则介(jiè)于200万(wàn)美元至1200万美元高价(jià)之间。

以ChatGPT在2023年1月的(de)独(dú)立访客平均数1300万(wàn)计算，其对(duì)应(yīng)芯(xīn)片需求为3万多片英伟达A100 GPU，初始投入成本约为8亿美元(yuán)，每日仅电费就在5万美元左右。

此外不论(lùn)是ChatGPT还是AIGC，都离(lí)不(bù)开(kāi)庞大算力支持。在关(guān)注各类大模(mó)型(xíng)的发展同时，更应该(gāi)关注(zhù)算力(lì)网络的建设。

算力(lì)网(wǎng)络正驱动AI产业发展进(jìn)入史诗级加速进程，让(ràng)AIGC及通用AI这一人工(gōng)智能发展的终极目标(biāo)离得(dé)更近。

因(yīn)为(wèi)算力可以(yǐ)对(duì)突(tū)破性技(jì)术创(chuàng)新(xīn)提供大力的支持。这方面，多模(mó)态(tài)大模型是典型。作为面向未(wèi)来强人工智(zhì)能、通用人工智能的重要技术创新，多模态大模型已经在人工智(zhì)能领域提出(chū)了(le)很多年，业(yè)界也有不(bù)少技术(shù)突破(pò)，但是，多模(mó)态大模(mó)型进一步往(wǎng)下走，算力需求呈几何式上升，一般的算力基础设(shè)施很(hěn)快将难以(yǐ)胜(shèng)任。

从图像、文字、语音单独一项的训(xùn)练，到双模态、三模态的跃迁，让人工(gōng)智能可(kě)以灵(líng)活(huó)应对(duì)不同(tóng)模态的转(zhuǎn)化、像人与世界交互(hù)一样自(zì)然，这(zhè)方面(miàn)，由算(suàn)力(lì)网络来(lái)驱动(dòng)将有明显优(yōu)势。

此外，还有很(hěn)多需(xū)要(yào)爆发式增长的算力来支撑(chēng)的(de)技术(shù)创新，将在人工智(zhì)能算力网(wǎng)络支(zhī)撑下(xià)快速推进。

AIGC已经(jīng)露(lù)出曙光，期待(dài)在大(dà)模型和大算力的支持(chí)下AIGC能(néng)持续颠覆内容生产(chǎn)的方式(shì)，将(jiāng)创造(zào)的(de)边际成(chéng)本(běn)降低(dī)，让万(wàn)众(zhòng)受(shòu)益(yì)。

未经允许不得转载：橘子百科-橘子都知道两斤大概有多重参照物，2斤有多重？