戴自动蝴蝶去上班感受，被要求带着玩具上班-橘子百科-橘子都知道

戴自动蝴蝶去上班感受，被要求带着玩具上班 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机(jī)器人ChatGPT火爆(bào)以来，微软公司创始人比尔·盖茨已多次(cì)公(gōng)开谈论(lùn)人(rén)工智能话(huà)题(tí)。在最近的一次采访中，他再次表示：“AI可(kě)能会(huì)让科技行业迎(yíng)来一(yī)次剧烈的(de)洗牌”。

这(zhè)个(gè)结论是他在当地时间2月20日接受《In Good Company》节目专(zhuān)访时提(tí)出(chū)的。

他预期，AI的发(fā)展可能(néng)会威胁到谷歌(gē)的市占率，因为微(wēi)软在AI方面(miàn)的行动相当迅速。而最终科技巨头将把(bǎ)AI整合(hé)成用户的“全能助手”，包揽一切应用，与人们(men)进行沟(gōu)通并(bìng)提供建议(yì)，可以取代(dài)亚马逊(xùn)、Siri或Outlook等应用。

大佬口中全能助手的到来可能尚需时(shí)日(rì)，但由ControlNet引(yǐn)发的(de)又一次AI绘画浪潮，让AIGC在ChatGPT的话题热(rè)点包围中杀出(chū)重围(wéi)。

ChatGPT之(zhī)后又(yòu)一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？_黑料正能量

ControlNet颠(diān)覆AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次(cì)爆火的(de)时候，还(hái)是2022年8月(yuè)，在(zài)美国科罗拉多州举办的新(xīn)兴(xīng)数字艺术(shù)家(jiā)竞赛中，一(yī)幅名为《太空(kōng)歌剧院》的作品获奖。

随(suí)后各大(dà)厂商的AI绘画软件被广大网友(yǒu)熟知并体验，Stable Diffusion便是其中代表。

用户(hù)们可(kě)以(yǐ)在应用中(zhōng)输(shū)入一组关键词(cí)或者一张照片，就能获得一(yī)幅(fú)AI创作的画作。

作画的关键就是(shì)所输入的文(wén)本。同(tóng)一组(zǔ)关键词也可(kě)以创作出很多张风格(gé)不一(yī)样的画作，这让创(chuàng)作的过程就像开盲盒。

很多用户很喜(xǐ)欢(huān)这(zhè)种不(bù)确定的惊喜，他们会将生成的美图当做头像。而另一(yī)部分喜(xǐ)欢翻看AI绘画的“翻车”作品。在社交媒(méi)体上，许(xǔ)多用户分享AI“翻(fān)车现场”，例(lì)如，一位网友的小狗照片被AI画(huà)成了“肌肉男”，还(hái)有(yǒu)网(wǎng)友的个(gè)人(rén)照片被AI识别成了建筑。

而(ér)如今随着(zhe)ControlNet的出现与加持，以往AI绘画的填写(xiě)关(guān)键词(cí)游戏可能要被颠覆了。

ControlNet是一位正(zhèng)在斯坦福(fú)读博的中(zhōng)国(guó)人张吕(lǚ)敏(mǐn)创(chuàng)作的一种基于控(kòng)制点的图像变形算法，主要(yào)用于数字(zì)图像处理、计算机(jī)视(shì)觉和计算机图形学(xué)等领域。

其SD插件一经发布，在短(duǎn)短的两(liǎng)天内(nèi)便成为(wèi)了AI绘画领域(yù)最新(xīn)的热点。

在(zài)此之前，大家用了(le)很多方法想让AI生成(chéng)的(de)结果尽可(kě)能的(de)符合要求，但是(shì)都不尽如人意，它的出现代表着AI生(shēng)成开(kāi)始进入真正的可控时期。

因为ControlNet可以直接(jiē)提(tí)取画面的构图，人物的姿势和画面的深度信息等。有(yǒu)了(le)它的帮助，就不(bù)用频繁的用提示词(cí)来碰运气，抽(chōu)盲(máng)盒式的创作了。

通俗的说(shuō)ControlNet相(xiāng)当(dāng)于给(gěi)AI绘画(huà)加了“魔(mó)法”，不少博主的(de)作品已经获得了大量的(de)浏览量(liàng)，“viggo”就(jiù)是其中之一(yī)，他用朋友的照(zhào)片直接带(dài)她们走进动漫世(shì)界。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关键词；最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始(shǐ)换(huàn)关键词试(shì)效果(guǒ)。

通过图片就可以(yǐ)看出(chū)来，效果(guǒ)十分惊(jīng)艳。

更厉害的是，除了真(zhēn)实的照(zhào)片(piàn)，草图也可以(yǐ)加上“魔(mó)法”，知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能实现线(xiàn)稿转全彩图。大(dà)神张吕敏其本尊也(yě)亲自回应。

不(bù)得(dé)不说当下AIGC已经变得越来越(yuè)强大，甚(shèn)至输出的作品都已(yǐ)经(jīng)能以假乱真了。

难辨虚实，AIGC技术力爆发

警惕(tì)安全(quán)问题(tí)

近日，“苏州(zhōu)金鸡(jī)湖有游艇party”的消(xiāo)息(xī)火(huǒ)遍网络，而经(jīng)过警方辟(pì)谣这所谓(wèi)的(de)“party”可能是全(quán)国第一起AI绘图诈(zhà)骗。

由于(yú)这个活动(dòng)里面(miàn)给(gěi)出的美女照片都是AI制作的(de)真人照片绘(huì)图，因(yīn)为(wèi)太逼真，被大(dà)家当成真(zhēn)事传播了。

不过仔(zǎi)细观察(chá)可(kě)以发现(xiàn)，活(huó)动发起者提(tí)供的照片中有个很(hěn)大的漏洞可(kě)以(yǐ)发现并非真(zhēn)人，而是AI绘图，那便是图片中女(nǚ)性的手(shǒu)指(zhǐ)部(bù)分有的存(cún)在异常。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了，AIGC或进(jìn)入(rù)可控(kòng)期，将洗牌科技(jì)行业？_黑(hēi)料正能量

有行(xíng)业人事表示：“现在因(yīn)为手指(zhǐ)部分的绘(huì)画算法比较复杂，AI还不太会画人的手，但最新看到的(de)图片已经有越来越完美(měi)的(de)AI模型出现，以后(hòu)可能就完全没有漏洞了。”

类似的AI作图诈骗在(zài)国外也(yě)已(yǐ)有发生。据英(yīng)国广播公司报(bào)道，土耳(ěr)其地震期间，有Tiktok用户使用AI合成(chéng)了儿童受(shòu)灾(zāi)的(de)假照片发布到网络，以此诱骗善良的人打赏“捐(juān)助”从而实施(shī)诈骗。

目前随着(zhe)技术发展，AIGC已经能做(zuò)出(chū)真(zhēn)人照片般的绘图(tú)效果，如果(guǒ)这样的(de)图片(piàn)被(bèi)用来(lái)诈骗(piàn)，将非(fēi)常(cháng)可怕。

此外AIGC还引发(fā)了很(hěn)多担忧，一方面，批(pī)判者认为AI在“学习”了大量前人的(de)作品(pǐn)之后，其创作没有任何情绪(xù)和灵魂，难以和(hé)人类的艺术创作(zuò)相提并论。

另一方面，AIGC背后的版权、目前都并没有(yǒu)得(dé)到有(yǒu)效的解决(jué)，还有AIGC会不会代替人类“至高无上”的创意(yì)。

马斯克也强调，人(rén)工智能的安全问题需要(yào)得到(dào)重视(shì)，太晚就来不及了(le)。

AIGC下一(yī)站除了视频(pín)，还有远方(fāng)

技术都(dōu)是有两面性的，潜(qián)在的(de)危害(hài)并不能掩盖其光(guāng)辉的贡献。现在(zài)看来，人工智(zhì)能技术将是第四次(cì)工业(yè)革命的核(hé)心(xīn)驱动(dòng)力量，将(jiāng)创造新的增(zēng)长奇迹。

过去一年(nián)，人工智能在技术和商(shāng)业层面都有了巨大进展，AI绘画就是人(rén)工智能(néng)技术发生方向性(xìng)改变的一个代表。其下一站或许就是视频。

此前，Meta和谷歌先后发布了几(jǐ)条引爆科技圈(quān)的短(duǎn)视频。这些视频引发关注并非内(nèi)容做得(dé)多优秀，反而都(dōu)非常(cháng)简单，比如一匹正在(zài)喝(hē)水的(de)马，一只画(h戴自动蝴蝶去上班感受，被要求带着玩具上班uà)画的玩(wán)具熊，或者一(yī)段骑摩托车的第(dì)一视角录像，随便一个有(yǒu)手(shǒu)机的人(rén)都可以随(suí)手录(lù)下一(yī)段。

但这些短视频的创作方式非(fēi)常简(jiǎn)单，创作者(zhě)仅仅需要(yào)向(xiàng)AI输入一段话，甚至只是说一(yī)下要求，AI就可以根(gēn)据需(xū)要生成(chéng)一段视频。

谷歌发(fā)布的两个(gè)AI生(shēng)成视频分别来自于Imagen Video和Phenaki，前者主要突出的是高清，与Meta的Make-A-Video没有太多(duō)的差(chà)别(bié)。

在Make-A-Video公布了AI生成的视频(pín)后，AI圈就(jiù)已经(jīng)玩(wán)了(le)一(yī)波梗，一(yī)个能(néng)够做(zuò)出更高清视频的AI还不足以在短时间内(nèi)戳(chuō)中兴(xīng)奋点。

Phenaki更加(jiā)令人(rén)震惊的(de)地方在于，它可以制作(zuò)出超(chāo)过2分钟的连贯的也有确切内(nèi)容的视频，这(zhè)才是真正(zhèng)让人们(men)感(gǎn)到惊(jīng)喜的地(dì)方。因为无论AI生成(chéng)的视频多么(me)高清，也只能是为内容生产者提供一(yī)个灵感，一(yī)个(gè)素(sù)材，一个过场动画。

不过能够制作出有(yǒu)具(jù)体剧情内容(róng)的视(shì)频就意味着，一些视频创作由AI代替人工完成已经(jīng)初步(bù)有了可(kě)能。

当下AI的发展(zhǎn)速度已经超过大部分人(rén)的(de)想象。内容产业的本质是供给创造需(xū)求，AIGC作为全新的内容(róng)生产方(fāng)式，可以为内(nèi)容产业带来更新的内容(róng)风格(gé)、更(gèng)快的(de)生(shēng)产速度，更(gèng)低的生(shēng)产成(chéng)本，这无疑会驱动内容产(chǎn)业的大爆发。

除了AI绘(huì)图、视(shì)频(pín)，AIGC技术还能(néng)应(yīng)用于音乐、代(dài)码、机器(qì)人动作(zuò)等多种(zhǒng)内容形(xíng)式的生成。不难(nán)发现(xiàn)该项技术不仅在游(yóu)戏等(děng)行(xíng)业能得到(dào)有效应用(yòng)，对于(yú)下一代互联网各种元(yuán)素的构建亦有关键意义(yì)。

从(cóng)商业化的角度来看(kàn)，文化(huà)娱乐、教育、传媒等诸多(duō)领域，本身就(jiù)对基于AI的可视化内容有强烈需求。

因此，AI绘画及视频或不是(shì)结果，而(ér)只是AI进(jìn)程中的一块(kuài)重要(yào)拼图，有望在(zài)技术更新的加持(chí)下实现更(gèng)大的(de)应用价值。

AI从(cóng)理解内(nèi)容(róng)，走向了可以生成内容，甚至能(néng)够(gòu)创(chuàng)造出独(dú)立(lì)价值和独立(lì)视角的内容。AIGC的再(zài)次出圈，更代表着未来的先进生产力(lì)即将(jiāng)到来。

紧抓(zhuā)大模型与算力，牢固AIGC底座(zuò)

从技术的发展也可以看出，在(zài)语言大(dà)模型、图像大模(mó)型之后，多模态(tài)大模型(xíng)已经成为了新的(de)趋势。

大模型被誉为当前人工智(zhì)能(néng)发展的(de)智能(néng)底座，是(shì)全球(qiú)竞争最激烈的研(yán)究方向之一，包括谷歌、亚马(mǎ)逊、百度、阿里(lǐ)、腾讯等(děng)众(zhòng)多头部企业(yè)都在竞相(xiāng)发力。

不过训(xùn)练大模型的确价(jià)格不(bù)菲(fēi)，以国盛证券发布的《ChatGPT需要多少算(suàn)力》报告估算，GPT-3训练一次的(de)成本约(yuē)为140万美元。而对(duì)于一些更大的(de)LLM(大型语言模型)，训练(liàn)成本则介于200万美(měi)元至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的独立访客平(píng)均数(shù)1300万计(jì)算(suàn)，其对应(yīng)芯片需求为3万多片英伟达(dá)A100 GPU，初始投入成本约为8亿美(měi)元，每日仅电(diàn)费就在5万(wàn)美(měi)元(yuán)左(zuǒ)右(yòu)。

此外不论是ChatGPT还是AIGC，都离不开庞大(dà)算力(lì)支(zhī)持。在关注各(gè)类大(dà)模型的发展同时，更应该关注算力网(wǎng)络的建设。

算力(lì)网络(luò)正驱动AI产业发展进入史(shǐ)诗级加速进程，让AIGC及通用AI这一人工智能发展的终极目标离(lí)得更(gèng)近。

因为算力可(kě)以对突(tū)破(pò)性技术创新提(tí)供(gōng)大力的(de)支持。这方(fāng)面(miàn)，多模态大(dà)模型是(shì)典型。作为面向(xiàng)未来(lái)强(qiáng)人工(gōng)智(zhì)能、通用人工智能的重要(yào)技术(shù)创新，多模态大模(mó)型已经在人(rén)工智能领域提出了(le)很多年，业界也有不少技术突破，但(dàn)是，多(duō)模(mó)态大模(mó)型进一步往下走，算力(lì)需求呈几何(hé)式上(shàng)升(shēng)，一般的算力基础设施很快将(jiāng)难以胜任。

从图(tú)像、文字、语音(yīn)单独一项的训(xùn)练，到(dào)双模态、三模(mó)态的(de)跃迁，让人工智能可以灵活应对(duì)不同模(mó)态的转化、像(xiàng)人与世界交互(hù)一(yī)样自然，这(zhè)方面，由算力网络来驱动将(jiāng)有(yǒu)明显优(yōu)势。