苹果x多重-橘子百科-橘子都知道

苹果x多重 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天机(jī)器(qì)人ChatGPT火爆以来，微(wēi)软(ruǎn)公司创始人(rén)比(bǐ)尔·盖(gài)茨已多次公(gōng)开谈(tán)论人工(gōng)智能(néng)话题。在最近的一次(cì)采访中，他再次表(biǎo)示：“AI可能会让科技行(xíng)业迎(yíng)来(lái)一次剧烈的(de)洗牌”。

这个结论是他在当地时间2月20日接受(shòu)《In Good Company》节目专访时(shí)提出的。

他预期，AI的发展可能(néng)会(huì)威(wēi)胁到谷歌的市占率，因(yīn)为微软在AI方面的行(xíng)动相当(dāng)迅速。而最终科技巨头将(jiāng)把AI整合成用(yòng)户的“全能助手”，包揽一切应(yīng)用，与人们进行沟通并提供建议，可以(yǐ)取代亚马逊、Siri或Outlook等应用。

苹果x多重大佬口中全能助手的到来(lái)可能尚需(xū)时(shí)日(rì)，但由ControlNet引(yǐn)发(fā)的又一次AI绘画(huà)浪潮苹果x多重(cháo)，让(ràng)AIGC在ChatGPT的(de)话题热点(diǎn)包围中杀出(chū)重围(wéi)。

ChatGPT之后(hòu)又一应用(yòng)杀疯了，AIGC或进入可控(kòng)期，将洗牌科(kē)技行业？_黑料(liào)正能量

ControlNet颠覆AI绘画新玩法(fǎ)

AIGC向可控靠近

以AI绘画(huà)为代表(biǎo)的AIGC上(shàng)一次爆火的时候，还是2022年(nián)8月，在美国科罗(luó)拉(lā)多州举办的新兴数字艺术家竞赛(sài)中，一幅名为《太空(kōng)歌剧院》的(de)作(zuò)品获奖。

随后各(gè)大厂商的AI绘(huì)画软件被广大网友(yǒu)熟知并体验，Stable Diffusion便是其中代表。

用(yòng)户(hù)们可以在应用中输入一(yī)组关(guān)键词或(huò)者一(yī)张照(zhào)片(piàn)，就(jiù)能获得一(yī)幅AI创作的画作(zuò)。

作画(huà)的关(guān)键(jiàn)就是所输入的文本。同一组关(guān)键词(cí)也(yě)可以创作出很多(duō)张(zhāng)风格不一样(yàng)的画作(zuò)，这让创作的过程就(jiù)像开盲(máng)盒。

很多用户很喜欢这种不(bù)确(què)定的惊(jīng)喜，他们会(huì)将生成的(de)美图(tú)当做头像。而(ér)另一部分喜欢(huān)翻看AI绘画的“翻车(chē)”作品。在社交媒(méi)体上(shàng)，许多用户分享AI“翻车现场”，例如，一(yī)位网友的小狗照片被(bèi)AI画成(chéng)了“肌肉男(nán)”，还有(yǒu)网友的(de)个人(rén)照片被(bèi)AI识别成了(le)建筑。

而如今(jīn)随着ControlNet的出现与加(jiā)持，以(yǐ)往(wǎng)AI绘画的填写关键词游戏(xì)可能(néng)要被颠覆了。

ControlNet是一位正(zhèng)在斯坦(tǎn)福读博的中(zhōng)国人张吕敏(mǐn)创(chuàng)作(zuò)的一种基于控制(zhì)点(diǎn)的图像变形算法(fǎ)，主要(yào)用于数(shù)字图像处理(lǐ)、计算机(jī)视觉(jué)和计(jì)算机图形学(xué)等领域。

其SD插件一经发布，在短短的两(liǎng)天内(nèi)便成为(wèi)了AI绘画(huà)领域最新的热点。

在此之(zhī)前，大家(jiā)用了(le)很(hěn)多方法想(xiǎng)让AI生成的结果尽可(kě)能的(de)符合要求，但是都(dōu)不(bù)尽如(rú)人意，它(tā)的出(chū)现代表着AI生(shēng)成开始(shǐ)进(jìn)入(rù)真正的可控时期。

因(yīn)为ControlNet可以(yǐ)直(zhí)接提取画面(miàn)的(de)构图，人物的姿势和画(huà)面的深度信(xìn)息等(děng)。有了它的帮助，就(jiù)不用频繁的(de)用提示词来(lái)碰运气，抽(chōu)盲盒式的创作了。

通俗(sú)的说(shuō)ControlNet相当于给AI绘画(huà)加了(le)“魔法”，不少博(bó)主的作品已经获得了(le)大量的浏(liú)览量，“viggo”就是(shì)其中之一，他用朋友的照(zhào)片直接(jiē)带(dài)她们走进动漫世界。

viggo先(xiān)用(yòng)StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件(jiàn)拓展找到对应(yīng)的(de)关键词(cí)；最后(hòu)用ControlNet插件绑(bǎng)定(dìng)骨(gǔ)骼开(kāi)始换(huàn)关(guān)键词试效果(guǒ)。

通(tōng)过图(tú)片就可以看出来，效(xiào)果(guǒ)十分惊艳。

更厉害的是，除了(le)真(zhēn)实的照片，草图也(yě)可以加(jiā)上“魔(mó)法(fǎ)”，知乎(hū)大牛(niú)“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线(xiàn)稿转全彩(cǎi)图(tú)。大神张(zhāng)吕(lǚ)敏其本尊也亲自回应。

不得不说当下AIGC已经变(biàn)得越来越强大，甚至(zhì)输(shū)出的作品(pǐn)都已经能以(yǐ)假乱(luàn)真了。

难(nán)辨虚实，AIGC技术(shù)力爆发

警惕安全问题

近日，“苏州金(jīn)鸡湖(hú)有(yǒu)游艇party”的(de)消息火遍网(wǎng)络，而经过(guò)警方(fāng)辟谣这所谓(wèi)的“party”可能(néng)是全国第(dì)一起AI绘图(tú)诈骗。

由于这(zhè)个(gè)活动里面给出的美女照片都是AI制作的真(zhēn)人照片绘图，因(yīn)为太逼真，被大家当成真(zhēn)事传播(bō)了。

不过仔细观察可以(yǐ)发现，活动发起(qǐ)者提供的照片中(zhōng)有个很大的漏洞可以(yǐ)发现并(bìng)非真人(rén)，而是AI绘图(tú)，那便是图(tú)片中女性的手(shǒu)指部(bù)分有(yǒu)的(de)存在异常。

ChatGPT之后又一(yī)应用杀疯了，AIGC或进入可控期(qī)，将洗牌科技行业？_黑料正(zhèng)能量(liàng)

有行业人事表示：“现在因(yīn)为手指部分的绘画算法比较复杂，AI还(hái)不(bù)太会画人的手，但最新看到(dào)的(de)图片已经有越来(lái)越完美的(de)AI模(mó)型(xíng)出现(xiàn)，以后(hòu)可能就完全(quán)没有(yǒu)漏洞了(le)。”

类似的AI作图诈骗(piàn)在国(guó)外也(yě)已有发(fā)生(shēng)。据英国广(guǎng)播公(gōng)司报道，土耳其地(dì)震期间，有Tiktok用户使用AI合成(chéng)了(le)儿童(tóng)受灾的(de)假照片发布到网络，以此(cǐ)诱骗善良的人打(dǎ)赏(shǎng)“捐助”从而实施诈骗。

目前(qián)随着(zhe)技术发展，AIGC已经能(néng)做(zuò)出真(zhēn)人照片般的绘图效果，如(rú)果(guǒ)这样的(de)图(tú)片被用来(lái)诈骗，将(jiāng)非常(cháng)可怕。

此外(wài)AIGC还引发(fā)了很多担忧，一(yī)方(fāng)面，批判(pàn)者认为AI在“学习”了大(dà)量前人的作品(pǐn)之(zhī)后，其创作没有任何情绪和灵(líng)魂，难以和人类(lèi)的艺术创作相(xiāng)提并论。

另一方面，AIGC背后的版权、目前都并没有(yǒu)得到有效的解决(jué)，还有AIGC会(huì)不会代(dài)替人(rén)类“至高(gāo)无(wú)上”的创意。

马斯克也(yě)强调，人(rén)工智能的安全问(wèn)题需要得到重视，太晚就来不(bù)及了。

AIGC下一站除了(le)视频，还(hái)有远(yuǎn)方

技术都(dōu)是有两面性的，潜在的危害并不(bù)能掩盖其光辉的贡献。现在看来，人工智能技术将是第四次工业革命(mìng)的(de)核心(xīn)驱动力量，将(jiāng)创(chuàng)造新的增(zēng)长奇迹。

过(guò)去一(yī)年(nián)，人工(gōng)智能在技术(shù)和商业层(céng)面都有(yǒu)了巨大进展，AI绘画(huà)就是(shì)人工智(zhì)能技术发生方向性改变的一(yī)个代表。其下一站或许就是视(shì)频。

此(cǐ)前，Meta和谷歌(gē)先后发布了几条引爆科(kē)技圈的短视(shì)频。这些(xiē)视频引发关(guān)注并非内容做得多优秀，反而都非常简(jiǎn)单，比如一匹正在喝水的马，一只画画的玩具熊，或者一段骑摩托车的(de)第(dì)一视角录像，随便一(yī)个(gè)有手机(jī)的人都可以(yǐ)随(suí)手录下一段。

但这些短视频的创作方式(shì)非(fēi)常简(jiǎn)单，创作者仅仅需要向AI输入一段话，甚至只是说一下(xià)要求，AI就可以根(gēn)据(jù)需要生(shēng)成(chéng)一段视频。

谷歌发布的(de)两(liǎng)个AI生成视频分别来自于Imagen Video和Phenaki，前者主要(yào)突出的是高清(qīng)，与(yǔ)Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了(le)AI生(shēng)成的视频(pín)后，AI圈就已经玩了一波梗，一个能够做(zuò)出更高清视频的AI还不足(zú)以在(zài)短时(shí)间内戳中兴奋(fèn)点(diǎn)。

Phenaki更加令人震惊的地方在于，它可以制作(zuò)出超过(guò)2分(fēn)钟的连贯的也(yě)有确(què)切内容(róng)的视频，这才是(shì)真正让人(rén)们感到惊喜的地方。因(yīn)为无论(lùn)AI生(shēng)成的视频(pín)多(duō)么高(gāo)清，也(yě)只能是为内容生产者提供一个(gè)灵感，一个素(sù)材，一个过场动(dòng)画。

不过能(néng)够制作(zuò)出有具体(tǐ)剧情内容的视频(pín)就意味着(zhe)，一些(xiē)视频(pín)创(chuàng)作(zuò)由AI代替(tì)人工完成(chéng)已(yǐ)经初步有(yǒu)了可能。

当(dāng)下AI的发展速度已经(jīng)超过大部分人的(de)想象。内容(róng)产业的(de)本质是供(gōng)给创(chuàng)造(zào)需求，AIGC作为全新的内(nèi)容生产方式，可以为(wèi)内容产业带来更(gèng)新的(de)内容风(fēng)格、更快的生(shēng)产速度，更低的生产成本，这无疑(yí)会驱动内容产业的大爆发。

除了AI绘图(tú)、视频，AIGC技(jì)术还能应用(yòng)于音乐、代(dài)码(mǎ)、机器人动(dòng)作(zuò)等多种内(nèi)容形式的生成。不难(nán)发(fā)现该(gāi)项技(jì)术不仅在游戏等行业能得到(dào)有效应用，对于下一代互联网各(gè)种元素的构(gòu)建亦有关键意义(yì)。

从(cóng)商(shāng)业化的(de)角度来看(kàn)，文化娱乐、教(jiào)育、传媒等诸多领域，本身就对(duì)基(jī)于(yú)AI的可视化内(nèi)容有强烈(liè)需求。

因此，AI绘画(huà)及视频或不是结果，而只是AI进程中的(de)一块重要拼图，有望在技(jì)术更(gèng)新(xīn)的加持(chí)下实现(xiàn)更大的应用价值(zhí)。

AI从(cóng)理(lǐ)解内(nèi)容，走向了可以生成内容(róng)，甚至能够创造(zào)出独立价值和独立视角的内容。AIGC的再(zài)次出圈，更(gèng)代表着未(wèi)来的(de)先(xiān)进生产(chǎn)力即将到来(lái)。

紧抓大模(mó)型与算(suàn)力，牢固AIGC底座

从(cóng)技术的发展也可(kě)以看出，在语言大模型、图像大模型(xíng)之后，多模态(tài)大模(mó)型已经成为了新的趋势(shì)。

大模型被誉为当(dāng)前人工智(zhì)能(néng)发展苹果x多重的智能底座，是全球竞争(zhēng)最激(jī)烈(liè)的研究方向(xiàng)之一，包(bāo)括(kuò)谷歌、亚马逊、百度、阿里、腾讯(xùn)等众(zhòng)多头(tóu)部企业都在竞(jìng)相发力。

不过(guò)训练大模型的(de)确(què)价格不菲，以(yǐ)国盛(shèng)证券(quàn)发布的(de)《ChatGPT需要多少算力》报告估算(suàn)，GPT-3训练一次(cì)的成本约为140万美元。而(ér)对于(yú)一些(xiē)更大的LLM(大(dà)型语言模型)，训练成本则介于(yú)200万美元至1200万美元高价之间。

以ChatGPT在2023年1月的独立(lì)访(fǎng)客平均数1300万计(jì)算，其对应芯片需(xū)求(qiú)为3万多片英伟达A100 GPU，初始投入成(chéng)本约为8亿美元，每日(rì)仅电费就在(zài)5万美(měi)元左右。

此外(wài)不论是ChatGPT还是AIGC，都离(lí)不开(kāi)庞大算力(lì)支(zhī)持。在关注各(gè)类大(dà)模型的发展同时，更(gèng)应该关注算力网络的建设(shè)。

算力网(wǎng)络(luò)正(zhèng)驱动AI产业发展进(jìn)入史(shǐ)诗级加速进程，让(ràng)AIGC及通用(yòng)AI这一人(rén)工智能发展的终(zhōng)极目(mù)标离得(dé)更近(jìn)。

因为算力可以对突(tū)破性技术(shù)创新提供大力的(de)支持。这方面，多模态大模型是典型。作为面向(xiàng)未来强人工智能、通用(yòng)人工智(zhì)能的重(zhòng)要技术(shù)创(chuàng)新，多模态大模(mó)型已经(jīng)在人工智能领域提(tí)出了很多(duō)年，业界也有不(bù)少技术突破，但是，多模态大(dà)模型进一步往(wǎng)下走，算(suàn)力需求(qiú)呈几何(hé)式上升(shēng)，一(yī)般的算力基础设施很快将难以胜任。

从图像、文字(zì)、语音(yīn)单独一项的训练(liàn)，到双模(mó)态、三模态的跃迁，让人工(gōng)智能可(kě)以灵活应(yīng)对不(bù)同模态的转化(huà)、像人与世界交互一样自然，这方面，由算力网(wǎng)络(luò)来驱(qū)动将有明显(xiǎn)优势。