橘子百科-橘子都知道橘子百科-橘子都知道

苹果x多重

苹果x多重 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机(jī)器(qì)人ChatGPT火爆以来,微(wēi)软(ruǎn)公司创始人(rén)比(bǐ)尔·盖(gài)茨已多次公(gōng)开谈(tán)论人工(gōng)智能(néng)话题。在最近的一次(cì)采访中,他再次表(biǎo)示:“AI可能会让科技行(xíng)业迎(yíng)来(lái)一次剧烈的(de)洗牌”。

这个结论是他在当地时间2月20日接受(shòu)《In Good Company》节目专访时(shí)提出的。

他预期,AI的发展可能(néng)会(huì)威(wēi)胁到谷歌的市占率,因(yīn)为微软在AI方面的行(xíng)动相当(dāng)迅速。而最终科技巨头将(jiāng)把AI整合成用(yòng)户的“全能助手”,包揽一切应(yīng)用,与人们进行沟通并提供建议,可以(yǐ)取代亚马逊、Siri或Outlook等应用。

苹果x多重大佬口中全能助手的到来(lái)可能尚需(xū)时(shí)日(rì),但由ControlNet引(yǐn)发(fā)的又一次AI绘画(huà)浪潮苹果x多重(cháo),让(ràng)AIGC在ChatGPT的(de)话题热点(diǎn)包围中杀出(chū)重围(wéi)。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行业?_黑料(liào)正能量

01

ControlNet颠覆AI绘画新玩法(fǎ)

AIGC向可控靠近

以AI绘画(huà)为代表(biǎo)的AIGC上(shàng)一次爆火的时候,还是2022年(nián)8月,在美国科罗(luó)拉(lā)多州举办的新兴数字艺术家竞赛(sài)中,一幅名为《太空(kōng)歌剧院》的(de)作(zuò)品获奖。

随后各(gè)大厂商的AI绘(huì)画软件被广大网友(yǒu)熟知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量

用(yòng)户(hù)们可以在应用中输入一(yī)组关(guān)键词或(huò)者一(yī)张照(zhào)片(piàn),就(jiù)能获得一(yī)幅AI创作的画作(zuò)。

作画(huà)的关(guān)键(jiàn)就是所输入的文本。同一组关(guān)键词(cí)也(yě)可以创作出很多(duō)张(zhāng)风格不一样(yàng)的画作(zuò),这让创作的过程就(jiù)像开盲(máng)盒。

很多用户很喜欢这种不(bù)确(què)定的惊(jīng)喜,他们会(huì)将生成的(de)美图(tú)当做头像。而(ér)另一部分喜欢(huān)翻看AI绘画的“翻车(chē)”作品。在社交媒(méi)体上(shàng),许多用户分享AI“翻车现场”,例如,一(yī)位网友的小狗照片被(bèi)AI画成(chéng)了“肌肉男(nán)”,还有(yǒu)网友的(de)个人(rén)照片被(bèi)AI识别成了(le)建筑。

而如今(jīn)随着ControlNet的出现与加(jiā)持,以(yǐ)往(wǎng)AI绘画的填写关键词游戏(xì)可能(néng)要被颠覆了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

ControlNet是一位正(zhèng)在斯坦(tǎn)福读博的中(zhōng)国人张吕敏(mǐn)创(chuàng)作(zuò)的一种基于控制(zhì)点(diǎn)的图像变形算法(fǎ),主要(yào)用于数(shù)字图像处理(lǐ)、计算机(jī)视觉(jué)和计(jì)算机图形学(xué)等领域。

其SD插件一经发布,在短短的两(liǎng)天内(nèi)便成为(wèi)了AI绘画(huà)领域最新的热点。

在此之(zhī)前,大家(jiā)用了(le)很(hěn)多方法想(xiǎng)让AI生成的结果尽可(kě)能的(de)符合要求,但是都(dōu)不(bù)尽如(rú)人意,它(tā)的出(chū)现代表着AI生(shēng)成开始(shǐ)进(jìn)入(rù)真正的可控时期。

因(yīn)为ControlNet可以(yǐ)直(zhí)接提取画面(miàn)的(de)构图,人物的姿势和画(huà)面的深度信(xìn)息等(děng)。有了它的帮助,就(jiù)不用频繁的(de)用提示词来(lái)碰运气,抽(chōu)盲盒式的创作了。

通俗(sú)的说(shuō)ControlNet相当于给AI绘画(huà)加了(le)“魔法”,不少博(bó)主的作品已经获得了(le)大量的浏(liú)览量,“viggo”就是(shì)其中之一,他用朋友的照(zhào)片直接(jiē)带(dài)她们走进动漫世界。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业(yè)?_黑料(liào)正能(néng)量

viggo先(xiān)用(yòng)StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件(jiàn)拓展找到对应(yīng)的(de)关键词(cí);最后(hòu)用ControlNet插件绑(bǎng)定(dìng)骨(gǔ)骼开(kāi)始换(huàn)关(guān)键词试效果(guǒ)。

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌科(kē)技行业(yè)?_黑料正能量(liàng)

通(tōng)过图(tú)片就可以看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

ChatGPT之(zhī)后(hòu)又(yòu)一(yī)应用(yòng)杀(shā)疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

更厉害的是,除了(le)真(zhēn)实的照片,草图也(yě)可以加(jiā)上“魔(mó)法(fǎ)”,知乎(hū)大牛(niú)“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线(xiàn)稿转全彩(cǎi)图(tú)。大神张(zhāng)吕(lǚ)敏其本尊也亲自回应。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

不得不说当下AIGC已经变(biàn)得越来越强大,甚至(zhì)输(shū)出的作品(pǐn)都已经能以(yǐ)假乱(luàn)真了。

02

难(nán)辨虚实,AIGC技术(shù)力爆发

警惕安全问题

近日,“苏州金(jīn)鸡湖(hú)有(yǒu)游艇party”的(de)消息火遍网(wǎng)络,而经过(guò)警方(fāng)辟谣这所谓(wèi)的“party”可能(néng)是全国第(dì)一起AI绘图(tú)诈骗。

由于这(zhè)个(gè)活动里面给出的美女照片都是AI制作的真(zhēn)人照片绘图,因(yīn)为太逼真,被大家当成真(zhēn)事传播(bō)了

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了,AIGC或(huò)进入可控期(qī),将(jiāng)洗牌科技行业?_黑料正能量

不过仔细观察可以(yǐ)发现,活动发起(qǐ)者提供的照片中(zhōng)有个很大的漏洞可以(yǐ)发现并(bìng)非真人(rén),而是AI绘图(tú),那便是图(tú)片中女性的手(shǒu)指部(bù)分有(yǒu)的(de)存在异常。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料正(zhèng)能量(liàng)

有行业人事表示:“现在因(yīn)为手指部分的绘画算法比较复杂,AI还(hái)不(bù)太会画人的手,但最新看到(dào)的(de)图片已经有越来(lái)越完美的(de)AI模(mó)型(xíng)出现(xiàn),以后(hòu)可能就完全(quán)没有(yǒu)漏洞了(le)。

类似的AI作图诈骗(piàn)在国(guó)外也(yě)已有发(fā)生(shēng)。据英国广(guǎng)播公(gōng)司报道,土耳其地(dì)震期间,有Tiktok用户使用AI合成(chéng)了(le)儿童(tóng)受灾的(de)假照片发布到网络,以此(cǐ)诱骗善良的人打(dǎ)赏(shǎng)“捐助”从而实施诈骗。

目前(qián)随着(zhe)技术发展,AIGC已经能(néng)做(zuò)出真(zhēn)人照片般的绘图效果,如(rú)果(guǒ)这样的(de)图(tú)片被用来(lái)诈骗,将(jiāng)非常(cháng)可怕。

此外(wài)AIGC还引发(fā)了很多担忧,一(yī)方(fāng)面,批判(pàn)者认为AI在“学习”了大(dà)量前人的作品(pǐn)之(zhī)后,其创作没有任何情绪和灵(líng)魂,难以和人类(lèi)的艺术创作相(xiāng)提并论。

另一方面,AIGC背后的版权、目前都并没有(yǒu)得到有效的解决(jué),还有AIGC会(huì)不会代(dài)替人(rén)类“至高(gāo)无(wú)上”的创意。

马斯克也(yě)强调,人(rén)工智能的安全问(wèn)题需要得到重视,太晚就来不(bù)及了。

03

AIGC下一站除了(le)视频,还(hái)有远(yuǎn)方

技术都(dōu)是有两面性的,潜在的危害并不(bù)能掩盖其光辉的贡献。现在看来,人工智能技术将是第四次工业革命(mìng)的(de)核心(xīn)驱动力量,将(jiāng)创(chuàng)造新的增(zēng)长奇迹。

过(guò)去一(yī)年(nián),人工(gōng)智能在技术(shù)和商业层(céng)面都有(yǒu)了巨大进展,AI绘画(huà)就是(shì)人工智(zhì)能技术发生方向性改变的一(yī)个代表。其下一站或许就是视(shì)频。

此(cǐ)前,Meta和谷歌(gē)先后发布了几条引爆科(kē)技圈的短视(shì)频。这些(xiē)视频引发关(guān)注并非内容做得多优秀,反而都非常简(jiǎn)单,比如一匹正在喝水的马,一只画画的玩具熊,或者一段骑摩托车的(de)第(dì)一视角录像,随便一(yī)个(gè)有手机(jī)的人都可以(yǐ)随(suí)手录下一段。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

但这些短视频的创作方式(shì)非(fēi)常简(jiǎn)单,创作者仅仅需要向AI输入一段话,甚至只是说一下(xià)要求,AI就可以根(gēn)据(jù)需要生(shēng)成(chéng)一段视频。

谷歌发布的(de)两(liǎng)个AI生成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清(qīng),与(yǔ)Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了(le)AI生(shēng)成的视频(pín)后,AI圈就已经玩了一波梗,一个能够做(zuò)出更高清视频的AI还不足(zú)以在(zài)短时(shí)间内戳中兴奋(fèn)点(diǎn)。

Phenaki更加令人震惊的地方在于,它可以制作(zuò)出超过(guò)2分(fēn)钟的连贯的也(yě)有确(què)切内容(róng)的视频,这才是(shì)真正让人(rén)们感到惊喜的地方。因(yīn)为无论(lùn)AI生(shēng)成的视频(pín)多(duō)么高(gāo)清,也(yě)只能是为内容生产者提供一个(gè)灵感,一个素(sù)材,一个过场动(dòng)画。

不过能(néng)够制作(zuò)出有具体(tǐ)剧情内容的视频(pín)就意味着(zhe),一些(xiē)视频(pín)创(chuàng)作(zuò)由AI代替(tì)人工完成(chéng)已(yǐ)经初步有(yǒu)了可能。

当(dāng)下AI的发展速度已经(jīng)超过大部分人的(de)想象。内容(róng)产业的(de)本质是供(gōng)给创(chuàng)造(zào)需求,AIGC作为全新的内(nèi)容生产方式,可以为(wèi)内容产业带来更(gèng)新的(de)内容风(fēng)格、更快的生(shēng)产速度,更低的生产成本,这无疑(yí)会驱动内容产业的大爆发。

除了AI绘图(tú)、视频,AIGC技(jì)术还能应用(yòng)于音乐、代(dài)码(mǎ)、机器人动(dòng)作(zuò)等多种内(nèi)容形式的生成。不难(nán)发(fā)现该(gāi)项技(jì)术不仅在游戏等行业能得到(dào)有效应用,对于下一代互联网各(gè)种元素的构(gòu)建亦有关键意义(yì)。

从(cóng)商(shāng)业化的(de)角度来看(kàn),文化娱乐、教(jiào)育、传媒等诸多领域,本身就对(duì)基(jī)于(yú)AI的可视化内(nèi)容有强烈(liè)需求。

因此,AI绘画(huà)及视频或不是结果,而只是AI进程中的(de)一块重要拼图,有望在技(jì)术更(gèng)新(xīn)的加持(chí)下实现(xiàn)更大的应用价值(zhí)。

AI从(cóng)理(lǐ)解内(nèi)容,走向了可以生成内容(róng),甚至能够创造(zào)出独立价值和独立视角的内容。AIGC的再(zài)次出圈,更(gèng)代表着未(wèi)来的(de)先(xiān)进生产(chǎn)力即将到来(lái)。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科(kē)技行(xíng)业?_黑料(liào)正能量

04

紧抓大模(mó)型与算(suàn)力,牢固AIGC底座

从(cóng)技术的发展也可(kě)以看出,在语言大模型、图像大模型(xíng)之后,多模态(tài)大模(mó)型已经成为了新的趋势(shì)。

大模型被誉为当(dāng)前人工智(zhì)能(néng)发展苹果x多重的智能底座,是全球竞争(zhēng)最激(jī)烈(liè)的研究方向(xiàng)之一,包(bāo)括(kuò)谷歌、亚马逊、百度、阿里、腾讯(xùn)等众(zhòng)多头(tóu)部企业都在竞(jìng)相发力。

不过(guò)训练大模型的(de)确(què)价格不菲,以(yǐ)国盛(shèng)证券(quàn)发布的(de)《ChatGPT需要多少算力》报告估算(suàn),GPT-3训练一次(cì)的成本约为140万美元。而(ér)对于(yú)一些(xiē)更大的LLM(大(dà)型语言模型),训练成本则介于(yú)200万美元至1200万美元高价之间。

以ChatGPT在2023年1月的独立(lì)访(fǎng)客平均数1300万计(jì)算,其对应芯片需(xū)求(qiú)为3万多片英伟达A100 GPU,初始投入成(chéng)本约为8亿美元,每日(rì)仅电费就在(zài)5万美(měi)元左右。

ChatGPT之后又一(yī)应用杀疯(fēng)了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能量

此外(wài)不论是ChatGPT还是AIGC,都离(lí)不开(kāi)庞大算力(lì)支(zhī)持。在关注各(gè)类大(dà)模型的发展同时,更(gèng)应该关注算力网络的建设(shè)。

算力网(wǎng)络(luò)正(zhèng)驱动AI产业发展进(jìn)入史(shǐ)诗级加速进程,让(ràng)AIGC及通用(yòng)AI这一人(rén)工智能发展的终(zhōng)极目(mù)标离得(dé)更近(jìn)。

因为算力可以对突(tū)破性技术(shù)创新提供大力的(de)支持。这方面,多模态大模型是典型。作为面向(xiàng)未来强人工智能、通用(yòng)人工智(zhì)能的重(zhòng)要技术(shù)创(chuàng)新,多模态大模(mó)型已经(jīng)在人工智能领域提(tí)出了很多(duō)年,业界也有不(bù)少技术突破,但是,多模态大(dà)模型进一步往(wǎng)下走,算(suàn)力需求(qiú)呈几何(hé)式上升(shēng),一(yī)般的算力基础设施很快将难以胜任。

从图像、文字(zì)、语音(yīn)单独一项的训练(liàn),到双模(mó)态、三模态的跃迁,让人工(gōng)智能可(kě)以灵活应(yīng)对不(bù)同模态的转化(huà)、像人与世界交互一样自然,这方面,由算力网(wǎng)络(luò)来驱(qū)动将有明显(xiǎn)优势。

ChatGPT之(zhī)后又一应(yīng)用杀疯(fēng)了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量

此外(wài),还有很多需(xū)要爆发(fā)式增长的算力来支撑的技术创新,将在人工智能算(suàn)力网(wǎng)络支撑下快速推进。

AIGC已经(jīng)露出曙光,期(qī)待在大模型和(hé)大算力的支持(chí)下AIGC能持续颠覆内容生产的方式,将创造的边际成本降低,让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 苹果x多重

评论

5+2=