橘子百科-橘子都知道橘子百科-橘子都知道

三大改造的内容和意义,简述三大改造的内容

三大改造的内容和意义,简述三大改造的内容 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器人ChatGPT火爆(bào)以来(lái),微软公司创始人(rén)比(bǐ)尔·盖茨已多次公开(kāi)谈论人工智能话题。在(zài)最近的(de)一次采访中,他再(zài)次表示:“AI可能会(huì)让科(kē)技行业迎来(lái)一(yī)次剧烈的(de)洗牌”。

这个结(jié)论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访(fǎng)时提(tí)出的(de)。

他预期,AI的发展可能会威胁到谷(gǔ)歌(gē)的市占率,因为微软在AI方面(miàn)的行动相当迅速。而(ér)最终科技巨头将把AI整(zhěng)合成用(yòng)户的“全(quán)能助手”,包揽(lǎn)一切应用,与人们进行沟(gōu)通并提供建议,可以取(qǔ)代亚马(mǎ)逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的到(dào)来可能尚需时日,但(dàn)由ControlNet引发的又(yòu)一次(cì)AI绘画浪潮,让AIGC在ChatGPT的话题(tí)热点包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业(yè)?_黑料正能(néng)量

01

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可控靠近(jìn)

以AI绘画为代表的AIGC上一次爆火的时候,还是2022年8月,在美国科罗(luó)拉多(duō)州(zhōu)举办的新兴数字艺(yì)术家(jiā)竞赛中,一(yī)幅名为《太空歌剧院》的作品获奖。

随后各大(dà)厂商(shāng)的AI绘画软件(jiàn)被广大网友熟知并体(tǐ)验,Stable Diffusion便(biàn)是其(qí)中代表。

ChatGPT之后又一应用杀(shā)疯(fēng)了(le),AIGC或(huò)进入可控期,将洗牌(pái)科技行(xíng)业(yè)?_黑料正能(néng)量

用户们(men)可(kě)以在应用中输入一组(zǔ)关键词或者一张(zhāng)照(zhào)片,就(jiù)能获得一幅AI创作(zuò)的画作(zuò)。

作(zuò)画的关(guān)键就(jiù)是所输入的文本。同一组关键(jiàn)词也(yě)可以创(chuàng)作出很(hěn)多张风格不(bù)一样的画作,这让创作(zuò)的过(guò)程就像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不(bù)确定的(de)惊喜,他们(men)会将(jiāng)生成的美(měi)图(tú)当(dāng)做头像。而另一部分喜欢翻(fān)看AI绘画(huà)的“翻车”作品。在社交媒体上,许(xǔ)多用户分享AI“翻车(chē)现场(chǎng)”,例如(rú),一位网友的小狗照片被AI画成(chéng)了“肌肉(ròu)男”,还有网(wǎng)友的个人照片(piàn)被AI识(shí)别(bié)成了建筑。

而如今(jīn)随着ControlNet的出(chū)现与加持,以往AI绘画的填(tián)写关键词游(yóu)戏(xì)可能要被颠覆了(le)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正能(néng)量

ControlNet是一位正在(zài)斯坦福(fú)读博的中国人张吕敏创作的(de)一种基于控制点(diǎn)的图像(xiàng)变形算法(fǎ),主(zhǔ)要用于数字图像处理、计算机视觉和计(jì)算机图形(xíng)学(xué)等领域。

其SD插件一经(jīng)发布,在短短的两天(tiān)内便成为了AI绘画领(lǐng)域(yù)最新的热点。

在此之前,大家用了(le)很多方法(fǎ)想(xiǎng)让AI生成的结果尽可能的符合(hé)要求(qiú),但是都不尽如(rú)人意,它的出(chū)现代表着(zhe)AI生成开(kāi)始进入真正的(de)可控时期。

因为ControlNet可以直接提取画面(miàn)的构图,人(rén)物的姿势和画(huà)面的深度信(xìn)息(xī)等。有了它的帮助,就(jiù)不用(yòng)频繁的用提(tí)示词来碰运气,抽(chōu)盲盒式(shì)的(de)创作(zuò)了(le)。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画加了“魔法”,不少博主的(de)作品已经获得了大量的浏览量,“viggo”就是其中之一(yī),他用朋友的(de)照(zhào)片直(zhí)接带她们走进动漫世界。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控(kòng)期,将(jiāng)洗(xǐ)牌科技行业(yè)?_黑(hēi)料(liào)正能(néng)量

viggo先用(yòng)StableDiffusion图片(piàn)转文字。

再用Text2Prompt插(chā)件(jiàn)拓展找到对(duì)应的关键(jiàn)词;最后用ControlNet插(chā)件绑定骨(gǔ)骼开始换关(guān)键(jiàn)词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正(zhèng)能量

通过图片(piàn)就可以看出来(lái),效(xiào)果(guǒ)十分惊艳。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可控(kòng)期,将洗牌科技(jì)行业?_黑(hēi)料(liào)正能量(liàng)

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料正能量(liàng)

更(gèng)厉(lì)害的(de)是,除了真实的照片,草图也可以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实现(xiàn)线稿转全彩(cǎi)图。大神张吕敏其(qí)本(běn)尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正能量

不得不说当下(xià)AIGC已经变得(dé)越来越强(qiáng)大(dà),甚至输出的作品都已经能(néng)以(yǐ)假(jiǎ)乱(luàn)真(zhēn)了。

02

难辨虚实,AIGC技术(shù)力爆发

警惕安全问题(tí)

近日,“苏(sū)州金鸡湖有游(yóu)艇party”的消息火遍网络(luò),而经过警方辟谣这所谓(wèi)的“party”可能是全国第(dì)一起AI绘图诈骗。

由(yóu)于这(zhè)个活动里面给出的美(měi)女(nǚ)照片(piàn)都(dōu)是(shì)AI制(zhì)作的真人照片绘图,因(yīn)为太逼真,被大家当成真事传播了(le)

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入(rù)可控(kòng)期,将洗牌科(kē)技(jì)行业?_黑料正(zhèng)能(néng)量(liàng)

不(bù)过仔(zǎi)细观察(chá)可以(yǐ)发现(xiàn),活(huó)动(dòng)发起者提供的(de)照片中有个很大的漏洞可以发现并非真人,而(ér)是AI绘(huì)图,那便是图(tú)片中女性的(de)手(shǒu)指部分有的存在异(yì)常。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技(jì)行(xíng)业?_黑(hēi)料正能量

有(yǒu)行业人事表示:“现在因为手(shǒu)指(zhǐ)部分的绘画算法比(bǐ)较复杂,AI还不太会画人的手,但最新看到的图(tú)片(piàn)已(yǐ)经有越来越完(wán)美的AI模(mó)型(xíng)出现,以后可能就完(wán)全没有漏洞了。

类似的(de)AI作图(tú)诈(zhà)骗在国外也已有(yǒu)发生(shēng)。据(jù)英(yīng)国广播公司报道,土(tǔ)耳其地(dì)震期间,有Tiktok用户使用AI合成了儿童受灾(zāi)的假照片发(fā)布到网(wǎng)络,以(yǐ)此(cǐ)诱骗(piàn)善良的(de)人打赏“捐助”从(cóng)而(ér)实施诈骗(piàn)。

目前随着技术(shù)发展,AIGC已(yǐ)经能做出真(zhēn)人(rén)照(zhào)片般的绘图效果,如(rú)果这样的图片被用(yòng)来诈骗,将非(fēi)常可怕。

此外AIGC还引(yǐn)发了很多(duō)担忧,一(yī)方面(miàn),批判者认(rèn)为AI在“学(xué)习(xí)”了大量前人的(de)作品之后,其创作没有任何情绪和灵(líng)魂,难以(yǐ)和人类(lèi)的艺术创(chuàng)作(zuò)相提(tí)并论。

另(lìng)一方(fāng)面,AIGC背后的版权、目(mù)前都并没(méi)有得(dé)到有(yǒu)效的解决,还(hái)有AIGC会不会代替人类“至高无上”的(de)创意。

马斯(sī)克(kè)也强调,人工智能的(de)安全问题(tí)需要得到重视,太晚就来不及了(le)。

03

AIGC下(xià)一站除了视(shì)频,还有远方

技术都是有两(liǎng)面性(xìng)的,潜(qián)在的危害并不能掩盖其光辉的贡献。现在看(kàn)来,人工智能技(jì)术(shù)将是第四(sì)次工(gōng)业革命的(de)核心驱动力(lì)量(liàng),将创造新的增(zēng)长(zhǎng)奇迹。

过去一年,人工智(zhì)能在技术和(hé)商业层(céng)面都(dōu)有了巨大(dà)进展,AI绘画就是人工智能技术发生方(fāng)向性(xìng)改变(biàn)的(de)一个(gè)代表。其(qí)下一站或许就是视频。

此前,Meta和谷歌先后(hòu)发布了(le)几条引爆科技(jì)圈的短视频。这些视频(pín)引(yǐn)发关注并非(fēi)内容做(zuò)得多优秀,反而都非常简(jiǎn)单,比(bǐ)如一匹正(zhèng)在喝水的马,一只画画的玩具(jù)熊(xióng),或者一段(duàn)骑摩(mó)托车的第一视角录像,随便一(yī)个有手机(jī)的人都可以随(suí)手(shǒu)录下一段(duàn)。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌(pái)科(kē)技行业?_黑(hēi)料正(zhèng)能量

但这些短视(shì)频的(de)创作方式(shì)非常(cháng)简单,创作(zuò)者仅仅需要(yào)向AI输(shū)入一(yī)段话,甚至只是说一(yī)下要求,AI就(jiù)可(kě)以根(gēn)据(jù)需要生(shēng)成(chéng)一(yī)段视频。

谷歌发布的(de)两(liǎng)个AI生成(chéng)视频分别来自于(yú)Imagen Video和Phenaki,前者(zhě)主(zhǔ)要突出的是高清,与(yǔ)Meta的Make-A-Video没有太(tài)多的(de)差别。

在(zài)Make-A-Video公布了AI生成(chéng)的(de)视频后,AI圈就已经玩了一波梗,一个(gè)能够做出更(gèng)高(gāo)清(qīng)视频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋点(diǎn)。

Phenaki更加(jiā)令人震惊(jīng)的地(dì)方在于(yú),它可以制(zhì)作(zuò)出(chū)超过(guò)2分(fēn)钟的(de)连贯的也有(yǒu)确(què)切内容(róng)的视频,这才是真正让人(rén)们(men)感到惊喜的地方。因为无论AI生(shēng)成的视频多么高清,也(yě)只能是为内容生产者提供一个灵(líng)感(gǎn),一个素材,一个过场动(dòng)画。

不(bù)过能够(gòu)制作出有具体剧情内容的视频就意味着,一些视频创(chuàng)作由(yóu)AI代替人工(gōng)完成已经初步(bù)有(yǒu)了(le)可能。

当下AI的(de)发展速度已经(jīng)超过大(dà)部(bù)分人的想象。内容产业(yè)的本质是供(gōng)给创造需求,AIGC作为全新的内容生产方式,可(kě)以为内容(róng)产业带来更新(xīn)的内容风格(gé)、更快的(de)生产速度(dù),更(gèng)低(dī)的生产成本,这无疑会驱动内容(róng)产业的大(dà)爆发。

除了AI绘(huì)图、视频(pín),AIGC技(jì)术还能应用于音乐、代码、机器人动作等多种内容形式(shì)的生成(chéng)。不难(nán)发现该项技术不仅(jǐn)在游戏(xì)等行业能(néng)得到有效(xiào)应用,对于下(xià)一代互联网(wǎng)各种(zhǒng)元素(sù)的构(gòu)建亦有(yǒu)关(guān)键意(yì)义(yì)。

从商业化(huà)的角度来看,文化娱乐、教育、传媒等诸多领(lǐng)域,本身就(jiù)对(duì)基(jī)于AI的可视化内(nèi)容有强烈需求。

因此,AI绘画(huà)及视频或(huò)不是结果,而只(zhǐ)是AI进程中的一块重(zhòng)要(yào)拼图,有望在技术更新(xīn)的加持下(xià)实现更大的应用价值。

AI从理解内容,走向了可以生成内容,甚至能够(gòu)创造出(chū)独(dú)立价值和独立视角的(de)内容。AIGC的再次出圈,更代(dài)表着(zhe)未来的先进生产力即将(jiāng)到来。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行业?_黑(hēi)料正(zhèng)能量

04

紧抓大(dà)模型与算力,牢(láo)固AIGC底座

从(cóng)技(jì)术的发(fā)展也可以(yǐ)看出,在语(yǔ)言(yán)大模型(xíng)、图像大模型之后,多模态大模(mó)型已经成(chéng)为了新的趋势。

大模型被誉(yù)为当前人工智能发(fā)展的智能(néng)底座(zuò),是(shì)全球竞争最激烈(liè)的研究方(fāng)向之一,包括谷歌、亚马逊、百度、阿里、腾讯等众多(duō)头(tóu)部企业都在(zài)竞相(xiāng)发力。

不过(guò)训练大模型的确价格(gé)不菲,以国盛证券发布(bù)的《ChatGPT需要多(duō)少算(suàn)力》报告(gào)估算,GPT-3训(xùn)练一次的成本约为140万(wàn)美元。而对于一些更(gèng)大(dà)的LLM(大(dà)型(xíng)语言模型(xíng)),训(xùn)练成(chéng)本则介于200万美元至1200万美元高价之间。

以(yǐ)ChatGPT在2023年1月(yuè)的(de)独立访客平均数1300万计算(suàn),其对应芯片需求(qiú)为3万多片英伟达(dá)A100 GPU,初始投入成本约为8亿(yì)美(měi)元,每日仅电费就在5万美元左右。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

此(cǐ)外不论是ChatGPT还是AIGC,都离不(bù)开庞大算(suàn)力支持。在关(guān)注各类(lèi)大模型的发展(zhǎn)同(tóng)时,更应(yīng)该关注算力网(wǎng)络的建设。

算力网络正(zhèng)驱(qū)动AI产业发展进入史(shǐ)诗级加速进程,让AIGC及通用AI这一人工智(zhì)能发展的终极(jí)目标离得更(gèng)近。

因为(wèi)算(suàn)力可(kě)以对突(tū)破性(xìng)技术创新提供(gōng)大力的支持。这方面,多模态大模型是典型(xíng)。作为面(miàn)向未(wèi)来强人工(gōng)智能、通(tōng)用人工智能的重(zhòng)要技术创(chuàng)新,多模(mó)态大模型(xíng)已经(jīng)在人工智能领域提出了很多年(nián),业(yè)界也有不(bù)少技术突破,但是,多模态(tài)大模型进一步往下走(zǒu),算力需求呈几何式上升,一般的(de)算力基础设(shè)施很快将难以胜(shèng)任。

从图像(xiàng)、文字、语音单(dān)独(dú)一项的训(xùn)练,到双(shuāng)模态、三模(mó)态的跃迁,让人工智(zhì)能可以灵活应对不同模(mó)态的转(zhuǎn)化(huà)、像人与世界交互(hù)一样自(zì)然,这(zhè)方面(miàn),由(yóu)算力(lì)网络来驱(qū)动将有明(míng)显优(yōu)势。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗(xǐ)牌(pái)科(kē)技行业(yè)?_黑料正能量

此外,还有很多需要(yào)爆发式增长(zhǎng)的(de)算力来支撑的技术创新,将在人工智能算力网(wǎng)络(luò)支撑下快速推(tuī)进。

AIGC已经露出(chū)曙光,期待在大(dà)模型和大(dà)算力的支持下AIGC能(néng)持续颠覆(fù)内容(róng)生产的方(fāng)式(shì),将创造的边(biān)际成本降低,让万(wàn)众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 三大改造的内容和意义,简述三大改造的内容

评论

5+2=