橘子百科-橘子都知道橘子百科-橘子都知道

戴自动蝴蝶去上班感受,被要求带着玩具上班

戴自动蝴蝶去上班感受,被要求带着玩具上班 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机(jī)器人ChatGPT火爆(bào)以来,微软公司创始人比尔·盖茨已多次(cì)公(gōng)开谈论(lùn)人(rén)工智能话(huà)题(tí)。在最近的一次采访中,他再次表示:“AI可(kě)能会(huì)让科技行业迎(yíng)来一(yī)次剧烈的(de)洗牌”。

这(zhè)个(gè)结论是他在当地时间2月20日接受《In Good Company》节目专(zhuān)访时提(tí)出(chū)的。

他预期,AI的发(fā)展可能(néng)会威胁到谷歌(gē)的市占率,因为微(wēi)软在AI方面(miàn)的行动相当迅速。而最终科技巨头将把(bǎ)AI整合(hé)成用户的“全能助手”,包揽一切应用,与人们(men)进行沟(gōu)通并(bìng)提供建议(yì),可以取代(dài)亚马逊(xùn)、Siri或Outlook等应用。

大佬口中全能助手的到来可能尚需时(shí)日(rì),但由ControlNet引(yǐn)发的(de)又一次AI绘画浪潮,让AIGC在ChatGPT的话题热(rè)点包围中杀出(chū)重围(wéi)。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

01

ControlNet颠(diān)覆AI绘画新(xīn)玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一次(cì)爆火的(de)时候,还(hái)是2022年8月(yuè),在(zài)美国科罗拉多州举办的新(xīn)兴(xīng)数字艺术(shù)家(jiā)竞赛中,一(yī)幅名为《太空(kōng)歌剧院》的作品获奖。

随(suí)后各大(dà)厂商的AI绘画软件被广大网友(yǒu)熟知并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一(yī)应用(yòng)杀疯(fēng)了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

用户(hù)们可(kě)以(yǐ)在应用中(zhōng)输(shū)入一组关键词(cí)或者一张照片,就能获得一(yī)幅(fú)AI创作的画作。

作画的关键就是(shì)所输入的文(wén)本。同(tóng)一组(zǔ)关键词也可(kě)以创作出很多张风格(gé)不一(yī)样的画作,这让创(chuàng)作的过程就像开盲盒。

很多用户很喜(xǐ)欢(huān)这(zhè)种不(bù)确定的惊喜,他们会将生成的美图当做头像。而另一(yī)部分喜(xǐ)欢翻看AI绘画的“翻车”作品。在社交媒(méi)体上,许(xǔ)多用户分享AI“翻(fān)车现场”,例(lì)如,一位网友的小狗照片被AI画(huà)成了“肌肉男”,还(hái)有(yǒu)网(wǎng)友的个(gè)人(rén)照片被AI识别成了建筑。

而(ér)如今随着(zhe)ControlNet的出现与加持,以往AI绘画的填写(xiě)关(guān)键词(cí)游戏可能要被颠覆了。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗(xǐ)牌科(kē)技行(xíng)业(yè)?_黑料正能量

ControlNet是一位正(zhèng)在斯坦福(fú)读博的中(zhōng)国(guó)人张吕(lǚ)敏(mǐn)创(chuàng)作的一种基于控(kòng)制点的图像变形算法,主要(yào)用于数字(zì)图像处理、计算机(jī)视(shì)觉和计算机图形学(xué)等领域。

其SD插件一经发布,在短(duǎn)短的两(liǎng)天内(nèi)便成为(wèi)了AI绘画领域(yù)最新(xīn)的热点。

在(zài)此之前,大家用了(le)很多方法想让AI生成(chéng)的(de)结果尽可(kě)能的(de)符合要求,但是(shì)都不尽如人意,它的出现代表着AI生(shēng)成开(kāi)始进入真正的可控时期。

因为ControlNet可以直接(jiē)提(tí)取画面的构图,人物的姿势和画面的深度信息等。有(yǒu)了(le)它的帮助,就不(bù)用频繁的用提示词(cí)来碰运气,抽(chōu)盲(máng)盒式的创作了。

通俗的说(shuō)ControlNet相(xiāng)当(dāng)于给(gěi)AI绘画(huà)加了“魔(mó)法”,不少博主的(de)作品已经获得了大量的(de)浏览量(liàng),“viggo”就(jiù)是其中之一(yī),他用朋友的照(zhào)片直接带(dài)她们走进动漫世(shì)界。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关键词;最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始(shǐ)换(huàn)关键词试(shì)效果(guǒ)。

ChatGPT之后又一(yī)应用(yòng)杀疯了,AIGC或进入(rù)可控期(qī),将洗牌科技行业?_黑料正(zhèng)能量(liàng)

通过图片就可以(yǐ)看出(chū)来,效果(guǒ)十分惊(jīng)艳。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或(huò)进入可控期(qī),将(jiāng)洗(xǐ)牌科技行业?_黑料(liào)正能量

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行(xíng)业?_黑(hēi)料正能量(liàng)

更厉害的是,除了真(zhēn)实的照(zhào)片(piàn),草图也可以(yǐ)加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍(shào)到ControlNet还能实现线(xiàn)稿转全彩图。大(dà)神张吕敏其本尊也(yě)亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑(hēi)料(liào)正能量

不(bù)得(dé)不说当下AIGC已经变得越来越(yuè)强大,甚(shèn)至输出的作品都已(yǐ)经(jīng)能以假乱真了。

02

难辨虚实,AIGC技术力爆发

警惕(tì)安全(quán)问题(tí)

近日,“苏州(zhōu)金鸡(jī)湖有游艇party”的消(xiāo)息(xī)火(huǒ)遍网络,而经(jīng)过警方辟(pì)谣这所谓(wèi)的(de)“party”可能是全(quán)国第一起AI绘图诈(zhà)骗。

由于(yú)这个活动(dòng)里面(miàn)给(gěi)出的美女照片都是AI制作的(de)真人照片绘(huì)图,因(yīn)为(wèi)太逼真,被大(dà)家当成真(zhēn)事传播了

ChatGPT之后又(yòu)一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

不过仔(zǎi)细观察(chá)可(kě)以发现(xiàn),活(huó)动发起者提(tí)供的照片中有个很(hěn)大的漏洞可(kě)以(yǐ)发现并非真(zhēn)人,而是AI绘图,那便是图片中女(nǚ)性的手(shǒu)指(zhǐ)部(bù)分有的存(cún)在异常。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或进(jìn)入(rù)可控(kòng)期,将洗牌科技(jì)行业?_黑(hēi)料正能量

有行(xíng)业人事表示:“现在因(yīn)为手指(zhǐ)部分的绘(huì)画算法比较复杂,AI还不太会画人的手,但最新看到的(de)图片已经有越来越完美(měi)的(de)AI模型出现,以后(hòu)可能就完全没有漏洞了。

类似的AI作图诈骗在(zài)国外也(yě)已(yǐ)有发生。据英(yīng)国广播公司报(bào)道,土耳(ěr)其地震期间,有Tiktok用户使用AI合成(chéng)了儿童受(shòu)灾(zāi)的(de)假照片发布到网络,以此诱骗善良的人打赏“捐(juān)助”从而实施(shī)诈骗。

目前随着(zhe)技术发展,AIGC已经能做(zuò)出(chū)真(zhēn)人照片般的绘图(tú)效果,如果(guǒ)这样的(de)图片(piàn)被(bèi)用来(lái)诈骗(piàn),将非(fēi)常(cháng)可怕。

此外AIGC还引发(fā)了很(hěn)多担忧,一方面,批(pī)判者认为AI在“学习”了大量前人的(de)作品(pǐn)之后,其创作没有任何情绪(xù)和灵魂,难以和(hé)人类的艺术创作(zuò)相提并论。

另一方面,AIGC背后的版权、目前都并没有(yǒu)得(dé)到有(yǒu)效的解决(jué),还有AIGC会不会代替人类“至高无上”的创意(yì)。

马斯克也强调,人(rén)工智能的安全问题需要(yào)得到(dào)重视(shì),太晚就来不及了(le)。

03

AIGC下一(yī)站除了视频(pín),还有远方(fāng)

技术都(dōu)是有两面性的,潜(qián)在的(de)危害(hài)并不能掩盖其光(guāng)辉的贡献。现在(zài)看来,人工智(zhì)能技术将是第四次(cì)工业(yè)革命的核(hé)心(xīn)驱动(dòng)力量,将(jiāng)创造新的增(zēng)长奇迹。

过去一年(nián),人工智能在技术和商(shāng)业层面都有了巨大进展,AI绘画就是人(rén)工智能(néng)技术发生方向性(xìng)改变的一个代表。其下一站或许就是视频。

此前,Meta和谷歌先后发布了几(jǐ)条引爆科技圈(quān)的短(duǎn)视频。这些视频引发关注并非内(nèi)容做得(dé)多优秀,反而都(dōu)非常(cháng)简单,比如一匹正在(zài)喝(hē)水的(de)马,一只画(h戴自动蝴蝶去上班感受,被要求带着玩具上班uà)画的玩(wán)具熊,或者一(yī)段骑摩托车的第(dì)一视角录像,随便一个有(yǒu)手(shǒu)机的人(rén)都可以随(suí)手录(lù)下一(yī)段。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或(huò)进入可控(kòng)期(qī),将洗牌科技行业?_黑(hēi)料正(zhèng)能量

但这些短视频的创作方式非(fēi)常简(jiǎn)单,创作者(zhě)仅仅需要(yào)向(xiàng)AI输入一段话,甚至只是说一(yī)下要求,AI就可以根(gēn)据需(xū)要生成(chéng)一段视频。

谷歌发(fā)布的两个(gè)AI生(shēng)成视频分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太多(duō)的差(chà)别(bié)。

在Make-A-Video公布了AI生成的视频(pín)后,AI圈就(jiù)已经(jīng)玩(wán)了(le)一(yī)波梗,一(yī)个能(néng)够做(zuò)出更高清视频的AI还不足以在短时间内(nèi)戳(chuō)中兴(xīng)奋点。

Phenaki更加(jiā)令人(rén)震惊的(de)地方在于,它可以制作(zuò)出超(chāo)过2分钟的连贯的也有确切内(nèi)容的视频,这(zhè)才是真正(zhèng)让人们(men)感(gǎn)到惊(jīng)喜的地(dì)方。因为无论AI生成(chéng)的视频多么(me)高清,也只能是为内容生产者提供一(yī)个灵感,一(yī)个(gè)素(sù)材,一个过场动画。

不过能够制作出有(yǒu)具(jù)体剧情内容(róng)的视(shì)频就意味着,一些视频创作由AI代替人工完成已经(jīng)初步(bù)有了可(kě)能。

当下AI的发展(zhǎn)速度已经超过大部分人(rén)的(de)想象。内容产业的本质是供给创造需(xū)求,AIGC作为全新的内容(róng)生产方(fāng)式,可以为内(nèi)容产业带来更新的内容(róng)风格(gé)、更(gèng)快的(de)生(shēng)产速度,更(gèng)低的生(shēng)产成(chéng)本,这无疑会驱动内容产(chǎn)业的大爆发。

除了AI绘(huì)图、视(shì)频(pín),AIGC技术还能(néng)应(yīng)用于音乐、代(dài)码、机器(qì)人动作(zuò)等多种(zhǒng)内容形(xíng)式的生成。不难(nán)发现(xiàn)该项技术不仅在游(yóu)戏等(děng)行(xíng)业能得到(dào)有效应用(yòng),对于(yú)下一代互联网各种元(yuán)素的构建亦有关键意义(yì)。

从(cóng)商业化的角度来看(kàn),文化(huà)娱乐、教育、传媒等诸多(duō)领域,本身就(jiù)对基于AI的可视化内容有强烈需求。

因此,AI绘画及视频或不是(shì)结果,而(ér)只是AI进(jìn)程中的一块(kuài)重要(yào)拼图,有望在(zài)技术更新的加持(chí)下实现更(gèng)大的(de)应用价值。

AI从(cóng)理解内(nèi)容(róng),走向了可以生成内容,甚至能(néng)够(gòu)创(chuàng)造出独(dú)立(lì)价值和独立(lì)视角的内容。AIGC的再(zài)次出圈,更代表着未来的先进生产力(lì)即将(jiāng)到来。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量(liàng)

04

紧抓(zhuā)大模型与算力,牢固AIGC底座(zuò)

从技术的发展也可以看出,在(zài)语言大(dà)模型、图像大模(mó)型之后,多模态(tài)大模型(xíng)已经成为了新的(de)趋势。

大模型被誉为当前人工智(zhì)能(néng)发展的(de)智能(néng)底座,是(shì)全球(qiú)竞争最激烈的研(yán)究方向之一,包括谷歌、亚马(mǎ)逊、百度、阿里(lǐ)、腾讯等(děng)众(zhòng)多头部企业(yè)都在竞相(xiāng)发力。

不过训(xùn)练大模型的确价(jià)格不(bù)菲(fēi),以国盛证券发布的《ChatGPT需要多少算(suàn)力》报告估算,GPT-3训练一次的(de)成本约(yuē)为140万美元。而对(duì)于一些更大的(de)LLM(大型语言模型),训练(liàn)成本则介于200万美(měi)元至1200万美元高价之(zhī)间。

以ChatGPT在2023年1月的独立访客平(píng)均数(shù)1300万计(jì)算(suàn),其对应(yīng)芯片需求为3万多片英伟达(dá)A100 GPU,初始投入成本约为8亿美(měi)元,每日仅电(diàn)费就在5万(wàn)美(měi)元(yuán)左(zuǒ)右(yòu)。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入可(kě)控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大(dà)算力(lì)支(zhī)持。在关注各(gè)类大(dà)模型的发展同时,更应该关注算力网(wǎng)络的建设。

算力(lì)网络(luò)正驱动AI产业发展进入史(shǐ)诗级加速进程,让AIGC及通用AI这一人工智能发展的终极目标离(lí)得更(gèng)近。

因为算力可(kě)以对突(tū)破(pò)性技术创新提(tí)供(gōng)大力的(de)支持。这方(fāng)面(miàn),多模态大(dà)模型是(shì)典型。作为面向(xiàng)未来(lái)强(qiáng)人工(gōng)智(zhì)能、通用人工智能的重要(yào)技术(shù)创新,多模态大模(mó)型已经在人(rén)工智能领域提出了(le)很多年,业界也有不少技术突破,但(dàn)是,多(duō)模(mó)态大模(mó)型进一步往下走,算力(lì)需求呈几何(hé)式上(shàng)升(shēng),一般的算力基础设施很快将(jiāng)难以胜任。

从图(tú)像、文字、语音(yīn)单独一项的训(xùn)练,到(dào)双模态、三模(mó)态的(de)跃迁,让人工智能可以灵活应对(duì)不同模(mó)态的转化、像(xiàng)人与世界交互(hù)一(yī)样自然,这(zhè)方面,由算力网络来驱动将(jiāng)有(yǒu)明显优(yōu)势。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

此外(wài),还有很多需要爆(bào)发式增长的算力来支撑的(de)技术创新(xīn),将在人(rén)工智能算力(lì)网(wǎng)络支撑(chēng)下(xià)快(kuài)速(sù)推进。

AIGC已经露(lù)出曙光(guāng),期待(dài)在大模型和大算力的支(zhī)持下AIGC能持续颠覆内容生(shēng)产的方式,将(jiāng)创造的边际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 戴自动蝴蝶去上班感受,被要求带着玩具上班

评论

5+2=