橘子百科-橘子都知道橘子百科-橘子都知道

武汉市有多少人口2023年,武汉市有多少人口2022总人数

武汉市有多少人口2023年,武汉市有多少人口2022总人数 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软(ruǎn)公司创始(shǐ)人(rén)比尔(ěr)·盖(gài)茨已多次(cì)公开谈论人(rén)工智能话题。在最近(jìn)的一次(cì)采访中(zhōng),他(tā)再次表示:“AI可能(néng)会让科技行业迎(yíng)来一次剧烈的洗(xǐ)牌”。

这个结论是他(tā)在当(dāng)地时间2月20日接受《In Good Company》节目专访时(shí)提出的。

他(tā)预(yù)期,AI的发(fā)展可能会威胁(xié)到谷歌的市占率,因为微软在AI方面(miàn)的行动相(xiāng)当(dāng)迅(xùn)速(sù)。而最终科技巨头(tóu)将(jiāng)把(bǎ)AI整合成用(yòng)户的“全能助手”,包(bāo)揽一(yī)切应(yīng)用,与人们(men)进行(xíng)沟(gōu)通并提供建议,可以取代亚马(mǎ)逊、Siri或(huò)Outlook等应用。

大佬口(kǒu)中全能助手的(de)到来可能尚需(xū)时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中(zhōng)杀出重围。

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业(yè)?_黑料正能(néng)量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控(kòng)靠近(jìn)

以AI绘画为代表的AIGC上一次爆火(huǒ)的时候(hòu),还是2022年8月(yuè),在美国科罗拉多(duō)州举办的新兴数字艺术家竞赛中,一幅名为《太空歌剧(jù)院(yuàn)》的(de)作品(pǐn)获奖。

随后各大厂商的AI绘画软件(jiàn)被广大网友熟知并体验,Stable Diffusion便是(shì)其中(zhōng)代表(biǎo)。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或(huò)进入可控(kòng)期,将洗牌科(kē)技行业?_黑料(liào)正能量

用户们(men)可以在应用中输入一组关键词或者(zhě)一张照片(piàn),就能获得一幅AI创作的画作。

作画的关键就(jiù)是(shì)所(suǒ)输入的(de)文本。同一组关(guān)键词也(yě)可以创作出很多(duō)张风格不一样(yàng)的画(huà)作(zuò),这(zhè)让创作的过(guò)程(chéng)就像开(kāi)盲盒。

很多用户很(hěn)喜欢这种不确定的惊喜,他们会将生(shēng)成的美图当做头像。而另一部分喜欢翻看AI绘(huì)画(huà)的“翻车”作品(pǐn)。在社交媒体(tǐ)上,许多用户(hù)分享(xiǎng)AI“翻车现场”,例如,一位网友的小狗照片(piàn)被(bèi)AI画成了“肌肉男”,还有网友的(de)个人照片被AI识别成了建(jiàn)筑(zhù)。

而如今随着ControlNet的出(chū)现与加持,以往(wǎng)AI绘(huì)画的填写(xiě)关键(jiàn)词游戏可能要被(bèi)颠覆了。

ChatGPT之后又一应用(yòng)杀(shā)疯(fēng)了,AIGC或(huò)进入(rù)可控(kòng)期,将洗牌科技行业?_黑料(liào)正能(néng)量

ControlNet是一(yī)位正在斯(sī)坦福读博的(de)中国人张(zhāng)吕敏创作(zuò)的一(yī)种基于控制点的(de)图像变形(xíng)算(suàn)法,主(zhǔ)要用于数(shù)字图(tú)像处(chù)理、计算机视觉和计算机图形(xíng)学等领(lǐng)域。

其SD插件一经发(fā)布,在短(duǎn)短的两天内(nèi)便成(chéng)为(wèi)了AI绘画领域(yù)最新的热(rè)点。

在(zài)此之前(qián),大家用了(le)很多方(fāng)法想让AI生成的结果尽(jǐn)可能的符合要求,但(dàn)是(shì)都(dōu)不(bù)尽如人意,它的出现代表着(zhe)AI生成开始进入真正的可(kě)控时期。

因为(wèi)ControlNet可以(yǐ)直接提取画面的构图,人物的(de)姿(zī)势(shì)和画面的深度(dù)信息等(děng)。有了它的(de)帮助,就不用频(pín)繁的用提(tí)示词来碰运气(qì),抽(chōu)盲盒式的(de)创作了。

通(tōng)俗的说ControlNet相当于给AI绘(huì)画加(jiā)了“魔法”,不(bù)少(shǎo)博主(zhǔ)的作品(pǐn)已经获得了大量(liàng)的浏览量,“viggo”就是其中之一(yī),他用朋友的(de)照片直接(jiē)带她(tā)们走进动漫世界。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转(zhuǎn)文字。

再(zài)用(yòng)Text2Prompt插件拓展找到(dào)对应(yīng)的关键词;最后用ControlNet插件绑定骨骼开始(shǐ)换(huàn)关键词试(shì)效果。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能(néng)量

通过图片就可以看出来,效(xiào)果十分惊艳。

ChatGPT之(zhī)后又一(yī)应用杀疯了(le),AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料(liào)正能量

ChatGPT之后又一应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量

更(gèng)厉害的是,除了真实的照片,草(cǎo)图也可以(yǐ)加上“魔法”,知乎大牛(niú)“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全彩图。大神(shén)张吕敏其(qí)本尊(zūn)也(yě)亲(qīn)自回应(yīng)。

ChatGPT之后又一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌科技行业?_黑料(liào)正能量

不得不说当下AIGC已经(jīng)变得越来越(yuè)强大(dà),甚至输出的(de)作品都已经能以假(jiǎ)乱(luàn)真了。

02

难辨虚实,AIGC技(jì)术力爆发

警(jǐng)惕安全问题(tí)

近日,“苏州金鸡湖有游艇party”的消(xiāo)息火遍网络,而经(jīng)过警方辟谣这所(suǒ)谓(wèi)的“party”可能是全国第一起AI绘(huì)图诈(zhà)骗。

由于(yú)这个活动里(lǐ)面给(gěi)出的(de)美女(nǚ)照片都是AI制作的真人照(zhào)片绘图,因为太逼真,被大家当成真事传播了

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行业?_黑料正能(néng)量

不(bù)过仔(zǎi)细观察(chá)可以发现,活动发起(qǐ)者提供的照片中有个很(hěn)大(dà)的漏洞可以(yǐ)发现并非真人,而是AI绘图,那(nà)便是图片中(zhōng)女性的手指(zhǐ)部(bù)分有的(de)存在异常。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入(rù)可控(kòng)期,将洗牌(pái)科(kē)技行业?_黑(hēi)料正能量

有行(xíng)业人事表示(shì):“现(xiàn)在因为手指部分的绘(huì)画算法比(bǐ)较复杂,AI还不太会画人的手,但(dàn)最新看(kàn)到的图片(piàn)已经有越来越(yuè)完美的AI模型出现,以后可能(néng)就完(wán)全没有漏洞了(le)。

类似(shì)的AI作(zuò)图(tú)诈骗在国(guó)外也已有发生。据英国广播公司报道,土耳其地震期(qī)间,有Tiktok用户使用AI合成了儿(ér)童受灾(zāi)的假照片发布到(dào)网(wǎng)络(luò),以(yǐ)此(cǐ)诱骗(piàn)善良的人(rén)打赏“捐助”从而实施(shī)诈骗(piàn)。

目前随着技术(shù)发展,AIGC已经能做出真人(rén)照片般(bān)的绘图效果,如果这样的图片被用(yòng)来诈骗,将非常可怕(pà)。

此外AIGC还引发了很多担忧,一(yī)方面(miàn),批(pī)判者(zhě)认为(wèi)AI在(zài)“学习”了大量前人的作(zuò)品(pǐn)之后,其创作没(méi)有任何(hé)情绪(xù)和灵魂(hún),难以和人类的艺术创作(zuò)相提并论。

另一方(fāng)面,AIGC背后的(de)版权(quán)、目前都并(bìng)没有得(dé)到(dào)有效的解决(jué),还有AIGC会不会代替人(rén)类“至高(gāo)无(wú)上”的创(chuàng)意。

马斯克(kè)也强调,人工智能的(de)安全问题(tí)需要得到重视,太(tài)晚就来不及了。

03

AIGC下(xià)一站(zhàn)除了视频,还有远方

技术都是有两面性的,潜在的危害并不能掩盖(gài)其光辉的贡献。现在看来,人工智能技术(shù)将是第四次工(gōng)业(yè)革(gé)命的(de)核心(xīn)驱动(dòng)力量(liàng),将创造(zào)新的增长奇迹。

过去一年,人工智能在技(jì)术和商业层面(miàn)都有了巨(jù)大进展,AI绘画就是(shì)人工智能技术(shù)发生方向(xiàng)性改变的一个代表。其下一站或许就是(shì)视频。

此前(qián),Meta和(hé)谷歌先后发布了几条引爆(bào)科技圈的(de)短(duǎn)视(shì)频。这些视频引发关(guān)注并非内(nèi)容做得(dé)多优(yōu)秀,反而都非常简单,比如一匹正在喝水的(de)马,一(yī)只画画(huà)的(de)玩(wán)具熊,或者一段骑摩托(tuō)车(chē)的第一视(shì)角录像(xiàng),随便(biàn)一个有手机的人都可以随手录下一段。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量

但这些短视频的(de)创作方(fāng)式非常简单,创作(zuò)者(zhě)仅仅需要向AI输入一段(duàn)话,甚至(zhì)只是说一下要(yào)求,AI就可以根据需要生成一段视频。

谷歌发(fā)布武汉市有多少人口2023年,武汉市有多少人口2022总人数的两个(gè)AI生成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的Make-A-Video没有太多的差别。

在(zài)Make-A-Video公(gōng)布(bù)了AI生成的视频后,AI圈就已(yǐ)经(jīng)玩(wán)了一(yī)波梗,一个(gè)能够(gòu)做出(chū)更高清视频的AI还不(bù)足(zú)以在短时间内戳中(zhōng)兴奋点。

Phenaki更加(jiā)令人震(zhèn)惊的(de)地方在于,它可(kě)以制作出超过2分(fēn)钟的连(lián)贯的也有(yǒu)确切内容的视(shì)频,这(zhè)才是真(zhēn)正让(ràng)人们(men)感到(dào)惊(jīng)喜的(de)地方(fāng)。因为无(wú)论AI生成的(de)视频(pín)多(duō)么高(gāo)清,也只能是(shì)为内(nèi)容生产者提供(gōng)一个灵感,一个素材,一个过(guò)场(chǎng)动画。

不过能够(gòu)制作出有具体剧情(qíng)内容的(de)视频就意味着,一(yī)些(xiē)视频(pín)创作由AI代(dài)替人(rén)工完成已经(jīng)初(chū)步有了可能。

当下AI的发展速度已(yǐ)经超过大部分(fēn)人(rén)的想象。内容产(chǎn)业的本质是供给(gěi)创造需(xū)求,AIGC作为全(quán)新的内容生产方式,可(kě)以为内容产(chǎn)业带来(lái)更新的内容风格、更快的生产速(sù)度(dù),更低的生产成本,这无疑(yí)会驱动(dòng)内容产业的(de)大爆发。

除了AI绘图、视(shì)频,AIGC技术还能应用(yòng)于音(yīn)乐、代码、机器人动作等多种内容形(xíng)式的(de)生(shēng)成。不难发现该项(xiàng)技术不仅在游戏等行业能得到有(yǒu)效应(yīng)用,对于(yú)下一代互(hù)联(lián)网各种(zhǒng)元素的构建亦有关键意义。

从商业化的角度来看,文化娱乐、教育、传媒(méi)等诸多领域,本(běn)身(shēn)就对基于AI的可视化内(nèi)容有(yǒu)强(qiáng)烈需(xū)求。

因此,AI绘画及(jí)视(shì)频或不是结果,而只是(shì)AI进(jìn)程中(zhōng)的(de)一块(kuài)重要拼图,有望(wàng)在技(jì)术更新的加持下实现更(gèng)大的应用价值。

AI从理解(jiě)内容,走向了(le)可以生(shēng)成内容,甚至能够创造出独(dú)立价值和独立视角的内容。AIGC的(de)再次出圈,更(gèng)代表着(zhe)未来(lái)的先进生产(chǎn)力即将(jiāng)到来(lái)。

ChatGPT之后又一(yī)应用杀疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科(kē)技行业?_黑料正能量

04

紧抓(zhuā)大模(mó)型与算力,牢(láo)固AIGC底(dǐ)座

从技术的发展也可(kě)以(yǐ)看出,在语言大模型、图(tú)像大模型之(zhī)后,多模(mó)态大(dà)模型(xíng)已经(jīng)成(chéng)为了新的趋(qū)势。

大模(mó)型被誉为当前(qián)人工智能发展的智能(néng)底座,是全球竞争最(zuì)激烈的(de)研究方(fāng)向之一,包括谷歌、亚马逊、百度、阿里(lǐ)、腾讯等众多头部企业都在(zài)竞相发力。

不过训练(liàn)大(dà)模(mó)型的确(què)价格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多(duō)少算力》报(bào)告估算(suàn),GPT-3训练一次的成本约(yuē)为140万(wàn)美元。而对于一些更(gèng)大的LLM(大型语言(yán)模型(xíng)),训练成本(武汉市有多少人口2023年,武汉市有多少人口2022总人数běn)则(zé)介于200万美元至(zhì)1200万美元高价之间。

以ChatGPT在2023年1月的独立访客平均数1300万计算(suàn),其(qí)对(duì)应芯片需求为(wèi)3万多片英伟达(dá)A100 GPU,初始(shǐ)投入成本约(yuē)为(wèi)8亿美元,每日仅电(diàn)费就(jiù)在5万(wàn)美元左右(yòu)。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行(xíng)业(yè)?_黑(hēi)料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算力支持。在关注各类(lèi)大模(mó)型的发展同时,更应该关注算力网络的建(jiàn)设。

算力网络正驱动AI产业发展进入史诗(shī)级加速进程(chéng),让(ràng)AIGC及通用(yòng)AI这一人工智能发展的终极目(mù)标离得更近。

因为算力(lì)可以(yǐ)对突破性技术创新提供大力的(de)支持。这方面,多模(mó)态(tài)大模(mó)型是典型。作为(wèi)面向未来强人(rén)工智能(néng)、通(tōng)用(yòng)人工(gōng)智(zhì)能的(de)重(zhòng)要技术创(chuàng)新,多(duō)模态大模型已经在(zài)人工智能(néng)领域提(tí)出了很多年,业界也有不少技(jì)术突破,但是,多模态大模型(xíng)进(jìn)一步往下走,算力需求呈几何式(shì)上(shàng)升,一般的算力(lì)基础设施很(hěn)快(kuài)将难以胜任。

从图像、文字、语音单独一项的训练,到双模态、三模态的跃迁(qiān),让人工智能可以灵活(huó)应(yīng)对不同(tóng)模态的转化(huà)、像人与世(shì)界交(jiāo)互一样(yàng)自然(rán),这方面,由(yóu)算力网络来驱动将有明显(xiǎn)优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正能量

此外,还有很多需要爆发式增长的算力(lì)来支撑的技术创(chuàng)新,将在人工(gōng)智(zhì)能算(suàn)力(lì)网络支撑下快(kuài)速推进。

AIGC已经露(lù)出曙光,期待在大模型和大算(suàn)力(lì)的(de)支持下(xià)AIGC能持(chí)续颠覆内容生产的(de)方(fāng)式,将创造的边际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 武汉市有多少人口2023年,武汉市有多少人口2022总人数

评论

5+2=