橘子百科-橘子都知道橘子百科-橘子都知道

台湾是省还是市 台湾是省会吗

台湾是省还是市 台湾是省会吗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆以来(lái),微软公(gōng)司创始人比尔·盖茨已多次公(gōng)开(kāi)谈论人(rén)工智能话题。在最(zuì)近的一(yī)次采访中,他(tā)再次表(biǎo)示:“AI可能会让科技(jì)行业(yè)迎来一次剧烈的洗牌”。

这个结论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预期,AI的发(fā)展可能(néng)会威胁到谷歌的(de)市占率,因为微软在AI方面的行动相当迅速。而(ér)最终科技(jì)巨头将把AI整合成用户的“全能助手”,包揽一(yī)切应用,与人们(men)进行沟(gōu)通并提(tí)供建议,可(kě)以取代亚马(mǎ)逊、Siri或(huò)Outlook等应用。

大佬口中全能助手的(de)到(dào)来可能尚需(xū)时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包(bāo)围(wéi)中杀出(chū)重围。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科(kē)技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠(kào)近(jìn)

以AI绘画(huà)为代表(biǎo)的AIGC上(shàng)一次(cì)爆火的时候,还是2022年8月,在(zài)美国科罗拉多州(zhōu)举办的新兴数字艺术家竞赛中,一(yī)幅名(míng)为《太(tài)空歌剧(jù)院》的作品(pǐn)获奖。

随后各大(dà)厂商的(de)AI绘画软件被广大网友(yǒu)熟知并体(tǐ)验,Stable Diffusion便(biàn)是其(qí)中代表。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技(jì)行业?_黑(hēi)料(liào)正(zhèng)能量

用户们可以在应用中输(shū)入一组关键词或者一张照片,就(jiù)能获得一幅AI创作(zuò)的画作。

作画的关键就是所输(shū)入(rù)的文本。同一(yī)组关键词也可以创作出很(hěn)多(duō)张风(fēng)格不一(yī)样的(de)画(huà)作,这让创作(zuò)的过(guò)程就像开盲(máng)盒(hé)。

很多用户很喜欢这种不(bù)确定的惊喜,他们会将生成的美图当做头像。而(ér)另(lìng)一部(bù)分喜欢翻看AI绘画的“翻车”作品。在社交(jiāo)媒体上,许多用户(hù)分享AI“翻(fān)车(chē)现场”,例如,一位(wèi)网友的小狗照(zhào)片(piàn)被AI画成了“肌肉男”,还(hái)有网(wǎng)友的个(gè)人照片(piàn)被AI识别成了建筑。

而(ér)如今随(suí)着ControlNet的出(chū)现与加持,以往AI绘画的填写(xiě)关键词游(yóu)戏可能要被颠(diān)覆了。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或进(jìn)入可(kě)控期,将洗牌(pái)科技行业?_黑(hēi)料正(zhèng)能(néng)量

ControlNet是一位正在斯坦福读博(bó)的(de)中国人张吕敏创作的一种(zhǒng)基于控制(zhì)点的图像变形算法,主要(yào)用(yòng)于数字图像处理、计算(suàn)机视(shì)觉和计算机(jī)图形学等(děng)领域。

其SD插件一经发布,在短短的两天内便成为了AI绘画领(lǐng)域最(zuì)新的热点(diǎn)。

在此(cǐ)之前,大家用了很(hěn)多(duō)方(fāng)法想让(ràng)AI生成的结果尽可(kě)能(néng)的符合要求,但(dàn)是都不尽如人意,它的出现代表着AI生成开始进入真正的可控时期(qī)。

因为ControlNet可以直接提取画面的构图,人物的姿(zī)势和画(huà)面的深度信(xìn)息等(děng)。有了它的帮助(zhù),就不(bù)用频(pín)繁的用提示(shì)词来(lái)碰运气(qì),抽盲盒式的创作了。

通俗的说ControlNet相当于给AI绘画加了“魔法(fǎ)”,不少博主的作品已经获得了大(dà)量的浏览量,“viggo”就是其中之一,他用朋友的照片直接带(dài)她们走进动漫世界。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找(zhǎo)到(dào)对应的关键(jiàn)词(cí);最后用(yòng)ControlNet插件绑定骨骼开始换关键词试效果。

ChatGPT之(zhī)后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业?_黑料(liào)正能量

通过图片就可(kě)以看出来,效果十分惊艳。

ChatGPT之(zhī)后(hòu)又一应用(yòng)杀疯(fēng)了,AIGC或进入(rù)可控期(qī),将洗牌科(kē)技行业?_黑料正能量(liàng)

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进入可控(kòng)期(qī),将洗牌科技行业?_黑料正能量

更厉(lì)害的(de)是,除了真(zhēn)实(shí)的照片,草图也可以(yǐ)加上“魔法”,知乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现(xiàn)线稿转全彩图。大神(shén)张(zhāng)吕敏(mǐn)其本(běn)尊也亲(qīn)自回应。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可(kě)控期,将洗牌科(kē)技行业?_黑料正能(néng)量

不得不说当下AIGC已经变得越来(lái)越(yuè)强大,甚(shèn)至输出的作品都(dōu)已经能(néng)以假乱真(zhēn)了。

02

难辨虚实,AIGC技术力爆(bào)发

警惕(tì)安全问(wèn)题

近日(rì),“苏州金鸡湖有游艇party”的消息火遍网络,而经过警方辟谣这所谓(wèi)的(de)“party”可能是全(quán)国第一起(qǐ)AI绘图诈骗。

由于(yú)这(zhè)个活动里面给(gěi)出的(de)美女照片都(dōu)是AI制作(zuò)的真(zhēn)人照片绘(huì)图,因(yīn)为太逼真,被大家当成真(zhēn)事传播了

ChatGPT之(zhī)后(hòu)又(yòu)一(yī)应用杀疯了(le),AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

不过仔细观察可以发现,活动(dòng)发(fā)起(qǐ)者提供的照片中有个很大的漏洞可以发现并非真人(rén),而是(shì)AI绘图(tú),那(nà)便是图片中女(nǚ)性的手指(zhǐ)部分有的存在(zài)异常。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行(xíng)业?_黑料正能量

有行业人事表示:“现(xiàn)在(zài)因(yīn)为(wèi)手指部分的绘画算(suàn)法(fǎ)比较复杂,AI还不太会画人(rén)的手(shǒu),但最新(xīn)看到的(de)图片已经(jīng)有越来越完美(měi)的AI模型出(chū)现(xiàn),以后可能(néng)就完全(quán)没有漏洞了。

类似的AI作图诈骗在国外也已有发生(shēng)。据英国广播公司报道(dào),土耳其(qí)地(dì)震期间,有Tiktok用户使用AI合成了儿童受灾的假(jiǎ)照片发布到网络,以此诱骗善(shàn)良的人打赏“捐助”从而实施(shī)诈骗。

目前(qián)随着技术发(fā)展,AIGC已经(jīng)能做(zuò)出(chū)真人照片般的绘图效果(guǒ),如果这样的图(tú)片(piàn)被用来诈(zhà)骗(piàn),将非常可(kě)怕。

此外(wài)AIGC还(hái)引发了很多担(dān)忧,一方面(miàn),批判(pàn)者认为(wèi)AI在(zài)“学习”了大量前人(rén)的作品之后,其创作没(méi)有任何情绪和灵魂,难(nán)以和人类(lèi)的艺术(shù)创作相提(tí)并论。

另(lìng)一(yī)方面(miàn),AIGC背后的版权、目前都并没有得(dé)到有效的(de)解决(jué),还有AIGC会(huì)不(bù)会代替人类“至高无上”的创意(yì)。

马斯克(kè)也(yě)强调,人工智能的(de)安(ān)全问题需要得到重视,太晚就来不及(jí)了。

03

AIGC下一站除了视(shì)频,还有(yǒu)远方

技术都是有两面性的,潜在的危害并(bìng)不能(néng)掩(yǎn)盖其(qí)光辉的(de)贡献。现在看来,人工(gōng)智能技(jì)术将是(shì)第(dì)四次(cì)工业革命的核心驱动力量,将创(chuàng)造新的(de)增长奇(qí)迹(jì)。

过(guò)去一年,人(rén)工智能在技术(shù)和商业层面都有了巨大(dà)进(jìn)展,AI绘(huì)画就是人(rén)工智能(néng)技术发(fā)生方向性改变的一(yī)个代表。其下一站或许就是视(shì)频。

此(cǐ)前,Meta和谷歌先后发布了几条引爆(bào)科技圈(quān)的(de)短视(shì)频。这些视频引发关注并非内容做得多优秀,反而(ér)都(dōu)非常简单,比如一(yī)匹正在喝水的马,一只画(huà)画的玩具熊,或者一(yī)段骑摩托车的第一视角录像,随便一个有(yǒu)手(shǒu)机(jī)的人(rén)都可以(yǐ)随手录下(xià)一段。

ChatGPT之后又一(yī)应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

但(dàn)这(zhè)些短视频的创作方式非常简(jiǎn)单,创作(zuò)者仅仅需要向AI输入一段(duàn)话,甚至只是说一下要求,AI就可以根据需要生(shēng)成一段(duàn)视频。

谷歌发布的两个AI生成视频分别(bié)来自于Imagen Video和Phenaki,前(qián)者主(zhǔ)要突出的是高清,与Meta的Make-A-Video没(méi)有(yǒu)太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后,AI圈就已(yǐ)经玩了一波梗(gěng),一(yī)个能(néng)够做出更高清视频(pín)的AI还不足(zú)以在(zài)短(duǎn)时间内戳(chuō)中(zhōng)兴奋点(diǎn)。

Phenaki更加令(lìng)人(rén)震(zhèn)惊的地(dì)方在于(yú),它可以制作出超过2分钟的(de)连贯的也有确(què)切内容的(de)视(shì)频(pín),这(zhè)才(cái)是真正让人(rén)们感到惊喜的(de)地方。因为无论AI生成的视频多么(me)高(gāo)清,也(yě)只能是为(wèi)内(nèi)容生产者提供一个灵感,一个(gè)素材,一(yī)个过(guò)场动画。

不(bù)过能(néng)够制作出有(yǒu)具体剧情内(nèi)容的视频就(jiù)意味着,一些(xiē)视频创作(zuò)由AI代替人(rén)工完成(chéng)已经(jīng)初步(bù)有了(le)可能(néng)。

当下AI的发(fā)展(zhǎn)速度已经超过大部(bù)分(fēn)人的想象(xiàng)。内容(róng)产业的本质是(shì)供给创造需求,AIGC作为(wèi)全(quán)新的内容生(shēng)产方式,可以(yǐ)为内容(róng)产(chǎn)业带来更(gèng)新的内容(róng)风(fēng)格、更快的生产速度,更低的(de)生产成本,这无疑会驱动(dòng)内容产(chǎn)业的(de)大爆发。

除了AI绘图、视频,AIGC技术还能应用于音乐、代码、机器(qì)人动作等多种内容(róng)形式的生成。不难发现该项技术不(bù)仅在游戏(xì)等行业能得到有效应(yīng)用(yòng),对于下一代互联网(wǎng)各种元素的构建亦有关键意(yì)义。

从商(shāng)业化的(de)角度来看,文化娱乐、教育、传媒等诸多领域,本身就对基于AI的可(kě)视(shì)化内(nèi)容有强烈(liè)需(xū)求。

因此,AI绘画及(jí)视频(pín)或不是(shì)结(jié)果(guǒ),而只是AI进程中的一块重要拼(pīn)图,有(yǒu)望在技术更新的加持下(xià)实现(xiàn)更大(dà)的应用价(jià)值。

AI从理解(jiě)内容,走向了(le)可以生成内容,甚至能(néng)够创(chuàng)造出独立价(jià)值和独立视角(jiǎo)的内容。AIGC的再次出圈,更代表着未来的先进生产力即将到来。

ChatGPT之(zhī)后又一(yī)应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌科(kē)技行(xíng)业?_黑料(liào)正能(néng)量(liàng)

04

紧抓大模型与算力,牢(láo)固AIGC底座(zuò)

从技(jì)术的发(fā)展也(yě)可以看出,在语言大模(mó)型、图(tú)像大模型之(zhī)后(hòu),多模态(tài)大模型(xíng)已经成(chéng)为了新的趋(qū)势。

大模型被誉为(wèi)当前人工智(zhì)能发(fā)展(zhǎn)的智能(néng)底座,是全球竞争(zhēng)最激烈的研究方向之一,包括(kuò)谷(gǔ)歌、亚马逊、百度、阿里、腾(téng)讯等(děng)众多头(tóu)部(bù)企业都在竞相(xiāng)发(fā)力。

不(bù)过训练大模型(xíng)的确价(jià)格(gé)不(bù)菲(fēi),以国盛证(zhèng)券发布的《ChatGPT需要(yào)多少算力(lì)》报告估算,GPT-3训练一次的(de)成本约为140万美元。而(ér)对(duì)于一(yī)些(xiē)更大(dà)的LLM(大型语言(yán)模型),训(xùn)练成本则介(jiè)于200万美元(yuán)至1200万(wàn)美元高价(jià)之间。

以ChatGPT在2023年1月的独立访客平均数1300万计(jì)算,其(qí)对(duì)应(yīng)芯片需求为3万多片英(yīng)伟达A100 GPU,初始投入(rù)成本(běn)约为8亿美元,每日仅电费就在5万美元左(zuǒ)右。

ChatGPT之后又(yòu)一应(yīng)用杀疯(fēng)了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业(yè)?_黑料正能量

此外不(bù)论是ChatGPT还是(shì)AIGC,都离不开(kāi)庞(páng)大(dà)算(suàn)力支持。在(zài)关注各(gè)类大模型的发展同时,更应该关注算力网络的(de)建设。

算力(lì)网络正驱动AI产业发展进入史诗级加速进程,让AIGC及通(tōng)用(yòng)AI这一人工(gōng)智能发展的终极目(mù)标(biāo)离得更近。

因为算力可以(yǐ)对突破性技(jì)术创新(xīn)提供大(dà)力的支(zhī)持。这方面,多模态大模型是典型。作(zuò)为面向(xiàng)未(wèi)来强人(rén)工智(zhì)能、通用人工智能的(de)重要技术创新,多模态大模型(xíng)已(yǐ)经在人工(gōng)智能领(lǐng)域提(tí)出了很多年,业界也有(yǒu)不少技术突破,但(dàn)是,多模态大(dà)模(mó)型(xíng)进一步往(wǎng)下走,算力需(xū)求(qiú)呈几(jǐ)何式上(shàng)升,一般的(de)算力基础设施(shī)很快将难以胜任(rèn)。

从(cóng)图像(xiàng)、文字(zì)、语音单独一项的训练,到双模态、三模态的跃迁,让人工智能可以灵活(huó)应(yīng)对不同(tóng)模态的转化、像人与世(shì)界交互一样自然,这方面,由算力网络来驱动将有(yǒu)明显优势。

ChatGPT之后又一应用杀疯(fēng)了(le),AIGC或(huò)进入可(kě)控期,将洗(xǐ)牌科技行业?_黑料正(zhèng)能量

此外,还有(yǒu)很多需要爆发式(shì)增长(zhǎng)的算力来支撑的技术创新(xīn),将在人工智能算力(lì)网(wǎng)络支撑下快速推进。

AIGC已经露出(chū)曙(shǔ)光,期待在大模型和大算力的(de)支持下(xià)AIGC能持(chí)续(xù)颠覆内容(róng)生产的(de)方式,将(jiāng)创造的(de)边际成本降低,让(ràng)万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 台湾是省还是市 台湾是省会吗

评论

5+2=