自聊天机器人ChatGPT火(huǒ)爆以来,微软公司创始人比尔(ěr)·盖茨(cí)已多次公开(kāi)谈论人工智能(néng)话题。在(zài)最近的一(yī)次采访中,他再次表示:“AI可能(néng)会(huì)让(ràng)科技行业迎来一次剧(jù)烈的洗牌”。
这(zhè)个(gè)结论是他(tā)在当地时间2月20日接受(shòu)《In Good Company》节目专(zhuān)访时(shí)提出的。
他(tā)预期,AI的发展可(kě)能会威胁到谷(gǔ)歌(gē)的(de)市占率,因为微软在AI方(fāng)面的行(xíng)动(dòng)相当迅速。而最终科技巨头将把AI整合成用户的“全能(néng)助手(shǒu)”,包揽一切应用,与人们(men)进(jìn)行沟(gōu)通并提供建议,可以取代(dài)亚马逊、Siri或Outlook等(děng)应用(yòng)。
大(dà)佬口中全(quán)能(néng)助手的到来可能尚需时日,但由ControlNet引发的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围中杀出重(zhòng)围。
01
ControlNet颠(diān)覆(fù)AI绘(huì)画新玩法(fǎ)
AIGC向可控(kòng)靠近
以(yǐ)AI绘画为代表的AIGC上(shàng)一次爆(bào)火的时候,还是2022年8月,在美国科罗拉多州(zhōu)举办的(de)新兴(xīng)数字艺术家竞(jìng)赛中,一幅名(míng)为(wèi)《太(tài)空歌剧院》的作品(pǐn)获奖(jiǎng)。
随后各大厂商的AI绘(huì)画(huà)软件被广大网友(yǒu)熟知并体验,Stable Diffusion便(biàn)是(shì)其中(zhōng)代表。
用户们可以在应用中输(shū)入一(yī)组(zǔ)关键词或者(zhě)一张(zhāng)照片,就能(néng)获得一(yī)幅AI创(chuàng)作的画(huà)作。
作画的(de)关(guān)键就是所输入的文本。同一(yī)组关键词也(yě)可以创作出(chū)很多张(zhāng)风格不(bù)一(yī)样的(de)画作,这让创(chuàng)作(zuò)的过程就(jiù)像开盲盒。
很多用户很喜欢这种不确定的惊喜(xǐ),他们会将生成的美图当做头像。而另一部分(fēn)喜欢翻(fān)看AI绘(huì)画的“翻车”作品。在(zài)社交媒体上,许多用户分享AI“翻车现场(chǎng)”,例如,一(yī)位网(wǎng)友的小狗照片被AI画(huà)成了(le)“肌肉男”,还有网友的(de)个人照片被AI识别成了(le)建筑。
而如今随着ControlNet的出(chū)现(xiàn)与加持,以往AI绘画的填写关键词游(yóu)戏可能要被颠(diān)覆(fù)了。
ControlNet是一位正在斯坦福读博的中国人张吕敏创作的一种基于控制点的图像变形算法(fǎ),主要用于数字图像处理、计算机视觉和(hé)计算(suàn)机图(tú)形学等领域。
其SD插件一(yī)经发布,在短短的两(liǎng)天(tiān)内便(biàn)成为(wèi)了(le)AI绘画领域最新的(de)热(rè)点。
在此之前,大(dà)家用了很多方(fāng)法想让(ràng)AI生成的结果尽可能的符合要求,但是都不尽(jǐn)如人(rén)意,它(tā)的出现代表(biǎo)着AI生成开始进(jìn)入真正(zhèng)的可控(kòng)时期。
因(yīn)为ControlNet可以直接提取画面的构图,人物的姿势(shì)和画面的深度信息等。有了它(tā)的(de)帮(bāng)助,就不用频(pín)繁(fán)的用提示(shì)词来碰运气,抽盲盒式的创作了(le)。
通俗的说ControlNet相当于给AI绘(huì)画加(jiā)了“魔法”,不少博(bó)主(zhǔ)的作(zuò)品(pǐn)已经获(huò)得了大量的(de)浏览量,“viggo”就是其(qí)中之一(yī),他用朋友的照片直接带她们走进动漫世界(jiè)。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插(chā)件拓展(zhǎn)找到(dào)对应的关键词;最(zuì)后用(yòng)ControlNet插(chā)件绑定骨骼开始换关(guān)键词试(shì)效(xiào)果。
通(tōng)过图片就可(kě)以看出来,效果十分惊艳。
更厉(lì)害的是,除了真(zhēn)实的照片,草图也(yě)可(kě)以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂(shā)”介(jiè)绍(shào)到ControlNet还能实现线稿转(zhuǎn)全彩图。大神(shén)张(zhāng)吕敏其(qí)本尊(zūn)也亲自回应。
不得不说(shuō)当下AIGC已经变得越(yuè)来(lái)越强大,甚至输出的(de)作品都已经能以假(jiǎ)乱真了。
02
难辨虚实,AIGC技术(shù)力爆发(fā)
警惕安全问(wèn)题
近日,“苏州金(jīn)鸡湖(hú)有游艇party”的消息火遍网(wǎng)络,而经(jīng)过警方辟谣这所谓的(de)“party”可能是全国第一起AI绘(huì)图诈骗。
由于这个(gè)活动里面给出的美女照(zhào)片都是(shì)AI制作的真人照片绘图,因为太逼真,被大(dà)家当成真(zhēn)事传(chuán)播(bō)了。
不过仔(zǎi)细观察可以发现,活动发起者提供的(de)照片(piàn)中有个很大的漏洞可以(yǐ)发现并非真人(rén),而是AI绘(huì)图,那便是(shì)图片中女(nǚ)性的手指部分有的存在异常。
有行业人事表示:“现在因为手指(zhǐ)部分的(de)绘画算法(fǎ)比(bǐ)较复杂(zá),AI还不(bù)太会画人的(de)手,但最新看到的图片已经有越来越完美的AI模型出现,以后(hòu)可能(néng)就完全(quán)没有(yǒu)漏洞了(le)。”
类(lèi)似的AI作(zuò)图(tú)诈骗在国外也已有发生。据英国广播公司报(bào)道,土耳其(qí)地(dì)震期间,有Tiktok用户使(shǐ)用AI合成了儿童受灾的(de)假照(zhào)片发布到网(wǎng)络,以此诱骗善良的人打(dǎ)赏“捐助”从而实施(shī)诈骗。
目(mù)前随着技术(shù)发展,AIGC已经能(néng)做出真(zhēn)人照片般的绘图(tú)效果,如果这样(yàng)的(de)图片被(bèi)用来诈(zhà)骗,将(jiāng)非常可怕(pà)。
此外AIGC还(hái)引发了很(hěn)多担忧,一(yī)方面(miàn),批判者认(rèn)为(wèi)AI在“学习”了大量(liàng)前人的作品之后,其创作没(méi)有(yǒu)任(rèn)何情(qíng)绪和灵(líng)魂(hún),难(nán)以和(hé)人类的艺术创作相提并论。
另一方面,AIGC背后的版权、目(mù)前都(dōu)并没(méi)有得到有效的解决,还(hái)有AIGC会不会代(dài)替人类“至高无(wú)上”的(de)创意。
马斯(sī)克(kè)也强调,人工(gōng)智能的安全问题需要得(dé)到(dào)重视,太(tài)晚就来不及了。
03
AIGC下一站除了视频,还有(yǒu)远(yuǎn)方
技术(shù)都是有两面性的,潜在的危害并不能掩盖其(qí)光辉的贡(gòng)献。现在(zài)看来,人工智能技术将是第(dì)四(sì)次工业革命的核心(xīn)驱动(dòng)力量,将创造新的增长(zhǎng)奇迹。
过去一年,人工智能在技术和商业(yè)层(céng)面都(dōu)有了巨大进展,AI绘画就是(shì)人工智(zhì)能技术(shù)发生方向(xiàng)性改变的(de)一个(gè)代表。其下一站或许(xǔ)就(jiù)是视频。
此前,Meta和(hé)谷歌先后发布了几条引爆科技(jì)圈的(de)短(duǎn)视频。这些视频引发(fā)关注并非内容做得(dé)多优秀,反而都非常简单,比如一匹正在喝水(shuǐ)的马(mǎ),一只画画的玩具熊,或者一段骑摩(mó)托车的(de)第一视角录像,随(suí)便(biàn)一个有手机(jī)的人都可以随手录(lù)下一(yī)段。
但这些短视频的创作方式非常简单,创作者(zhě)仅仅(jǐn)需要向AI输(shū)入一段话,甚至只是说一下(xià)要求,AI就可以根(gēn)据需要(yào)生成一段视频。
谷歌(gē)发布(bù)的两个AI生(shēng)成(chéng)视频(pín)分别(bié)来自于(yú)Imagen Video和Phenaki,前者主要突出的是高清,与Meta的(de)Make-A-Video没(méi)有太多(duō)的差别。
在Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已经(jīng)玩(wán)了一波梗,一个能够做出更高清视频的AI还(hái)不足以在短时间内戳中兴奋点。
Phenaki更加令人震惊(jīng)的地方在于,它可以(yǐ)制作出超过2分(fēn)钟的连贯的也有确切内容的(de)视频,这才是真(zhēn)正让人们感到惊喜的(de)地方。因(yīn)为无(wú)论AI生成(chéng)的视频(pín)多么高清,也(yě)只(zhǐ)能是为内容生产(chǎn)者(zhě)提供一个灵感,一个素(sù)材,一个过场动画。
不过能够制作出有具体剧情内(nèi)容的(de)视频(pín)就意味着,一些(xiē)视频(pín)创作由AI代替人工(gōng)完成已经初(chū)步有了可能(néng)。
当下AI的(de)发(fā)展(zhǎn)速度已经(jīng)超(chāo)过大部(bù)分人的想象。内容(róng)产业(yè)的本质是供给创造需求(qiú),AIGC作为全新的内容生产方式,可(kě)以为内容产业带来更新(xīn)的内容(róng)风(fēng)格(gé)、更快的生产(chǎn)速度,更低的(de)生产成(chéng)本(běn),这无疑(yí)会驱动内容(róng)产业的大爆(bào)发。
除(chú)了AI绘(huì)图、视(shì)频,AIGC技术还能应用(yòng)于(yú)音乐(lè)、代码(mǎ)、机器(qì)人动作(zuò)等多种内容形式的(de)生成。不难发(fā)现该项技(jì)术不仅在(zài)游戏等(děng)行业能得到有(yǒu)效(xiào)应用(yòng),对于(yú)下一代(dài)互联网(wǎng)各种元素(sù)的构建亦(yì)有关键(jiàn)意义。
从商业化的角(jiǎo)度来看,文化娱(yú)乐、教育、传媒等诸多领域,本身(shēn)就对(duì)基(jī)于AI的(de)可视(shì)化内容(róng)有强烈需求(qiú)。
因此(cǐ),AI绘画(huà)及视频或不是结果,而只是AI进程中的一块重要(yào)拼(pīn)图,有望在技术更新的加持下实现更大(dà)的应(yīng)用价值。
AI从理解内(nèi)容(róng),走(zǒu)向了可以生成内容,甚(shèn)至能够(gòu)创造出(chū)独立价值和独(dú)立视(shì)角的内容。AIGC的(de)再次出圈(quān),更(gèng)代(dài)表(biǎo)着未来的(de)先进生产力即(jí)将到来。
04
紧抓大模(mó)型与算力,牢固AIGC底座
从(cóng)技术的(de)发展也(yě)可以看出(chū),在语言大模(mó)型(xíng)、图像大模型(xíng)之后,多模态大模型(xíng)已经成(chéng)为(wèi)了新的趋势(shì)。
大模型被誉为(wèi)当前(qián)人工智能发展的智能底座,是全(quán)球(qiú)竞(jìng)争最激烈的研究方向之一,包括谷歌、亚马逊、百度、阿里、腾讯等众多头部企业(yè)都(dōu)在(zài)竞(jìng)相发力(lì)。
不过训练大模型的(de)确价格不菲(fēi),以国盛证券发布的《ChatGPT需要多少(shǎo)算力(lì)》报告(gào)估算,GPT-3训练一(yī)次的成本(běn)约为140万(wàn)美元。而(ér)对于一些(xiē康师傅是哪国的牌子?)更(gèng)大(dà)的LLM(大型语言模型),训练成本(běn)则介于200万(wàn)美(měi)元至1200万美元(yuán)高价之间。
以ChatGPT在(zài)2023年1月的独(dú)立访客平均数1300万计算,其对(duì)应芯片需求为3万(wàn)多片英伟达A100 GPU,初始投入成(chéng)本约为(wèi)8亿(yì)美元,每日(rì)仅(jǐn)电(diàn)费(fèi)就在(zài)5万美元左右(yòu)。
此外不论是ChatGPT还是AIGC,都离不开庞大(dà)算(suàn)力支持。在关注(zhù)各类大模型的发展同时,更应该关注(zhù)算力(lì)网络的(de)建(jiàn)设(shè)。
算力网络正驱动(dòng)AI产业发展(zhǎn)进入(rù)史诗级加(jiā)速进程,让AIGC及通用AI这一人工智能(néng)发展(zhǎn)的终极目(mù)标离(lí)得更近(jìn)。
因为算力可以对(duì)突破性(xìng)技术(shù)创新(xīn)提供大力的支持。这方面,多模态(tài)大模型是(shì)典型(xíng)。作为(wèi)面向未来强人工智(zhì)能、通用人(rén)工智能的重要技(jì)术创新,多(duō)模态大(dà)模型已经在人(rén)工智能(néng)领域提出(chū)了很(hěn)多年(nián),业界也有不少技术突破,但是(shì),多模(mó)态(tài)大模型进一步往下(xià)走(zǒu),算(suàn)力需(xū)求呈几何式上升,一般(bān)的(de)算力基(jī)础设施很快(kuài)将难以胜(shèng)任。
从图(tú)像、文字(zì)、语(yǔ)音单独一项的训练,到(dào)双模态、三模态的跃(yuè)迁,让人工智能可以灵活(huó)应对(duì)不同(tóng)模(mó)态的转(zhuǎn)化、像人与世界交互一样(yàng)自然,这(zhè)方面,由算力网络来驱(qū)动将(jiāng)有明(míng)显优势(shì)。
此外,还(hái)有很(hěn)多需要爆发式增长的(de)算力(lì)来支撑的(de)技术(shù)创新,将在人工智能(néng)算力(lì)网络支撑(chēng)下快(kuài)速(sù)推(tuī)进。
AIGC已经露出曙光,期待在(zài)大模型和大算力的支持下AIGC能(néng)持(chí)续(xù)颠覆内容生产的方式,将创造的边际成本降低,让万众受益。
未经允许不得转载:橘子百科-橘子都知道 康师傅是哪国的牌子?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了