自聊(liáo)天(tiān)机器人ChatGPT火(huǒ)爆以(yǐ)来,微软公司创始人比尔·盖茨已多次公开谈论人工智能话题(tí)。在(zài)最近的一次采访中,他再次表(biǎo)示:“AI可能会让科技(jì)行业迎来一(yī)次剧烈的洗牌”。
这个结论是他(tā)在当地时间(jiān)2月20日接(jiē)受(shòu)《In Good Company》节目专访时提出的。
他预期,AI的(de)发展可能会威(wēi)胁(xié)到谷(gǔ)歌的市(shì)占率,因为(wèi)微软在AI方面(miàn)的(de)行(xíng)动相当迅速。而最(zuì)终科(kē)技巨头将把AI整(zhěng)合(hé)成(chéng)用户的(de)“全能助(zhù)手”,包揽一(yī)切应用,与(yǔ)人们(men)进行沟通(tōng)并(bìng)提供建议,可以取代(dài)亚马逊、Siri或Outlook等(děng)应用。
大(dà)佬口中全(quán)能助手的(de)到来可能尚需时日,但由ControlNet引(yǐn)发的又一次AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热(rè)点包围中杀出重围。
01
ControlNet颠覆AI绘画新玩(wán)法(fǎ)
AIGC向可控靠近
以AI绘画为代(dài)表的AIGC上一(yī)次(cì)爆火的时候(hòu),还是2022年8月,在(zài)美(měi)国科罗拉多州举办(bàn)的新兴数字艺术家竞赛(sài)中,一幅名为《太空歌剧(jù)院》的作品获奖(jiǎng)。
随后各大厂(chǎng)商的AI绘(huì)画软(ruǎn)件被广大(dà)网友熟知(zhī)并(bìng)体验,Stable Diffusion便是其中(zhōng)代表。
用(yòng)户们可以(yǐ)在应用中输入(rù)一组(zǔ)关键词(cí)或者一张照片,就能获得(dé)一幅AI创作的画作(zuò)。
作画的关键就是(shì)所输入的文(wén)本。同一(yī)组关键词也(yě)可以创(chuàng)作出很多张风(fēng)格不(bù)一样的(de)画(huà)作(zuò),这让创(chuàng)作的过程就(jiù)像开盲盒。
很(hěn)多(duō)用户很喜欢这(zhè)种(zhǒng)不确定的惊(jīng)喜,他们会(huì)将生(shēng)成的美(měi)图当做头像。而另一部分喜欢翻看AI绘画的“翻车”作(zuò)品(pǐn)。在社交媒体上,许多用户(hù)分享AI“翻车现场”,例如,一位网友(yǒu)的小狗照片被AI画(huà)成了“肌肉男(nán)”,还有网友的(de)个人照(zhào)片(piàn)被AI识别成(chéng)了建(jiàn)筑。
而如(rú)今随着(zhe)ControlNet的出现与加持,以往(wǎng)AI绘(huì)画(huà)的(de)填(tián)写关键词游戏可能(néng)要(yào)被颠覆了。
ControlNet是一位正在斯坦福读博的中国人张吕敏创作的一种基(jī)于控制点的图(tú)像变形(xíng)算(suàn)法,主要用于数字图像处理、计算机(jī)视觉(jué)和(hé)计算机图形学等领(lǐng)域。
其(qí)SD插件一经发布(bù),在短短的(de)两天内便成为了AI绘画(huà)领域(yù)最新的热点。
在(zài)此之(zhī)前,大(dà)家用了很多方法(fǎ)想让(ràng)AI生成的结果尽(jǐn)可能的(de)符合(hé)要求(qiú),但(dàn)是(shì)都不(bù)尽如人意,它(tā)的出现(xiàn)代表着AI生成开(kāi)始进入真(zhēn)正的可控时期。
因为ControlNet可以直接(jiē)提取画面的构图,人物(wù)的姿势(shì)和画面(miàn)的深(shēn)度信(xìn)息(xī)等。有(yǒu)了它的帮助,就(jiù)不(bù)用(yòng)频繁的用(yòng)提示词来(lái)碰运气(qì),抽盲(máng)盒(hé)式的创(chuàng)作(zuò)了(le)。
通俗的说ControlNet相(xiāng)当于(yú)给AI绘画加了“魔法”,不少博主的作品已(yǐ)经获得了大量的浏览量,“viggo”就是其中之一,他用朋友的照(zhào)片直接带她们(men)走(zǒu)进动漫世界(jiè)。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插件拓展找到对应的关键词;最后用ControlNet插件(jiàn)绑定骨骼开始换关键(jiàn)词(cí)试效果(guǒ)。
通(tōng)过图片就可以看出来,效果十分惊艳。
夏洛的网主要内容50字左右,夏洛的网主要内容100字更厉害的是,除了真实的(de)照片,草图也可以加上“魔法”,知(zhī)乎大牛(niú)“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿(gǎo)转全(quán)彩图(tú)。大神张吕(lǚ)敏(mǐn)其(qí)本尊也亲自回(huí)应。
不得不说(shuō)当下AIGC已经变得越(yuè)来越强大,甚(shèn)至(zhì)输出(chū)的(de)作品(pǐn)都已经能以假乱真了(le)。
02
难辨虚(xū)实,AIGC技术力爆发(fā)
警惕安全(quán)问(wèn)题
近日,“苏州金鸡(jī)湖有游(yóu)艇party”的消(xiāo)息火遍网络,而经过警方辟谣(yáo)这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。
由于这个活动里面给出的美(měi)女照片都是AI制(zhì)作的(de)真人(rén)照(zhào)片(piàn)绘图,因(yīn)为(wèi)太逼(bī)真,被(bèi)大家当成真事传播(bō)了。
不过仔(zǎi)细观察可以发现,活(huó)动(dòng)发起(qǐ)者(zhě)提供的照片中有个很大的漏洞(dòng)可以发现(xiàn)并非真人(rén),而是AI绘图,那便(biàn)是(shì)图(tú)片中女性(xìng)的(de)手(shǒu)指部分有(yǒu)的存(cún)在异常。
有行业人事表示:“现在(zài)因为手指部分的(de)绘画算(suàn)法比较复杂(zá),AI还不太会画人的(de)手,但最新看到(dào)的图片(piàn)已经有(yǒu)越来越完美的AI模(mó)型出现,以后(hòu)可(kě)能就完全没有漏洞了。”
类似的(de)AI作(zuò)图诈骗在(zài)国外也已有(yǒu)发生。据(jù)英国广播公司(sī)报(bào)道(dào),土(tǔ)耳其(qí)地震期(qī)间(jiān),有Tiktok用户使(shǐ)用AI合成了儿童受(shòu)灾的假照片发布到网络,以此诱骗善良(liáng)的(de)人打赏(shǎng)“捐助”从而实施诈骗。
目前(qián)随着技术发展,AIGC已经能做出真人照片(piàn)般(bān)的(de)绘(huì)图(tú)效果,如果这样的图片被用来诈骗,将非常可怕。
此外AIGC还引发了很多担(dān)忧(yōu),一方面,批判者认为AI在“学(xué)习”了大量前人的作品(pǐn)之(zhī)后,其创作没有任(rèn)何情绪和灵魂,难以和(hé)人类(lèi)的(de)艺术创作(zuò)相提并(bìng)论。
另一方(fāng)面(miàn),AIGC背后的(de)版权、目前都并没有得到有效的解(jiě)决,还(hái)有AIGC会不会代替人类“至(zhì)高无上”的创(chuàng)意。
马斯克也强(qiáng)调,人工智能的安(ān)全问题(tí)需(xū)要得到(dào)重(zhòng)视,太晚就来不及了。
03
AIGC下一站除了(le)视频,还有(yǒu)远(yuǎn)方
技术(shù)都是有两面性的,潜在的危害并(bìng)不(bù)能掩盖其光辉的(de)贡献(xiàn)。现在看来,人(rén)工智能(néng)技(jì)术将是第四次工(gōng)业革命(mìng)的(de)核心驱动力量,将创(chuàng)造新的增长奇(qí)迹。
过去(qù)一年,人工智能在(zài)技术(shù)和商业层面都有了巨大进展,AI绘画(huà)就是人工(gōng)智能技术(shù)发生方向(xiàng)性改变的一个代表。其下一站(zhàn)或(huò)许就是视频。
此前(qián),Meta和谷歌(gē)先后发布了几(jǐ)条引爆(bào)科(kē)技圈的短视频。这些(xiē)视频引发关(guān)注并非(fēi)内容做得多优秀,反而(ér)都(dōu)非常简单(dān),比(bǐ)如一匹(pǐ)正在喝水的马,一只(zhǐ)画(huà)画的玩具(jù)熊(xióng),或者一段(duàn)骑摩托车的第一视角录像,随(suí)便一(yī)个有手机的人(rén)都可以(yǐ)随(suí)手录下一段。
但这些短视频的(de)创作方式(shì)非常简单(dān),创作者仅仅需(xū)要向AI输入(rù)一(yī)段话,甚至只是说一下要求,AI就(jiù)可以根(gēn)据需要生成一段(duàn)视频。
谷歌(gē)发(fā)布(bù)的两个AI生成(chéng)视频分别来自(zì)于Imagen Video和Phenaki,前(qián)者(zhě)主要突出的是高清,与Meta的(de)Make-A-Video没有太多(duō)的差别(bié)。
在Make-A-Video公(gōng)布了AI生成的视频后,AI圈就已经玩了一(yī)波梗,一个能够(gòu)做出更(gèng)高清视频(pín)的AI还(hái)不足以在短时间内戳(chuō)中(zhōng)兴奋点。
Phenaki更加令人震惊的地方在于,它可以制作(zuò)出(chū)超过2分(fēn)钟的连贯的也有确切内容的视频,这才是真正让(ràng)人们(men)感到惊喜的地方。因为无论AI生成的视(shì)频多么高清,也只能是为(wèi)内(nèi)容生产者提供一个灵(líng)感,一(yī)个素材,一(yī)个过场动画。
不(bù)过能够制作出(chū)有具体剧情内容的视频就意味着,一些(xiē)视(shì)频创(chuàng)作由AI代替人工(gōng)完成已经初步有了(le)可能。
当下AI的发展速度已经(jīng)超(chāo)过大部分(fēn)人(rén)的想象(xiàng)。内容产业的本(běn)质是(shì)供给创造需求,AIGC作为全新的(de)内容生产(chǎn)方式(shì),可以(yǐ)为内容(róng)产(chǎ夏洛的网主要内容50字左右,夏洛的网主要内容100字n)业(yè)带来更新的内(nèi)容(róng)风(fēng)格、更快的生(shēng)产(chǎn)速度,更低的(de)生产成本(běn),这无疑会驱动内容(róng)产业(yè)的大爆发(fā)。
除了AI绘图、视频(pín),AIGC技术还能应用于音乐、代码、机器人动作等多种内(nèi)容形式的生成(chéng)。不(bù)难发现该项技术不仅在游戏等行业能得到有效(xiào)应用,对于下一代互(hù)联(lián)网各种(zhǒng)元(yuán)素的构建亦有关键意义。
从商业(yè)化(huà)的角(jiǎo)度(dù)来(lái)看(kàn),文化(huà)娱乐、教育、传媒等诸多(duō)领域,本身就对基于AI的可视化内容有强烈需(xū)求(qiú)。
因此,AI绘(huì)画(huà)及视(shì)频或不是结果,而只是AI进程中的一块重要拼(pīn)图,有(yǒu)望在(zài)技术更(gèng)新的加持(chí)下实现更大的应用(yòng)价值(zhí)。
AI从理解(jiě)内容,走向了(le)可以生成内容,甚至能够创造(zào)出独立价值和独(dú)立视角(jiǎo)的内容。AIGC的再(zài)次出圈,更代表(biǎo)着未来的先进生产力即将到来。
04
紧(jǐn)抓大模型与(yǔ)算力,牢固(gù)AIGC底座
从技术的发展(zhǎn)也可以看出,在语言(yán)大(dà)模型、图像大模型之后,多(duō)模(mó)态大模(mó)型已经(jīng)成为(wèi)了新的(de)趋势。
大模型被誉为当前人(rén)工智能发展的智能底座,是全球竞争(zhēng)最激烈(liè)的研(yán)究(jiū)方向(xiàng)之一,包括谷歌、亚(yà)马逊、百(bǎi)度、阿里、腾讯等众多头部(bù)企业都在竞相发力。
不过(guò)训练大(dà)模型的确价格(gé)不(bù)菲,以国盛证券发布的(de)《ChatGPT需(xū)要多(duō)少算力》报告(gào)估(gū)算,GPT-3训练一次的成本(běn)约为140万美元(yuán)。而(ér)对于(yú)一些更大(dà)的LLM(大型语言模型(xíng)),训练成本(běn)则介(jiè)于200万美(měi)元至1200万美元高价之间。
以ChatGPT在2023年(nián)1月(yuè)的独立访客(kè)平均数(shù)1300万计算,其对应(yīng)芯(xīn)片需(xū)求(qiú)为3万多片英伟达A100 GPU,初始投(tóu)入成本(běn)约为8亿美元,每日仅电费就(jiù)在5万美元(yuán)左右。
此外(wài)不(bù)论是(shì)ChatGPT还(hái)是AIGC,都(dōu)离不开(kāi)庞大算力支持。在关注(zhù)各类大模型的发展同时(shí),更应该关注算(suàn)力网络的(de)建设。
算力(lì)网络正驱动(dòng)AI产业发展进入史诗级加速(sù)进程,让(ràng)AIGC及通用AI这一人工智(zhì)能发展的终极目标离得(dé)更近(jìn)。
因为(wèi)算力可以(yǐ)对突破性技术创新(xīn)提供大力的支持(chí)。这方(fāng)面,多(duō)模(mó)态大(dà)模型是(shì)典(diǎn)型。作为面向未来强人工智(zhì)能、通用人(rén)工智能的重要技术创新(xīn),多(duō)模态大模型已(yǐ)经在人(rén)工智(zhì)能领域提出(chū)了很(hěn)多年,业(yè)界(jiè)也有不少技术突破(pò),但(dàn)是,多(duō)模态大模(mó)型进一(yī)步往下走,算力需求呈几何式上升,一般的算力基础设施很快将难以胜任。
从图像(xiàng)、文字、语音单独(dú)一项的训练,到双模(mó)态、三模态的跃迁,让人工智(zhì)能可以灵活应(yīng)对不同模(mó)态的转(zhuǎn)化、像人与世(shì)界交互(hù)一样自然,这方面,由(yóu)算力网络来(lái)驱动(dòng)将有明(míng)显优势。
此外,还有很多需要爆发式(shì)增长的(de)算力来支撑(chēng)的技术创(chuàng)新,将在人工智能算(suàn)力网络支撑下快速推进。
AIGC已(yǐ)经露(lù)出曙光(guāng),期待在大模(mó)型和大算力的支持下AIGC能(néng)持续颠覆内(nèi)容生产(chǎn)的(de)方式,将创(chuàng)造的边际成(chéng)本降(jiàng)低(dī),让万(wàn)众受(shòu)益。
未经允许不得转载:橘子百科-橘子都知道 夏洛的网主要内容50字左右,夏洛的网主要内容100字
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了