自聊天机器(qì)人ChatGPT火(huǒ)爆以来,微软公(gōng)司创始(shǐ)人比尔·盖(gài)茨(cí)已多次公(gōng)开谈(tán)论(lùn)人工智能话题(tí)。在最近的一次采访中,他(tā)再次表示:“AI可(kě)能会让科技行业迎来一次剧(jù)烈的洗牌”。
这个结论是(shì)他(tā)在当地时间2月20日接受《In Good Company》节目(mù)专(zhuān)访时提出的。
他(tā)预期,AI的发展可能(néng)会威胁到谷歌的市(shì)占率(lǜ),因为微软在(zài)AI方面(miàn)的行动相当迅(xùn)速。而最终科技巨(jù)头将把AI整合成用户的“全(quán)能助(zhù)手”,包(bāo)揽一切应(yīng)用,与人们进(jìn)行沟(gōu)通并提(tí)供(gōng)建议,可以取代亚(yà)马逊、Siri或Outlook等应用。
大佬口中全能助手的到(dào)来可能尚需时日,但由ControlNet引发的(de)又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题(tí)热点包围(wéi)中(zhōng)杀出重围(wéi)。
01
ControlNet颠覆(fù)AI绘(huì)画(huà)新(xīn)玩(wán)法(fǎ)
AIGC向可(kě)控靠近
以AI绘(huì)画为代表的AIGC上一次爆火的时候,还是(shì)2022年8月,在美国科罗拉多(duō)州举办的新兴数字艺术家(jiā)竞赛中,一幅名为《太空歌(gē)剧院》的(de)作品(pǐn)获(huò)奖。
随后各大厂商的AI绘(huì)画软件被(bèi)广(guǎng)大网友熟知并(bìng)体(tǐ)验,Stable Diffusion便是其中代表。
用户们可以在应用中输入一组关(guān)键词或者一(yī)张照(zhào)片,就能获得一幅AI创作(zuò)的画作。
作画的关键就是(shì)所输入的(de)文本。同一组关键词也可以创作出很多张(zhāng)风格(gé)不一样的画(huà)作,这让创作(zuò)的过程就像开盲盒。
很多(duō)用户很喜欢这种不确定的惊喜,他们会将生成的(de)美图当做头像(xiàng)。而另一(yī)部(bù)分喜欢翻看(kàn)AI绘(huì)画(huà)的“翻车”作品。在社交媒体(tǐ)上,许多用户分享AI“翻车(chē)现场”,例如(rú),一位网友的小(xiǎo)狗照片(piàn)被AI画(huà)成了“肌肉男”,还有网友的个人(rén)照片被AI识别(bié)成了建(jiàn)筑。
而如今(jīn)随着ControlNet的出现与加持,以(yǐ)往AI绘画(huà)的填写关键词(cí)游戏(xì)可(kě)能要(yào)被(bèi)颠(diān)覆了。
ControlNet是(shì)一(yī)位正在斯坦福读博的中国人(rén)张吕敏创作的一种基于控制点的图(tú)像变形算法,主要用于数字图像(xiàng)处理、计算(suàn)机视觉(jué)和计算机图形(xíng)学等(děng)领(lǐng)域。
其SD插件(jiàn)一经发布,在短短的两天内便(biàn)成为了(le)AI绘画领域最新的热点。
在此之前,大(dà)家用了(le)很多方法想让AI生成的(de)结果(guǒ)尽可能的符合要求,但是(shì)都不尽如人意,它的出现代表着AI生成开(kāi)始进入真正的(de)可控时期。
因为(wèi)ControlNet可以直(zhí)接提(tí)取画面的构图,人物的姿势(shì)和画面的深度信息等。有了(le)它的帮助,就不用频繁的用提(tí)示词来(lái)碰运气(qì),抽(chōu)盲盒式的创作(zuò)了。
通俗的说ControlNet相当于(yú)给(gěi)AI绘画加了“魔法”,不少博主的作品已经获得了大量的(de)浏览(lǎn)量(liàng),“viggo”就是(shì)其中之一,他用朋友的照片直接带她们走(zǒu)进动(dòng)漫世界。
viggo先用(yòng)StableDiffusion图片转文字。
再用Text2Prompt插件拓展找到对应(yīng)的关键词;最后用(yòng)ControlNet插件绑定骨骼开始(shǐ)换关键(jiàn)词(cí)试(shì)效果。
通过图(tú)片就可(kě)以看出来,效果(guǒ)十分惊艳。
更(gèng)厉害(hài)的是,除了真实的照片,草图也可以加上(shàng)“魔法”,知乎大(dà)牛(niú)“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能实现线(xiàn)稿转全(quán)彩图。大神(shén)张吕敏其(qí)本(běn)尊(zūn)也亲自(zì)回应。
不得不说当(dāng)下AIGC已经变得越来越强(qiáng)大(dà),甚(shèn)至输出的作品都已(yǐ)经(jīng)能以假乱真了。
02
难辨虚实,AIGC技术力爆发
警(jǐng)惕安全问(wèn)题
近日,“苏州金鸡湖有游艇party”的消息火(huǒ)遍网络(luò),而经过(guò)警方辟(pì)谣这所谓(wèi)的“party”可能(néng)是全国第一起AI绘(huì)图(tú)诈骗。
由于这个活动里面给出(chū)的美(měi)女照片都是AI制作(zuò)的(de)真人照(zhào)片绘(huì)图,因为(wèi)太逼真,被大家(jiā)当成真事传播了。
不过仔细观察可以发现,活动发(fā)起者提(tí)供的照片中有(yǒu)个很大的漏洞可以发现并非真人,而是AI绘图,那便是图片中女(nǚ)性的手指部(bù)分有的存在(zài)异常。
有行业人事表示:“现在(zài)因为(wèi)手指部分(fēn)的绘画算法比较复杂,AI还(hái)不太会(huì)画人的(de)手,但最新看到(dào)的图(tú)片已(yǐ)经有越来越完美的AI模(mó)型出现,以后可(kě)能就(jiù)完(wán)全没有漏洞了。”
类(lèi)似(shì)的AI作图诈骗(piàn)在国外(wài)也已(yǐ)有发生(shēng)。据英(yīng)国广(guǎng)播(bō)公司报道(dào),土耳其地震(zhèn)期间(jiān),有Tiktok用户使用(yòng)AI合成了儿童受灾的(de)假照片发布(bù)到网络,以此诱骗(piàn)善良的人打赏“捐助(zhù)”从(cóng)而(ér)实(shí)施诈骗。
目前(qián)随着技术发展(zhǎn),AIGC已经能做出真(zhēn)人照(zhào)片(piàn)般的绘图效果,如果这样的图片(piàn)被用来诈骗,将(jiāng)非常可(kě)怕。
此外(wài)AIGC还引发了很多担忧,一方面,批判者认为AI在“学(xué)习(xí)”了大量前人的作品之后(hòu),其创作没(méi)有(yǒu)任何情(qíng)绪和灵(líng)魂(hún),难(nán)以和人类的艺术(shù)创(chuàng)作(zuò)相提并论。
另一方面,AIGC背后的(de)版权、目前都(dō733是什么意思u)并没(méi)有得到有效的解决,还有AIGC会不会(huì)代替人类(lèi)“至高无上”的创意。
马斯克也强调,人(rén)工智能的安全问题需(xū)要得到重(zhòng)视,太(tài)晚就来不及了。
03
AIGC下一站除了视(shì)频,还有远方
技术(shù)都是有两面性的,潜在的危害并不能掩盖(gài)其(qí)光辉(huī)的贡献。现在(zài)看来,人工智能技术将是第四次工业革(gé)命的核心驱(qū)动(dòng)力(lì)量,将(jiāng)创造新的增长奇迹。
过去(qù)一年(nián),人工智能(néng)在(zài)技术(shù)和商业层(céng)面(miàn)都有了巨大进展(zhǎn),AI绘画就是人工智(zhì)能技(jì)术发生方向性(xìng)改变的一(yī)个(gè)代表。其下(xià)一站或许就是视频。
此(cǐ)前,Meta和谷(gǔ)歌先后发(fā)布了几条引(yǐn)爆科技圈的短视频(pín)。这(zhè)些视频引发关注并非内容做得多(duō)优秀,反而都非常简单(dān),比如一(yī)匹正在喝水的马,一只画画的(de)玩具熊(xióng),或(huò)者一段骑摩(mó)托车的第一视角录像,随(suí)便一个有手机的(de)人都可以随手录(lù)下一(yī)段。
但这些短视频的创(chuàng)作方式非常简单(dān),创(chuàng)作者仅仅需要向AI输入一段话,甚至只是说一下要求,AI就可以根(gēn)据需(xū)要生成一段视频。
谷歌发布的两个AI生成视频分别来(lái)自(zì)于Imagen Video和Phenaki,前(qián)者(zhě)主要突出的是(shì)高清,与Meta的Make-A-Video没有太多(duō)的差别。
在Make-A-Video公布了AI生(shēng)成的视频(pín)后(hòu),AI圈就已经(jīng)玩了一波梗,一个能(néng)够做出更高清视频的AI还不(bù)足以在短时间内戳(chuō)中兴奋点。
Phenaki更加令人震惊的地方在于(yú),它(tā)可(kě)以制(zhì)作出超过2分钟的连贯的也有确(què)切内容的视频,这才(cái)是真正让人们感到惊喜的地方。因为无论AI生成的视频多么高清,也只能是为内容生产者(zhě)提供(gōng)一个(gè)灵感,一个素材,一个过场动画。
不过能(néng)够制作出(chū)有(yǒu)具(jù)体剧情内容(róng)的(de)视频就意味(wèi)着,一些视频(pín)创作由AI代替人工完成已(yǐ)经(jīng)初(chū)步(bù)有了可能。
当下AI的发展(zhǎn)速度已经超过大部分(fēn)人的想象(xiàng)。内容产业的本质是(shì)供给创造需求,AIGC作为全新的内(nèi)容生(shēng)产方式,可以为(wèi)内容产业带来更(gèng)新的内(nèi)容风格、更快的生(shēng)产速度,更低(dī)的生产成(chéng)本,这(zhè)无疑(yí)会驱动内(nèi)容产业的大爆发。
除了AI绘图(tú)、视(shì)频,AIGC技术还能应用于(yú)音乐、代码、机(jī)器人动作等多种内容形式的生成。不难(nán)发(fā)现(xiàn)该项技术不(bù)仅在游(yóu)戏等行业能得到(dào)有(yǒu)效应用(yòng),对于下(xià)一代互联网(wǎng)各种元素的构建亦有关键意义。
从商业化的角度来(lái)看,文化娱乐(lè)、教(jiào)育、传媒等诸多领域,本身就(jiù)对基(jī)于AI的可视化内容有强烈需(xū)求(qiú)。
因此(cǐ),AI绘画及视(shì)频(pín)或不是(shì)结(jié)果,而只是(shì)AI进(jìn)程中(zhōng)的一块重要拼(pīn)图,有望在技术更(gèng)新的加持下实现更大的应用价值。
AI从理解内容(róng),走向了可以生成内容(róng),甚至(zhì)能够(gòu)创造(zào)出(chū)独立(lì)价(jià)值和独立(lì)视角的内容。AIGC的再(zài)次出圈,更代(dài)表着未来的先进生产力即将到来。
04
紧抓大模(mó)型与算力,牢(láo)固(gù)AIGC底座
从(cóng)技(jì)术的(de)发(fā)展也(yě)可(kě)以看出,在语言大模(mó)型、图像大模型之后,多模态大(dà)模(mó)型(xíng)已经(jīng)成为了(le)新的趋势(shì)。
大模型被誉为(wèi)当(dāng)前人工(gōng)智能发展的智能底座,是(shì)全球竞争最激烈的(de)研究方(fāng)向(xiàng)之一,包括谷歌、亚马(mǎ)逊、百度、阿里、腾(téng)讯等众(zhòng)多头(tóu)部企业(yè)都在竞相发力。
不(bù)过训练大模型的确价格不菲,以国(guó)盛证券发布的(de)《ChatGPT需要多少(shǎo)算力》报告估算(suàn),GPT-3训(xùn)练一次(cì)的成本(běn)约为140万美(měi)元。而对于一些更大的LLM(大(dà)型(xíng)语言模型),训(xùn)练成本则介(jiè)于200万美元(yuán)至1200万美元高价之间。
以ChatGPT在2023年1月的独立访客平均(jūn)数1300万计算,其对应芯片需(xū)求(qiú)为3万(wàn)多片英伟达A100 GPU,初始投入成本约为8亿美元,每(měi)日仅电费(fèi)就在5万美(měi)元左右。
此(cǐ)外不论是(shì)ChatGPT还是AIGC,都离不开(kāi)庞(páng)大算力支持。在关注(zhù)各类大模型的(de)发展同时(shí),更(gèng)应该(gāi)关注算力(lì)网络的建设。
算力网(wǎng)络正驱(qū)动AI产业发展进入史(shǐ)诗级加速进程,让AIGC及通用AI这一人(rén)工智能发(fā)展(zhǎn)的终极(jí)目标(biāo)离(lí)得更近。
因为算(suàn)力可以对突破性技术创新提供大力的支持(chí)。这方面,多(duō)模态大模型是典型。作(zuò)为面向未来强人工智能、通用人工智(zhì)能的重要技术创新,多模态大模型已经在人工智(zhì)能领域提出了很多年,业界(jiè)也有(yǒu)不少技术(shù)突破,但是,多(duō)模(mó)态大模(mó)型进一步(bù)往下走(zǒu),算力需求呈几何式上(shàng)升,一般的算(suàn)力基础设施很(hěn)快(kuài)将(jiāng)难以胜(shèng)任。
从图(tú)像、文字、语音单独一项的训练(liàn),到双模态、三模态的跃迁,让(ràng)人(rén)工(gōng)智能可以灵活应对(duì)不同模(mó)态的转化、像人与(yǔ)世界交互(hù)一样(yàng)自然,这(zhè)方面(miàn),由算力网(wǎng)络来(lái)驱动将(jiāng)有明(míng)显优势。
此外,还有很多需要(yào)爆发(fā)式增长的算力来支撑的(de)技术(shù)创新,将(jiāng)在人工智(zhì)能算力网络支撑下快速(sù)推进。
AIGC已(yǐ)经(jīng)露出曙光,期待在大(dà)模(mó)型和(hé)大算力的支持下AIGC能持续颠覆内容生(shēng)产的方(fāng)式,将创(chuàng)造的边际成(chéng)本(běn)降低,让(ràng)万众受益。
未经允许不得转载:橘子百科-橘子都知道 733是什么意思
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了