自(zì)聊天机器人ChatGPT火爆(bào)以(yǐ)来,微软公司创始人比尔·盖茨已多(duō)次公开谈(tán)论人工智能(néng)话(huà)题。在(zài)最近(jìn)的一次采访中(zhōng),他再(zài)次表示(shì):“AI可能(néng)会让科技行业迎来一次剧烈的洗牌”。
这个结论是他在当地(dì)时间2月20日接受《In Good Company》节目专访时(shí)提(tí)出的。
他预期,AI的发展可能会威胁到谷歌的市占(zhàn)率,因为微软(ruǎn)在(zài)AI方面的行动相当迅速。而最(zuì)终(zhōng)科(kē)技巨头(tóu)将把AI整合成用(yòng)户的“全能助手”,包(bāo)揽一切应用,与(yǔ)人们进行(xíng)沟通并提(tí)供建议,可以(yǐ)取代亚马逊、Siri或Outlook等应用。
大佬口中全能助手的到(dào)来可能尚需时日(rì),但由(yóu)ControlNet引发的又一次AI绘画浪潮,让(ràng)AIGC在ChatGPT的话题热(rè)点包(bāo)围中杀出(chū)重围(wéi)。
01
ControlNet颠覆AI绘画新(xīn)玩法
AIGC向(xiàng)可控靠(kào)近
以AI绘画为代(dài)表的AIGC上一次(cì)爆火(huǒ)的(de)时(shí)候,还是2022年8月,在美国科罗拉(lā)多(duō)州举办的新兴数字艺术家竞赛中(zhōng),一(yī)幅名(míng)为《太空歌剧(jù)院》的作品获奖。
随后各(gè)大厂商的(de)AI绘画软件被(bèi)广大网友(yǒu)熟知并体(tǐ)验(yàn),Stable Diffusion便(biàn)是其中代表。
用户们可以在应用中(zhōng)输入一组(zǔ)关键(jiàn)词(cí)或者(zhě)一张照片,就能获得一幅(fú)AI创作的(de)画(huà)作。
作(zuò)画的关键就是(shì)所输入(rù)的文本。同一组关键(jiàn)词也可以创作出很多张(zhāng)风格不一样的画作(zuò),这让(ràng)创作的(de)过程就像开盲盒。
很多用户很喜欢这(zhè)种不确定的惊喜,他们会将生成的美图当做头像。而另一部分(fēn)喜(xǐ)欢翻看(kàn)AI绘画的“翻车”作品。在(zài)社交媒体上,许多(duō)用户分享AI“翻(fān)车(chē)现场”,例(lì)如,一(yī)位(wèi)网友的(de)小狗照片被AI画成(chéng)了“肌肉男(nán)”,还有网友的(de)个人照片被AI识别成了建筑。
而如今随着ControlNet的出现与(yǔ)加持,以往AI绘画的填写(xiě)关(guān)键词游戏可能要(yào)被颠覆了(le)。
ControlNet是(shì)一位正在斯坦福读博的中国(guó)人张(zhāng)吕敏创作的一种基于控制点的图(tú)像变形算法,主要用于(yú)数字图像处理、计算机视觉和计算机图形学(xué)等领域。
其SD插(chā)件一经发布,在短(duǎn)短的两(liǎng)天内(nèi)便成为了AI绘画领域最(zuì)新的(de)热点。
在此之前,大(dà)家用了很多(duō)方法想让AI生成的结果(guǒ)尽(jǐn)可(kě)能(néng)的符合要求,但是都(dōu)不尽如人(rén)意,它的出(chū)现代表着AI生成开始进入(rù)真正的(de)可控时(shí)期(qī)。
因为ControlNet可以直接提取画面的构图,人物的(de)姿势和画面的深度信息等。有(yǒu)了它的帮助,就不用频(pín)繁的用提示词来碰(pèng)运气(qì),抽盲盒(hé)式的创作(zuò)了。
通(tōng)俗的说(shuō)ControlNet相当(dāng)于给AI绘画加了“魔法”,不少博主的作品(pǐn)已经获得了(le)大量(liàng)的浏览量(liàng),“viggo”就是其(qí)中之一(yī),他用朋友(yǒu)的照片直接带她们走(zǒu)进动(dòng)漫(màn)世(shì)界。
viggo先(xiān)用StableDiffusion图片转文字。
再用Text2Prompt插(chā)件拓(tuò)展找到对应(yīng)的(de)关键词;最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始换关键(jiàn)词试效果。
通过(guò)图片(piàn)就可以看出来,效果十(shí)分惊艳。
更厉(lì)害的是,除(chú)了(le)真(zhēn)实的照片,草图也可以加上“魔法”,知乎(hū)大牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现(xiàn)线稿(gǎo)转全彩图。大神张吕敏其本尊也亲自(zì)回应。
不(bù)得不(bù)说当下(xià)AIGC已经变(biàn)得越(yuè)来越强大(dà),甚(shèn)至输出的作品都已经能以假乱真(zhēn)了(le)。
02
难(nán)辨虚实,AIGC技术(shù)力爆(bào)发
警惕(tì)安全(quán)问(wèn)题
近日,“苏州金鸡湖有游艇party”的(de)消息火(huǒ)遍网络,而经过警方(fāng)辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。
由于(yú)这个活动里(lǐ)面给(gěi)出的美女照片都(dōu)是(shì)AI制(zhì)作的真人照片(piàn)绘(huì)图,因为太(tài)逼真(zhēn),被(bèi)大(dà)家(jiā)当成真(zhēn)事传播了。
srds是什么意思,srds是什么意思啊 decoding="async" src="https://mmbiz.heiliaofuli.com/wp-content/uploads/2023/03/2d75fd6b1ee0be6.png?imageMogr2/thumbnail/2160x0/format/webp/quality/80" data-ratio="0.66640625" data-s="300,640" data-type="png" data-w="1280">
不过仔(zǎi)细观察(chá)可以发现(xiàn),活(huó)动发(fā)起者提供的照片中有(yǒu)个很(hěn)大的(de)漏洞可以发(fā)现(xiàn)并非真人(rén),而是AI绘图,那便是图片中女性的手指部(bù)分有的存在(zài)异(yì)常。
有行业人事(shì)表示:“现在因为手指(zhǐ)部分的绘画算法比较(jiào)复杂(zá),AI还不太会(huì)画人的手,但最新看到(dào)的图(tú)片已经有越来越完美(měi)的AI模型出现,以后可能就(jiù)完全(quán)没有漏(lòu)洞了(le)。”
类似的AI作(zuò)图诈骗(piàn)在(zài)国(guó)外(wài)也已有发生(shēng)。据英国广播公司报道,土耳其地震期(qī)间,有Tiktok用(yòng)户使用AI合成了儿童受灾的假照片发布(bù)到(dào)网络,以此诱骗善良的人打赏“捐助(zhù)”从(cóng)而实施诈骗。
目前(qián)随(suí)着技术发展,AIGC已经能做出真(zhēn)人照片般的绘图效(xiào)果,如果这样(yàng)的图(tú)片被用来诈骗,将非常可怕。
此(cǐ)外AIGC还引(yǐn)发了(le)很多担忧(yōu),一方面,批判者认(rèn)为AI在“学习”了大(dà)量前人的作品(pǐn)之后,其创(chuàng)作(zuò)没(méi)有任何(hé)情绪(xù)和灵魂,难以和人类的(de)艺术创作相提并论。
另(lìng)一方面,AIGC背后的版(bǎn)权、目前都并(bìng)没有(yǒu)得到有(yǒu)效的解决,还有(yǒu)AIGC会不(bù)会(huì)代替人类“至高无上(shàng)”的创意。
马斯克(kè)也强调,人工智能的(de)安全问题需要得到(dào)重视,太晚就来不及了。
03
AIGC下一站除了视频,还有(yǒu)远方
技术都是有两面性的(de),潜在(zài)的危害并不能掩盖其光辉的贡(gòng)献(xiàn)。现在(zài)看来(lái),人工智能技术(shù)将(jiāng)是(shì)第(dì)四次工(gōng)业革命的核心驱动力量,将创造新的(de)增长奇迹(jì)。
过(guò)去一年,人工智能在技术和商业层面(miàn)都有了巨大进展,AI绘画就(jiù)是人工智能技(jì)术发生方向性改变的一个代表。其下(xià)一站或许就是视频。
此(cǐ)前,Meta和谷(gǔ)歌先(xiān)后发(fā)布了几条引爆科技圈的短视频。这些视频(pín)引(yǐn)发关(guān)注并非内容做得多优秀,反而都(dōu)非常(cháng)简(jiǎn)单,比如一匹(pǐ)正在(zài)喝水(shuǐ)的(de)马,一只画画的玩(wán)具熊(xióng),或(huò)者一段(duàn)骑摩托车(chē)的第一视角录像,随(suí)便一个有手机的人(rén)都可以随手录下(xià)一段。
但这些短视频的创作方式非常简(jiǎn)单,创作者仅(jǐn)仅需要向AI输(shū)入一段(duàn)话,甚至只是说一下要求,AI就可以根据需要生成一段视频(pín)。
谷歌发布的两(liǎng)个AI生成视频分(fēn)别来自于Imagen Video和Phenaki,前者主要突出(chū)的是(shì)高(gāo)清,与Meta的Make-A-Video没有太多的(de)差(chà)别。
在Make-A-Video公布了AI生(shēng)成的视频后,AI圈就已经(jīng)玩了一(yī)波梗(gěng),一个能够做(zuò)出更高清(qīng)视频的AI还不足以在短时间内戳中(zhōng)兴奋点。
Phenaki更(gèng)加令(lìng)人震(zhèn)惊(jīng)的地方在(zài)于,它(tā)可以制(zhì)作(zuò)出超过2分钟(zhōng)的连贯(guàn)的也有确切内容的视(shì)频,这才是真正让人们感(gǎn)到惊喜(xǐ)的地方。因为无论(lùn)AI生成的(de)视频多么(me)高(gāo)清,也只能是(shì)为内容(róng)生产者(zhě)提(tí)供一(yī)个灵感,一个素材,一个过(guò)场动画(huà)。
不过能够制作出有具(jù)体(tǐ)剧情内容的视频就意味(wèi)着,一些视(shì)频创作由AI代(dài)替(tì)人(rén)工完(wán)成已经初步有(yǒu)了可能。
当下AI的发展速度(dù)已经(jīng)超过大(dà)部(bù)分人的(de)想象。内容产业(yè)的本质(zhì)是供给创造需求,AIGC作为全新的内(nèi)容生产方式,可以(yǐ)为(wèi)内容产业带来(lái)更新的内容风格、更(gèng)快的生产速度,更低的生产(chǎn)成本,这(zhè)无疑会驱动内容产业的大(dà)爆(bào)发。
除了AI绘图、视频,AIGC技(jì)术还能应用(yòng)于(yú)音(yīn)乐、代码、机(jī)器(qì)人动作等(děng)多种(zhǒng)内容形式的生(shēng)成。不(bù)难发现(xiàn)该项技术(shù)不仅在(zài)游戏等行业能(néng)得到有效应用(yòng),对于下一代互联网(wǎng)各种元素的构建亦有关键(jiàn)意义。
从商(shāng)业化的角度(dù)来看,文(wén)化娱乐(lè)、教育、传媒等诸多领域,本身就(jiù)对基于(yú)AI的可视化内容(róng)有强烈需(xū)求(qiú)。
因此(cǐ),AI绘画及视频或不是结果,而(ér)只是AI进程中(zhōng)的一块重要拼(pīn)图,有望在技术(shù)更新(xīn)的加持下(xià)实现更(gèng)大的应用(yòng)价值。
AI从理解内容(róng),走向了可以(yǐ)生成内容(róng),甚至能够创造出独立价值和独立视角的(de)内容。AIGC的再次(cì)出圈,更代表着(zhe)未来的先进生产力(lì)即(jí)将到来。
04
紧抓(zhuā)大(dà)模型(xíng)与算力,牢固AIGC底座
从技术的发展也可以(yǐ)看出(chū),在语言大模型、图像大(dà)模型之后,多模态大(dà)模(mó)型已经成(chéng)为了新的趋(qū)势。
大模型(xíng)被誉为(wèi)当前人工智能发展的智(zhì)能(néng)底座(zuò),是全球竞争(zhēng)最激烈(liè)的研究方向之一,包括谷歌、亚(yà)马逊、百度(dù)、阿(ā)里、腾讯等(děng)众多(duō)头部企业都在(zài)竞相发力。
不过训练大(dà)模(mó)型的确(què)价格(gé)不(bù)菲,以国盛证券(quàn)发(fā)布的《ChatGPT需要多(duō)少算力》报告估算,GPT-3训练一次的成本约(yuē)为140万美元。而对于一些更(gèng)大的(de)LLM(大型语(yǔ)言模(mó)型),训练(liàn)成本(běn)则介于200万美元至1200万美元(yuán)高(gāo)价之(zhī)间。
以ChatGPT在2023年1月的(de)独立(lì)访客(kè)平均数1300万计算,其对应芯(xīn)片需求为(wèi)3万多片英(yīng)伟达(dá)A100 GPU,初始投(tóu)入成本约为8亿美(měi)元,每(měi)日仅电(diàn)费(fèi)就在5万美元左右。
此外不论是ChatGPT还是AIGC,都离不开(kāi)庞大算(suàn)力支(zhī)持。在关注各类(lèi)大模型(xíng)的发展同时,更应该关注算力网络的(de)建设。
算(suàn)力网(wǎng)络正(zhèng)驱动AI产(chǎn)业发展进入史诗级加速进程,让AIGC及通用AI这一人工智能发展的终极目(mù)标(biāo)离得(dé)更近。
因(yīn)为算(suàn)力可以对突破性(xìng)技术创新提供大力的支持。这方面,多模态大模型(xíng)是典型。作为面(miàn)向未来强人(rén)工智能、通用人工(gōng)智能(néng)的(de)重要技术创新,多模态大模(mó)型已经在人工智能领域提(tí)出了很多(duō)年,业界也有不少技术突(tū)破,但是(shì),多(duō)模(mó)态大模(mó)型进一步往下走,算力需(xū)求呈几何式上升,一般的算力基础(chǔ)设施(shī)很(hěn)快将难以胜任。
从图像、文(wén)字、语音单独一(yī)项的训练,到(dào)双模态(tài)、三模态的(de)跃迁,让人工智能可以灵活应对不同模态(tài)的转化、像人与世界交互一(yī)样自然(rán),这(zhè)方面,由算力网络(luò)来驱动将有明显优势。
此外(wài),还有很多需要爆发式增长的算力来支撑的技(jì)术(shù)创新,将在人工智能(néng)算(suàn)力网络支撑下快(kuài)速推(tuī)进。
AIGC已经露(lù)出曙光,期待在大模型和大算力的支(zhī)持(chí)下AIGC能持(chí)续(xù)颠覆内容生产的方式,将创造(zào)的边(biān)际成本降低,让万(wàn)众(zhòng)受(shòu)益(yì)。
未经允许不得转载:橘子百科-橘子都知道 srds是什么意思,srds是什么意思啊
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了