橘子百科-橘子都知道橘子百科-橘子都知道

三大球和三小球分别是什么 三大球的起源

三大球和三小球分别是什么 三大球的起源 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人ChatGPT火爆(bào)以(yǐ)来,微软公司创始人比尔·盖(gài)茨已多次(cì)公开谈(tán)论(lùn)人工智能话题。在最近的一次采访(fǎng)中(zhōng),他(tā)再次表示:“AI可能会(huì)让科技行业(yè)迎来一次剧烈的洗牌”。

这个结论是他在当地时间2月20日(rì)接(jiē)受《In Good Company》节目(mù)专访时提出(chū)的。

他(tā)预期,AI的发(fā)展可能(néng)会威胁到谷歌的市占率,因为(wèi)微软(ruǎn)在AI方面(miàn)的(de)行动相当迅速(sù)。而最终科技巨头(tóu)将把AI整合成用户的“全能助手”,包揽一切应用(yòng),与人们(men)进行(xíng)沟通并提供建议,可(kě)以取代亚马逊、Siri或Outlook等(děng)应用。

大佬口中全能助手的(de)到来可能尚(shàng)需时日,但由ControlNet引发(fā)的又一次AI绘画(huà)浪潮,让(ràng)AIGC在(zài)ChatGPT的(de)话(huà)题热点包围中杀出重围。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进入可控(kòng)期(qī),将洗牌(pái)科技行业(yè)?_黑料(liào)正能(néng)量

01

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可控靠近(jìn)

以AI绘画为(wèi)代(dài)表的(de)AIGC上(shàng)一次爆火的时候,还是2022年8月(yuè),在美国科罗拉多州举办的(de)新兴数字艺术家竞(jìng)赛中,一幅(fú)名为《太空歌(gē)剧院》的作品获奖(jiǎng)。

随后各大厂商的AI绘(huì)画软件被广(guǎng)大网友熟知并体验,Stable Diffusion便(biàn)是其中代(dài)表。

ChatGPT之(zhī)后又一应用杀(shā)疯(fēng)了,AIGC或(huò)进入可控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量(liàng)

用户(hù)们(men)可以在应用中(zhōng)输入(rù)一组关(guān)键词或(huò)者(zhě)一张照片,就能获得一幅AI创作的(de)画作。

作画的关键就是所输入的文本。同一组关键词(cí)也可以创作(zuò)出(chū)很多张风格不一样(yàng)的画作(zuò),这让创作的(de)过程就像开盲盒。

很(hěn)多用户(hù)很(hěn)喜欢这种不确定的惊喜,他(tā)们会(huì)将生成的美图当做头像(xiàng)。而另一(yī)部分喜(xǐ)欢翻看AI绘(huì)画的“翻车”作(zuò)品。在社交(jiāo)媒体上,许(xǔ)多用户分享AI“翻(fān)车(chē)现(xiàn)场”,例如,一位(wèi)网友的小狗照片被(bèi)AI画成了“肌肉男(nán)”,还有网友的(de)个人照片被(bèi)AI识别成了建筑。

而如今随着(zhe)ControlNet的出现与加持(c三大球和三小球分别是什么 三大球的起源hí),以往AI绘画的填写(xiě)关键词游(yóu)戏可能要被颠覆了。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌科(kē)技行业?_黑料正(zhèng)能(néng)量(liàng)

ControlNet是(shì)一位(wèi)正在斯坦福读博(bó)的中(zhōng)国人(rén)张吕敏创作的一种(zhǒng)基于控制点(diǎn)的图(tú)像变(biàn)形算法(fǎ),主(zhǔ)要用于数字图像处(chù)理(lǐ)、计(jì)算机视觉(jué)和计算机图形学(xué)等领域。

其SD插件(jiàn)一(yī)经(jīng)发布,在短短的(de)两天内便成为了AI绘画领域(yù)最新(xīn)的热点。

在此之前,大家用(yòng)了(le)很多(duō)方法想(xiǎng)让AI生(shēng)成的结果(guǒ)尽可能(néng)的符合要求,但是都(dōu)不尽如人意,它的出(chū)现代表着AI生成开始进入真正的可控时(shí)期。

因为ControlNet可以(yǐ)直(zhí)接提(tí)取画面的构(gòu)图,人物的(de)姿势和画面的深度信息等。有了(le)它(tā)的帮助,就不用频(pín)繁的用(yòng)提示词(cí)来碰运气,抽(chōu)盲(máng)盒(hé)式(shì)的创作(zuò)了。

通俗的说ControlNet相当于(yú)给(gěi)AI绘画加了(le)“魔法”,不少博主的作品已经获得了(le)大(dà)量的浏览(lǎn)量,“viggo”就是其中之一,他用朋(péng)友的照片直接带她(tā)们(men)走进动(dòng)漫世界(jiè)。

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或进(jìn)入可(kě)控期,将洗(xǐ)牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转文(wén)字。

再用Text2Prompt插件拓展(zhǎn)找到对应(yīng)的关键词(cí);最后用ControlNet插(chā)件绑定骨(gǔ)骼开始换关键(jiàn)词试(shì)效(xiào)果。

ChatGPT之后(hòu)又一(yī)应用杀(shā)疯了(le),AIGC或进(jìn)入(rù)可控(kòng)期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

通(tōng)过图(tú)片就(jiù)可以(yǐ)看出来,效(xiào)果十(shí)分惊艳。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控(kòng)期(qī),将洗牌科技行业?_黑料正能(néng)量

ChatGPT之(zhī)后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行(xíng)业?_黑料正能量

更厉(lì)害(hài)的是,除了真实的(de)照片,草图(tú)也可以加上“魔法”,知乎大牛(niú)“DevPoint”和“逗砂”介绍到(dào)ControlNet还能实现(xiàn)线(xiàn)稿转(zhuǎn)全(quán)彩图。大神张吕敏(mǐn)其本尊也(yě)亲自(zì)回(huí)应(yīng)。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料正能量

不得不(bù)说当下AIGC已(yǐ)经变得越来(lái)越强大,甚至输出的作品都(dōu)已经能以假(jiǎ)乱真了。

02

难(nán)辨虚实(shí),AIGC技术力爆发

警惕安全问题

近日,“苏州金(jīn)鸡湖有游艇party”的消息火遍网络,而经(jīng)过(guò)警方辟谣这(zhè)所谓的“party”可能(néng)是全国第一起AI绘图诈(zhà)骗。

由于这个活动里面给出的美女照片(piàn)都是AI制作的真人(rén)照片绘(huì)图(tú),因为太逼(bī)真,被大家(jiā)当成真事传(chuán)播了

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

不过仔细观察可(kě)以发现,活动发起(qǐ)者提(tí)供的照(zhào)片中有个很大的漏洞可以(yǐ)发现并(bìng)非真人,而是AI绘图,那(nà)便是(shì)图片中女(nǚ)性的手指部分有的存在(zài)异常。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能(néng)量

有行业人事表示:“现(xiàn)在因(yīn)为(wèi)手(shǒu)指部分的绘画算法比较复(fù)杂,AI还不太会画人的手,但最新看到的(de)图片(piàn)已经有(yǒu)越来越完美的AI模(mó)型出(chū)现,以后(hòu)可(kě)能就完(wán)全没有漏洞了。

类(lèi)似的AI作(zuò)图诈骗在国(guó)外也已有发生(shēng)。据(jù)英国广播公(gōng)司报(bào)道,土耳(ěr)其(qí)地震期间(jiān),有Tiktok用(yòng)户使用AI合成了儿(ér)童受灾(zāi)的假照(zhào)片发布到网络(luò),以此诱骗善良的(de)人打赏“捐助(zhù)”从而实施诈骗。

目前随着技术发展,AIGC已经(jīng)能做出(chū)真(zhēn)人照片般的绘图效果,如果这(zhè)样的(de)图片被用来诈骗,将非常可怕。

此外AIGC还引发了(le)很(hěn)多担(dān)忧,一方面,批判者认(rèn)为AI在“学习”了大量(liàng)前(qián)人的作品之(zhī)后,其创作(zuò)没有任何情绪(xù)和灵魂,难以和人类的艺术创作相提并论。

另一方(fāng)面,AIGC背后(hòu)的版权、目(mù)前都并没有得到有效(xiào)的解决,还有AIGC会不会代替人(rén)类“至高无(wú)上”的(de)创意。

马斯克也强调,人工智能的安全问题需(xū)要得到(dào)重视(shì),太晚就(jiù)来(lái)不及了。

03

AIGC下一站除了视频(pín),还(hái)有远方

技(jì)术都(dōu)是有两面(miàn)性的,潜(qián)在的危害并(bìng)不能掩盖其光辉的(de)贡献。现在(zài)看来,人工智能(néng)技术(shù)将是第四次工业革命的核心(xīn)驱动力(lì)量,将创造新的增长奇迹。

过去一年,人工智能(néng)在(zài)技术和(hé)商(shāng)业(yè)层面都有了巨大进展(zhǎn),AI绘画(huà)就是(shì)人工智能技术发生方向性(xìng)改变的一个代表。其(qí)下一站或许就是视频(pín)。

此前,Meta和谷歌(gē)先后发布了几条引(yǐn)爆科技圈(quān)的(de)短(duǎn)视频。这些(xiē)视频引发关注并非(fēi)内容做得(dé)多优秀,反而(ér)都非常简单,比如一匹正在喝水的(de)马,一只画画的玩具(jù)熊,或者一段(duàn)骑摩(mó)托(tuō)车的第一视角录像,随(suí)便一个有手机的人都可以(yǐ)随(suí)手(shǒu)录下一段。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能量

但这些短视频的创(chuàng)作方式(shì)非常简单,创作者仅仅需要向(xiàng)AI输(shū)入(rù)一段话,甚(shèn)至只是说一(yī)下要(yào)求,AI就可以(yǐ)根据(jù)需(xū)要(yào)生成一(yī)段视频。

谷歌发布的两个AI生成视频分别来(lái)自于(yú)Imagen Video和(hé)Phenaki,前者(zhě)主要突(tū)出的是高清(qīng),与(yǔ)Meta的Make-A-Video没有太多的差别(bié)。

在(zài)Make-A-Video公布(bù)了(le)AI生成的视频后,AI圈就已经玩了一波梗,一个能够做出更高清视频(pín)的AI还不足以在短(duǎn)时间(jiān)内(nèi)戳(chuō)中兴奋点(diǎn)。

Phenaki更加令人震惊的地(dì)方在于,它可以制(zhì)作(zuò)出超过2分钟的(de)连贯的(de)也有确切内容的视频,这才(cái)是真正让(ràng)人们感到惊喜的地方。因为(wèi)无论AI生成的视频(pín)多(duō)么高清,也只(zhǐ)能是为内容(róng)生产者(zhě)提供(gōng)一个灵(líng)感(gǎn),一个素材,一个过场动画(huà)。

不过能够制作(zuò)出有具(jù)体剧情内(nèi)容的视(shì)频就意味着,一些视(shì)频创作由AI代(dài)替人工完成已(yǐ)经(jīng)初步有(yǒu)了可(kě)能。

当下AI的(de)发展速度已(yǐ)经超过大部(bù)分人的(de)想(xiǎng)象。内容产业的本质(zhì)是供给创造(zào)需求(qiú),AIGC作为(wèi)全(quán)新的内容生产方式,可以为内(nèi)容产业带来更(gèng)新(xīn)的内容风格、更快的生(shēng)产速度,更低的生产成本,这无(wú)疑会驱动内容产业(yè)的大(dà)爆发。

除了AI绘图、视频,AIGC技术还能应用于音(yīn)乐、代码、机器人动(dòng)作等多种(zhǒng)内容形式的(de)生成。不难发现该(gāi)项技术不仅(jǐn)在(zài)游戏(xì)等行业能得到有效应用,对于下一代互(hù)联(lián)网(wǎng)各种元素的构建亦有关键(jiàn)意义。

从商(shāng)业化的角度来看,文化娱乐、教育、传媒等诸多领(lǐng)域,本(běn)身就对基(jī)于AI的可(kě)视(shì)化内(nèi)容(róng)有强烈需(xū)求。

因此(cǐ),AI绘画及视频或不是结果,而(ér)只是AI进程中的一块重(zhòng)要拼图(tú),有望在技术(shù)更(gèng)新的加(jiā)持下实现更大的应用(yòng)价(jià)值。

AI从(cóng)理(lǐ)解内容(róng),走向了可以生成内容,甚至能(néng)够(gòu)创造出独(dú)立价值和独(dú)立(lì)视角(jiǎo)的内容。AIGC的再次出(chū)圈,更代表着(zhe)未来的先进生(shēng)产力即将(jiāng)到来(lái)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

04

紧抓大(dà)模型与算力,牢固AIGC底(dǐ)座

从技术的发展(zhǎn)也(yě)可以看出,在语言大模型(xíng)、图像大模型之后,多(duō)模(mó)态大模型已(yǐ)经成为(wèi)了新的趋势。

大(dà)模型被誉为当前人工(gōng)智能发展(zhǎn)的智能底座,是全球竞争(zhēng)最激烈的研究方向之一,包(bāo)括谷(gǔ)歌(gē)、亚马(mǎ)逊、百(bǎi)度(dù)、阿里(lǐ)三大球和三小球分别是什么 三大球的起源、腾讯等众多头部(bù)企(qǐ)业都在竞(jìng)相发(fā)力(lì)。

不过训练(liàn)大模型的确价格(gé)不菲,以国盛证券发布的《ChatGPT需(xū)要多少算力》报告估(gū)算,GPT-3训练一(yī)次的(de)成本约为140万美(měi)元。而对于一些(xiē)更(gèng)大的LLM(大型语(yǔ)言(yán)模型),训练(liàn)成本(běn)则介于(yú)200万美元至1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立访客平(píng)均数1300万计算,其(qí)对应芯(xīn)片需求为3万多片(piàn)英(yīng)伟达A100 GPU,初始投入成本约为(wèi)8亿美元,每日仅电费就在5万美元左右。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正能量

此外不(bù)论是ChatGPT还是AIGC,都离不(bù)开庞大算(suàn)力(lì)支持。在关注各类大模(mó)型的发展同时,更应该关注算(suàn)力网(wǎng)络的建设。

算力网(wǎng)络正驱动AI产业发展进入史诗级加速(sù)进程,让AIGC及通用(yòng)AI这一人工(gōng)智能发展的(de)终极目标离得更近(jìn)。

因为算力可以对突破(pò)性技术创(chuàng)新提供大力的支持。这(zhè)方面,多模态大模型是(shì)典型。作为(wèi)面向未来(lái)强人工智(zhì)能、通(tōng)用人工(gōng)智能(néng)的重要技术创新,多模态大模型(xíng)已经在人工智能领(lǐng)域提出了很多(duō)年,业(yè)界也(yě)有(yǒu)不少技(jì)术突破(pò),但是,多模态大模型进(jìn)一步往下(xià)走,算力需(xū)求呈几何式上升,一般的算力基础设(shè)施(shī)很快将难(nán)以胜(shèng)任。

从图(tú)像、文字(zì)、语音(yīn)单独一项的训练,到双(shuāng)模(mó)态、三模态的(de)跃迁(qiān),让人(rén)工智能可(kě)以(yǐ)灵活(huó)应对不同(tóng)模(mó)态(tài)的转化、像人与世(shì)界(jiè)交互一样自(zì)然(rán),这(zhè)方面(miàn),由算力网络来驱(qū)动将有明显优势(shì)。

ChatGPT之(zhī)后又一应(yīng)用杀疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌(pái)科技(jì)行业?_黑料正能量

此外,还有很多(duō)需要爆发式增长的(de)算力来支撑的技术(shù)创新,将在人工智能算力网络支撑下快速(sù)推进。

AIGC已(yǐ)经露出曙光,期待(dài)在(zài)大模型和大算力的支持(chí)下AIGC能持续颠覆(fù)内容生产的方式,将(jiāng)创造(zào)的(de)边际成本(běn)降低,让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 三大球和三小球分别是什么 三大球的起源

评论

5+2=