台湾是省还是市台湾是省会吗-橘子百科-橘子都知道

台湾是省还是市台湾是省会吗 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器(qì)人ChatGPT火爆以来(lái)，微软公(gōng)司创始人比尔·盖茨已多次公(gōng)开(kāi)谈论人(rén)工智能话题。在最(zuì)近的一(yī)次采访中，他(tā)再次表(biǎo)示：“AI可能会让科技(jì)行业(yè)迎来一次剧烈的洗牌”。

这个结论是他在当地时间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预期，AI的发(fā)展可能(néng)会威胁到谷歌的(de)市占率，因为微软在AI方面的行动相当迅速。而(ér)最终科技(jì)巨头将把AI整合成用户的“全能助手”，包揽一(yī)切应用，与人们(men)进行沟(gōu)通并提(tí)供建议，可(kě)以取代亚马(mǎ)逊、Siri或(huò)Outlook等应用。

大佬口中全能助手的(de)到(dào)来可能尚需(xū)时日，但由ControlNet引发的又一次AI绘画浪潮，让AIGC在ChatGPT的话(huà)题热点包(bāo)围(wéi)中杀出(chū)重围。

ChatGPT之(zhī)后又一应用杀疯了，AIGC或进入可控期，将(jiāng)洗(xǐ)牌科(kē)技行业？_黑料正能量

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠(kào)近(jìn)

以AI绘画(huà)为代表(biǎo)的AIGC上(shàng)一次(cì)爆火的时候，还是2022年8月，在(zài)美国科罗拉多州(zhōu)举办的新兴数字艺术家竞赛中，一(yī)幅名(míng)为《太(tài)空歌剧(jù)院》的作品(pǐn)获奖。

随后各大(dà)厂商的(de)AI绘画软件被广大网友(yǒu)熟知并体(tǐ)验，Stable Diffusion便(biàn)是其(qí)中代表。

用户们可以在应用中输(shū)入一组关键词或者一张照片，就(jiù)能获得一幅AI创作(zuò)的画作。

作画的关键就是所输(shū)入(rù)的文本。同一(yī)组关键词也可以创作出很(hěn)多(duō)张风(fēng)格不一(yī)样的(de)画(huà)作，这让创作(zuò)的过(guò)程就像开盲(máng)盒(hé)。

很多用户很喜欢这种不(bù)确定的惊喜，他们会将生成的美图当做头像。而(ér)另(lìng)一部(bù)分喜欢翻看AI绘画的“翻车”作品。在社交(jiāo)媒体上，许多用户(hù)分享AI“翻(fān)车(chē)现场”，例如，一位(wèi)网友的小狗照(zhào)片(piàn)被AI画成了“肌肉男”，还(hái)有网(wǎng)友的个(gè)人照片(piàn)被AI识别成了建筑。

而(ér)如今随(suí)着ControlNet的出(chū)现与加持，以往AI绘画的填写(xiě)关键词游(yóu)戏可能要被颠(diān)覆了。

ControlNet是一位正在斯坦福读博(bó)的(de)中国人张吕敏创作的一种(zhǒng)基于控制(zhì)点的图像变形算法，主要(yào)用(yòng)于数字图像处理、计算(suàn)机视(shì)觉和计算机(jī)图形学等(děng)领域。

其SD插件一经发布，在短短的两天内便成为了AI绘画领(lǐng)域最(zuì)新的热点(diǎn)。

在此(cǐ)之前，大家用了很(hěn)多(duō)方(fāng)法想让(ràng)AI生成的结果尽可(kě)能(néng)的符合要求，但(dàn)是都不尽如人意，它的出现代表着AI生成开始进入真正的可控时期(qī)。

因为ControlNet可以直接提取画面的构图，人物的姿(zī)势和画(huà)面的深度信(xìn)息等(děng)。有了它的帮助(zhù)，就不(bù)用频(pín)繁的用提示(shì)词来(lái)碰运气(qì)，抽盲盒式的创作了。

通俗的说ControlNet相当于给AI绘画加了“魔法(fǎ)”，不少博主的作品已经获得了大(dà)量的浏览量，“viggo”就是其中之一，他用朋友的照片直接带(dài)她们走进动漫世界。

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找(zhǎo)到(dào)对应的关键(jiàn)词(cí)；最后用(yòng)ControlNet插件绑定骨骼开始换关键词试效果。

通过图片就可(kě)以看出来，效果十分惊艳。

更厉(lì)害的(de)是，除了真(zhēn)实(shí)的照片，草图也可以(yǐ)加上“魔法”，知乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现(xiàn)线稿转全彩图。大神(shén)张(zhāng)吕敏(mǐn)其本(běn)尊也亲(qīn)自回应。

不得不说当下AIGC已经变得越来(lái)越(yuè)强大，甚(shèn)至输出的作品都(dōu)已经能(néng)以假乱真(zhēn)了。

难辨虚实，AIGC技术力爆(bào)发

警惕(tì)安全问(wèn)题

近日(rì)，“苏州金鸡湖有游艇party”的消息火遍网络，而经过警方辟谣这所谓(wèi)的(de)“party”可能是全(quán)国第一起(qǐ)AI绘图诈骗。

由于(yú)这(zhè)个活动里面给(gěi)出的(de)美女照片都(dōu)是AI制作(zuò)的真(zhēn)人照片绘(huì)图，因(yīn)为太逼真，被大家当成真(zhēn)事传播了。

不过仔细观察可以发现，活动(dòng)发(fā)起(qǐ)者提供的照片中有个很大的漏洞可以发现并非真人(rén)，而是(shì)AI绘图(tú)，那(nà)便是图片中女(nǚ)性的手指(zhǐ)部分有的存在(zài)异常。

ChatGPT之后又(yòu)一(yī)应用(yòng)杀(shā)疯了，AIGC或进入可控期，将洗牌科(kē)技行(xíng)业？_黑料正能量

有行业人事表示：“现(xiàn)在(zài)因(yīn)为(wèi)手指部分的绘画算(suàn)法(fǎ)比较复杂，AI还不太会画人(rén)的手(shǒu)，但最新(xīn)看到的(de)图片已经(jīng)有越来越完美(měi)的AI模型出(chū)现(xiàn)，以后可能(néng)就完全(quán)没有漏洞了。”

类似的AI作图诈骗在国外也已有发生(shēng)。据英国广播公司报道(dào)，土耳其(qí)地(dì)震期间，有Tiktok用户使用AI合成了儿童受灾的假(jiǎ)照片发布到网络，以此诱骗善(shàn)良的人打赏“捐助”从而实施(shī)诈骗。

目前(qián)随着技术发(fā)展，AIGC已经(jīng)能做(zuò)出(chū)真人照片般的绘图效果(guǒ)，如果这样的图(tú)片(piàn)被用来诈(zhà)骗(piàn)，将非常可(kě)怕。

此外(wài)AIGC还(hái)引发了很多担(dān)忧，一方面(miàn)，批判(pàn)者认为(wèi)AI在(zài)“学习”了大量前人(rén)的作品之后，其创作没(méi)有任何情绪和灵魂，难(nán)以和人类(lèi)的艺术(shù)创作相提(tí)并论。

另(lìng)一(yī)方面(miàn)，AIGC背后的版权、目前都并没有得(dé)到有效的(de)解决(jué)，还有AIGC会(huì)不(bù)会代替人类“至高无上”的创意(yì)。

马斯克(kè)也(yě)强调，人工智能的(de)安(ān)全问题需要得到重视，太晚就来不及(jí)了。

AIGC下一站除了视(shì)频，还有(yǒu)远方

技术都是有两面性的，潜在的危害并(bìng)不能(néng)掩(yǎn)盖其(qí)光辉的(de)贡献。现在看来，人工(gōng)智能技(jì)术将是(shì)第(dì)四次(cì)工业革命的核心驱动力量，将创(chuàng)造新的(de)增长奇(qí)迹(jì)。

过(guò)去一年，人(rén)工智能在技术(shù)和商业层面都有了巨大(dà)进(jìn)展，AI绘(huì)画就是人(rén)工智能(néng)技术发(fā)生方向性改变的一(yī)个代表。其下一站或许就是视(shì)频。

此(cǐ)前，Meta和谷歌先后发布了几条引爆(bào)科技圈(quān)的(de)短视(shì)频。这些视频引发关注并非内容做得多优秀，反而(ér)都(dōu)非常简单，比如一(yī)匹正在喝水的马，一只画(huà)画的玩具熊，或者一(yī)段骑摩托车的第一视角录像，随便一个有(yǒu)手(shǒu)机(jī)的人(rén)都可以(yǐ)随手录下(xià)一段。

但(dàn)这(zhè)些短视频的创作方式非常简(jiǎn)单，创作(zuò)者仅仅需要向AI输入一段(duàn)话，甚至只是说一下要求，AI就可以根据需要生(shēng)成一段(duàn)视频。

谷歌发布的两个AI生成视频分别(bié)来自于Imagen Video和Phenaki，前(qián)者主(zhǔ)要突出的是高清，与Meta的Make-A-Video没(méi)有(yǒu)太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后，AI圈就已(yǐ)经玩了一波梗(gěng)，一(yī)个能(néng)够做出更高清视频(pín)的AI还不足(zú)以在(zài)短(duǎn)时间内戳(chuō)中(zhōng)兴奋点(diǎn)。

Phenaki更加令(lìng)人(rén)震(zhèn)惊的地(dì)方在于(yú)，它可以制作出超过2分钟的(de)连贯的也有确(què)切内容的(de)视(shì)频(pín)，这(zhè)才(cái)是真正让人(rén)们感到惊喜的(de)地方。因为无论AI生成的视频多么(me)高(gāo)清，也(yě)只能是为(wèi)内(nèi)容生产者提供一个灵感，一个(gè)素材，一(yī)个过(guò)场动画。

不(bù)过能(néng)够制作出有(yǒu)具体剧情内(nèi)容的视频就(jiù)意味着，一些(xiē)视频创作(zuò)由AI代替人(rén)工完成(chéng)已经(jīng)初步(bù)有了(le)可能(néng)。

当下AI的发(fā)展(zhǎn)速度已经超过大部(bù)分(fēn)人的想象(xiàng)。内容(róng)产业的本质是(shì)供给创造需求，AIGC作为(wèi)全(quán)新的内容生(shēng)产方式，可以(yǐ)为内容(róng)产(chǎn)业带来更(gèng)新的内容(róng)风(fēng)格、更快的生产速度，更低的(de)生产成本，这无疑会驱动(dòng)内容产(chǎn)业的(de)大爆发。

除了AI绘图、视频，AIGC技术还能应用于音乐、代码、机器(qì)人动作等多种内容(róng)形式的生成。不难发现该项技术不(bù)仅在游戏(xì)等行业能得到有效应(yīng)用(yòng)，对于下一代互联网(wǎng)各种元素的构建亦有关键意(yì)义。

从商(shāng)业化的(de)角度来看，文化娱乐、教育、传媒等诸多领域，本身就对基于AI的可(kě)视(shì)化内(nèi)容有强烈(liè)需(xū)求。

因此，AI绘画及(jí)视频(pín)或不是(shì)结(jié)果(guǒ)，而只是AI进程中的一块重要拼(pīn)图，有(yǒu)望在技术更新的加持下(xià)实现(xiàn)更大(dà)的应用价(jià)值。

AI从理解(jiě)内容，走向了(le)可以生成内容，甚至能(néng)够创(chuàng)造出独立价(jià)值和独立视角(jiǎo)的内容。AIGC的再次出圈，更代表着未来的先进生产力即将到来。

紧抓大模型与算力，牢(láo)固AIGC底座(zuò)

从技(jì)术的发(fā)展也(yě)可以看出，在语言大模(mó)型、图(tú)像大模型之(zhī)后(hòu)，多模态(tài)大模型(xíng)已经成(chéng)为了新的趋(qū)势。

大模型被誉为(wèi)当前人工智(zhì)能发(fā)展(zhǎn)的智能(néng)底座，是全球竞争(zhēng)最激烈的研究方向之一，包括(kuò)谷(gǔ)歌、亚马逊、百度、阿里、腾(téng)讯等(děng)众多头(tóu)部(bù)企业都在竞相(xiāng)发(fā)力。

不(bù)过训练大模型(xíng)的确价(jià)格(gé)不(bù)菲(fēi)，以国盛证(zhèng)券发布的《ChatGPT需要(yào)多少算力(lì)》报告估算，GPT-3训练一次的(de)成本约为140万美元。而(ér)对(duì)于一(yī)些(xiē)更大(dà)的LLM(大型语言(yán)模型)，训(xùn)练成本则介(jiè)于200万美元(yuán)至1200万(wàn)美元高价(jià)之间。

以ChatGPT在2023年1月的独立访客平均数1300万计(jì)算，其(qí)对(duì)应(yīng)芯片需求为3万多片英(yīng)伟达A100 GPU，初始投入(rù)成本(běn)约为8亿美元，每日仅电费就在5万美元左(zuǒ)右。

此外不(bù)论是ChatGPT还是(shì)AIGC，都离不开(kāi)庞(páng)大(dà)算(suàn)力支持。在(zài)关注各(gè)类大模型的发展同时，更应该关注算力网络的(de)建设。

算力(lì)网络正驱动AI产业发展进入史诗级加速进程，让AIGC及通(tōng)用(yòng)AI这一人工(gōng)智能发展的终极目(mù)标(biāo)离得更近。

因为算力可以(yǐ)对突破性技(jì)术创新(xīn)提供大(dà)力的支(zhī)持。这方面，多模态大模型是典型。作(zuò)为面向(xiàng)未(wèi)来强人(rén)工智(zhì)能、通用人工智能的(de)重要技术创新，多模态大模型(xíng)已(yǐ)经在人工(gōng)智能领(lǐng)域提(tí)出了很多年，业界也有(yǒu)不少技术突破，但(dàn)是，多模态大(dà)模(mó)型(xíng)进一步往(wǎng)下走，算力需(xū)求(qiú)呈几(jǐ)何式上(shàng)升，一般的(de)算力基础设施(shī)很快将难以胜任(rèn)。

从(cóng)图像(xiàng)、文字(zì)、语音单独一项的训练，到双模态、三模态的跃迁，让人工智能可以灵活(huó)应(yīng)对不同(tóng)模态的转化、像人与世(shì)界交互一样自然，这方面，由算力网络来驱动将有(yǒu)明显优势。