橘子百科-橘子都知道橘子百科-橘子都知道

音域划分从低到高,人声音域划分

音域划分从低到高,人声音域划分 人人都可以是导演?视频AIGC工具再进化 100帧成本降至3美分

  用户生成视(shì)频的方式(shì)变得(dé)更加(jiā)多元,可以文(wén)生(shēng)视(shì)频、图(tú)生视频、视频生视频。在不同参数设置下,每100帧的报价范围从3美分到18美分不等(děng)。

  前脚(jiǎo)《复(fù)仇者联盟》导演罗素(sù)兄(xiōng)弟中的Joe Russo刚刚放话,预计2年后就会出现一部完全由AI制作的电(diàn)影,后脚Stability AI就发布了AI生(shēng)成视频(pín)新工具,制作(zuò)电影、至少制造动(dòng)画(huà)短片难度由此进一(yī)步降低。

  当地时间5月11日,Stability AI发布(bù)Stable Animation SDK,这是一款专为艺(yì)术家(jiā)与开发人员设计(jì)的(de)工(gōng)具,旨在帮助艺(yì)术家和开发人员运用最先(xiān)进的(de)稳(wěn)定扩散模型生成动(dòng)画(huà)。

  借助这一工具,用户可以使用所(suǒ)有(yǒu)Stable Diffusion模型,包括(kuò)Stable Diffusion 2.0、Stable Diffusion XL等。

  更(gèng)重要的是(shì),用户生成动(dòng)画(huà)的方式变(biàn)得更加多元,简(jiǎn)而言(yán)之共有(yǒu)三(sān)种:文生视频、图生视频、视频(pín)生(shēng)视频

  1)文本输(shū)入(rù):即是(shì)使用文本(běn)形式(shì)的prompt,调整各种参数(shù)后生成动(dòng)画,这一功能与之前的Stable Diffusion、Midjourney或DALL-E 2类似。

  2)文本输入+初始图像输入(rù):用户提供一个初始图像,作(zuò)为动画的起点(diǎn),再配合(hé)文本(běn)prompt,生成最终的动画效果。

  3)初始视频(pín)输入(rù)+文本(běn)输入:用户(hù)提供一个初始视(shì)频,以作(zuò)为动画基(jī)础。在通过参数调(diào)整与文本prompt指导(dǎo),最(zuì)终(zhōng)可(kě)输出动画。

  与此音域划分从低到高,人声音域划分同时,Stable Animation可以设(shè)置(zhì)许(xǔ)多参数,包(bāo)括最大帧数、高度、宽度(dù)、采样器、风(fēng)格(gé)、色调等等。其(qí)中,可(kě)用(yòng)的风格预设包括动漫、电影、漫画(huà)、数字艺(yì)术,增强幻想艺术、线条、朋克、摄影(yǐng)等多种形式。

  目前,Stable Animation仅提供软件开发(fā)套件(SDK)和付费API。而部分参(cān)数要(yào)求可(kě)能会影(yǐng)响(xiǎng)价格。Stability表(biǎo)示(shì),在不同设(shè)置下,每100帧的(de)报价范围从3美分到(dào)18美(měi)分不等

  实际上,Stability AI之前已推出基于Stable Diffusion的动画(huà)工具,例如用户可以prompt interpolation生成小段动图,而此次升级后(hòu),Stable Animation生成视(shì)频的能力变得更为全面(miàn)且(qiě)成熟。

  值得一提的(de)是,近(jìn)日发布(bù)的Wes Anderson《指环王》新预(yù)告片中(zhōng),就有(yǒu)着一些(xiē)AI工具的踪迹。OpenAI前(qián)AI主管Andrej Karpathy猜测,这(zhè)部(bù)预告片(piàn)中用到了Midjourney/Stable Diffusion、ControlNet、ElevenLabs、D-Id、ChatGPT、Adobe等工具。

  东吴证券指出(chū),影视(shì)行业作为综合音频、视频、文本,是生成式AI的优质落地场景;而从AI应用(yòng)的价值和路径来看,动画电影有望(wàng)率先(xiān)受益

  相(xiāng)比真人电影1-2年(nián)的生产周期,动画电影耗时更长(3-4年),工(gōng)程更音域划分从低到高,人声音域划分复杂(zá),产能限制更加(jiā)明显。生成式AI技术有望赋能动画电(diàn)影的(de)前期剧本(běn)创作、中期作画、最后视频剪辑/配(pèi)音/视(shì)频输出等多个环节(jié),打破动画电影产能瓶颈,通过(guò)增加行业(yè)优(yōu)质动(dòng)画电影供给进一步打(dǎ)开市(shì)场空间。

未经允许不得转载:橘子百科-橘子都知道 音域划分从低到高,人声音域划分

评论

5+2=