我预言(个人观点,仅供参考),在我有生之年,因为我的寿命未知,那么在2100年之前,我预言一定可以实现如下场景:
甲乙两个人拥有一模一样的视频创意,但是甲是拥有一个生产视频素材的广告创意公司老板,拥有团队、资金。乙只是一个个体,但是,在两个人创意一模一样的前提下,乙通过AI工具将自己的创意根据指令生成的视频,质量将会超过甲通过安排自己公司的团队通过摄像机拍摄出来的视频。
未来,以2100年为限,通过AI工具助力,个体与公司在生产数字产品方面会趋于更加公平(依然是不平等)。用通俗的例子来说就是,以后拥有创意的素人,不会因为没有摄影机、没有直播间、没有补光灯、没有直播助理、没有场控、没有策划团队而无法做出精美的视频或者无法直播,以后一个人一台电脑或者一部手机或者一台脑机或者一台“X”(未知的还未发明出来的工具),就可以制作出媲美大公司大团队的作品,但是个体与团队在创意深度与宽度、执行等方面依然存在差距。
未来,作为品牌推广工具的抖音、小红书、tiktok等社交平台(假设还存在或者出现类似产品)将会被彻底改变,这个工具让普通人在社交媒体上制作高质量视频内容成为可能,一个人顶得上一个公司的现象将会更加可能发生。
是谁给我这样的信心做这样的判断,是openAI团队的Sora工具,这是一个根据文本创建高保真视频的工具,目前已经很接近于摄像机拍摄的效果,Sora 是一种人工智能模型,可根据文字说明创建逼真而富有想象力的场景。它可以一次生成整个视频,而不仅仅是逐帧生成。
以下视频是他们的官网展示的,均由 Sora 直接生成,非机器拍摄的,未经修改的视频。你可以感受一下效果:
视频一
命令提示词: 一位时尚女性走在东京的街道上,街道上到处都是温暖的霓虹灯和动画城市标志。她身穿黑色皮夹克、红色长裙和黑色靴子,手拿黑色钱包。她戴着太阳镜,涂着红色唇膏。她走起路来自信而随意。街道潮湿而反光,与五颜六色的灯光形成镜面效果。许多行人走来走去。
视频二
命令提示词: 镜头跟在一辆白色复古越野车后面,车顶有黑色行李架,在陡峭的山坡上,越野车在松树环绕的陡峭土路上飞驰,轮胎上的尘土飞扬,阳光照在越野车上,越野车在土路上飞驰,给整个场景投下了温暖的光辉。土路缓缓弯向远方,看不到其他车辆。道路两旁的树木都是红杉,还有零星的绿色植物。从后方看,汽车轻松地沿着弯道行驶,仿佛在崎岖的地形上行驶。土路本身被陡峭的丘陵和山脉环绕,头顶是晴朗的蓝天和飘渺的白云。
视频三
命令提示词: 有中国龙的中国农历新年庆祝视频。
OpenAI 的 Sora 目前还无法供公众使用,访问权限由 OpenAI 自行决定,主要授予艺术家、设计师和研究人员。如果今后这个工具免费开放,我将向大家提供教程。
OpenAI 的 Sora的优势和局限
创新的区块表示方法:Sora采用了基于区块的表示方法,可以针对不同分辨率、持续时间和纵横比的视频和图像进行训练,提高了视频生成的灵活性。
高质量的视频生成:通过大规模语言模型的训练,Sora能够生成具有准确细节的复杂场景,包括多个角色、特定类型的运动以及主体和背景。它能够理解用户在文本描述中提出的要求,并将其转化为现实世界中的视频。
简单高效的创作过程:使用Sora,用户只需提供简单的文本描述,即可生成高质量的视频,无需专业的视频制作技能,极大地简化了视频创作的过程。
训练数据的限制:Sora的视频生成质量受到训练数据的影响,如果训练数据中缺乏特定类型的视频场景或效果,Sora可能无法很好地生成符合用户要求的视频。
算法的不足:尽管Sora采用了先进的大规模语言模型进行训练,但仍然存在一定的算法限制,可能无法完全满足用户对于细节和效果的要求。
Sora提高了视频创意的实现效率,这个工具让普通人在社交媒体上制作高质量视频内容成为可能。这将促进视频创作领域的发展和创新。Sora可以应用于广告、电影、动画等多个领域,推动这些领域的发展和创新。因为技术和训练数据是不断进步的,所以,我对2100年之前能实现的效果保持憧憬。