环球文化网

图拉古导演谈 sora,技术研发不是一朝一夕,电影人也不必过分焦虑,拥抱变革

文化 用户:宁古薄 14636℃

图拉古导演谈sora,技术研发不是一朝一夕,电影人也不必过分焦虑,拥抱变革。

在电影技术飞速发展的今天,OpenAI的Sora视频生成模型为行业带来了新的想象空间。图拉古导演,这位在电影艺术与技术领域均有丰富经验的跨行业从业者,近日就Sora及其对电影行业的影响发表了自己的看法。

图拉古导演指出:技术研发是一个长期且持续的过程,国内嚷嚷着要追赶sora,也不是一朝一夕之事。正如我过去几年在电影制作技术领域的探索一样。从2015年推出的实时剪辑系统‘t-magicbox’,到2016年研发的实时制作技术,再到2021年的超级电影工业系统,每一次技术的革新都是对电影制作流程的深刻理解和持续创新的结果。 图拉图拉古告诉记者,2015 年,他推出了实时剪辑系统t-magicbox使得拍摄现场所见即所得,在导演拍摄完成镜头拍摄后,就可以立刻看到现场剪辑后的完整剧情,这让演员和创作人员都可以即时看到艺术呈现效果,增加最终作品的确定性,也为拍摄的周期做了稳妥的保障。图拉古的实时剪辑系统由刘天博作为技术监制使用,并成功在《原谅》《离天空这么近》《遇见明天》等多部电影中使用。

他强调,电影人应对新技术保持开放的心态,而不是感到焦虑。正如我在《2045》短片中首次向行业证明了科幻电影实时制作的可能性,Sora的出现也将为电影制作带来新的变革。它不仅能够提高制作效率,降低成本,还能够激发创作者的想象力,让电影艺术更加丰富多彩。我们还了解到,2016 年图拉古开始研发实时制作技术,并在 2019 年推出了《2045》短片,这是首次向行业证明了科幻电影实时制作的可能性,让视效电影的拍摄不局限于仅依赖后期制作。

每一次技术迭代和更新都不是凭空产生的。他们都建立在已有的科学和工具实验的基础之上。所以我们当下做的每一件事情都极其重要,也许你回过头来看,曾经两年,三年,五年前的东西。显得特别愚蠢,笨重,但如果没有那些年的经历,也不可能走到今天这个成果图拉古导演说到。

2021 年,图拉古主导并先后推出了视听行业多个产品和工具,包括文字创作部分、视觉创作部分、现场创作部分、校对编辑部分等系统及部分硬件产品展示,几大系统涵盖了影视从IP原创一直到杀青、成片完成的完整解决方案,是一套完整的影视工业化制作平台,这些核心技术覆盖了人工智能、图形计算、电路集成等众多复杂领域。同年推出他多年主导研发的超级电影工业系统,旨在解决中国电影工业化难题。该技术涉及的主要技术包括摄影测量、空间定位、边缘计算、图形计算、光学计算等。

包括剧本创作、创意视觉等相关技术,旨在共建电影工业化体系,探索工业化落实进程,解放艺术家大脑。这一影视工业化平台是面向数字化影视制作的全流程设计,聚焦于解决科幻电影的三个痛点:成本高、周期长、效果差,该平台开放、共享,允许行业内的创作者使用平台进行内容转化。

图拉古推出的动态预演不仅是提高了工作效率,也能将机位图、道具图等导出数字文件分发给相关部门,打破流程滞缓和部门壁垒,促进高效沟通,该系统在优酷《三体不要回答》的项目中得到了极佳的验证。他所研发的这些技术不仅提高了工作效率,还促进了行业内的高效沟通。他的角色设计模块和概念设计模块,基于人工智能的深度学习,为艺术家提供了更广阔的创作空间。

我们进入AI的时间非常早。甚至在我们开发产品和算法的时候还没有diffusion模型,但后面我们才知道我们开发的这种AI技术被称为diffusion模型。早在 2021 年,图拉古就带领团队推出的角色设计模块,该技术包括了五官、基因、情绪、饰品、年龄、体型等要素,并可进行光效调整、表情交互等。这种基于人工智能的深度学习,将人物的设计要素进行解构并重新结构,既放大了想象空间,也使人物外形能够更加逼近剧情需要,这是最早的拖拽式人工智能扩散工具。再往后直到2022 年末才出来了drag gan等等模型和框架。

2021 年 9 月图拉古推出的概念设计模块,同样也是最早的仅通过中文就可以生成图片的扩散框架,只需要输入中文文字描述,就可生成对应的图,辅助艺术家快速创作。除了适用于影视创作外,所有视觉设计都可以使用该软件,这要早于Stable diffusion和Midjourne,并最终将源代码开源,供行业使用和借鉴。

Sora的出现,其实跟我做的这些工作有很多相似之处。他都是在创作一种更加便捷的工具。让使用者更能发挥想象力。随着时间的推移,更多的人工智能技术将进一步推动电影工业化体系的建设,但是它们在一段时间内更多的是面向蒙太奇式叙事和非精准性表达的需求范畴,这和我一直主导研发的AI感知视听技术不同图拉古表示,他在 2022 年推出的感知视听技术产品之一就是感知虚拟制作,其中包括多项革命性专利技术和领先的人工智能算法。其所发明的专利分别打破了美国和斯洛伐克对中国视听领域长达 11 年和 8 年的垄断,并在虚幻引擎全球开发者大会上讲解了 AI 感知虚拟制作赋能 ue5 一站式生产的内容。图拉古主导研发的色彩还原技术,解决了 3D 实时引擎对 2D 图像渲染着色错误的问题。色彩还原技术和AI图像分割技术,它们解决了3D实时引擎对2D图像渲染着色错误的问题,以及绿幕分割的难题。这些技术的进步,使得电影制作更加便捷,同时也为艺术家提供了更多的创作自由。

图拉古所研发的基于 AI 的渲染管线是首条支持在虚幻引擎中实现 nerf 实时渲染的管线,后来图拉古又发布了新的 nerf 技术,展示了在实时渲染引擎里重建数字资产的能力,新的技术可以无人值守的重建发丝级别的呈现效果,并支持光照还原和光影重绘技术,这一技术的突破,将传统数周数月的工作,缩短为几小时几天。只是因为我们这个企业或者说我们这个团队的声量不够。又没有足够的宣传意识,所以我们这些技术在一定时间内还没有被大众所看见。也没有为这个行业带来恐慌。我们并不像sora一样具有肉眼可见的革命性,但在 视听专用领域。我们是极具创新的图拉古说到。

图拉古研发推出的基于人工智能的AI图像分割技术,可实现复杂的绿幕分割能力,它允许用户0 操作自动化分割场景,让传统的扣绿技术不再依赖于大量的人力手动工作,并降低了对绿幕和灯光的要求,同时该技术还支持单独的人像处理模式,这种技术打破了斯洛伐克和澳大利亚对中国高质量影视图像分割技术长达 11 年的垄断。

这种新型的人工智能技术,可以实现在绿幕里精准的识别绿色的植物和用户的绿色的衣服,从而保护有效信息,使画面更干净,抠像范围更准确,这是世界上首个基于 AI 抠像的实时大模型算法,也是首次在复杂绿幕环境下抠出准确的有效信息。

在传统的电影绿幕制作流程中,阴影是非常难以处理的问题,推出基于AI的阴影分割专业级AI模型,帮助用户快速准确的处理阴影相关问题,这使得以前长达几周的工作缩短至几天时间完成。

其实我们还做了很多跟行业相关的事情。因为我们身处一线,所以我们最知道痛点在哪里,以及如何面对这些痛点。碰巧我们有了解计算机和人工智能技术,所以我们有能力训练自己的模型。

在光影重绘和色彩重映射等方面,图拉古分别主导研发了基于 AI 的新算法模型,并成功在行业中使用。

图拉古所主导研发的感知虚拟制作体系,实现了低碳绿色轻资产自主知识产权的多种效果,对推动行业健康绿色发展、中国碳达峰等有重要意义。

我们正在积极的与华为合作,一方面在云端训练我们的视听专用大模型,另一方面将我们现在的硬件替换为国产的芯片,从而增加它的确定性和可靠性。图拉古说到。

作为政府科幻产业基于‘虚幻视觉’技术的科幻影视工业化制作平台研发与服务的负责人,图拉古导演承担了科幻产业十大关键性技术的研发,对推进行业融合、人才培训等有着重要的意义。他的工作不仅提升了电影制作的效率和质量,也为电影行业的未来发展探索了方向。

图拉古取得AI 时代必要的图像图形发明专利几十余项,图拉古也呼吁大家在知识产权保护方面要提高重视,他在北京市知识产权局的指导下成立了科幻产业知识产权联盟,旨在推动行业对知识产权的保护和对科技专利创新的意识。这一举措对于维护创作者的权益,激励创新精神具有重要意义。

在图拉古导演的带领下,感知虚拟制作平台在 2023 年推出,不仅为电影制作带来了革命性的变化,也为视听行业的从业者提供了全新的工具。这个平台基于国产鸿蒙系统的生态开发,致力于打造国产自主的视听生态,这对行业发展是一个巨大的变革。

图拉古导演鼓励电影人积极学习新技术,将其融入创作过程中。我们不应将Sora视为威胁,而应视为伙伴。它能够帮助我们实现那些曾经难以想象的创意,让电影艺术更加丰富多彩。每一次工具的变革都是一次机遇,它将帮助我们打破传统束缚,创造出前所未有的艺术作品。

在采访的最后,图拉古导演表示:电影艺术的魅力在于其不断创新和探索的精神。Sora只是众多技术创新中的一个,它将推动我们进入一个更加多元和包容的电影新时代。让我们拥抱变革,共同迎接这个充满无限可能的未来。

图拉古导演的见解和实践为电影人提供了一种积极面对技术变革的态度。在Sora等人工智能技术的帮助下,电影行业将迎来新的发展机遇,而艺术家们则应把握这些机遇,不断提升自我,创作出更多触动人心的作品。图拉古导演的研发成果和对新技术的积极态度,无疑为电影行业的未来发展指明了方向,也为行业同仁树立了榜样。