视听资讯|人工智能在视听领域应用的四个特点

  • 2025-08-06 01:04:01
  • 616

人工智能来势汹汹。美国的一项调查显示,2025~2030年人工智能生成视频市场年复合增长率将达到35%。2025年,63%的原创流媒体内容使用AI视觉或特效,在主流社交媒体中40%的视频内容为AI生成。

在我国广电视听领域,人工智能技术的应用呈现出全方位多层次的渗透态势,推动内容生产方式、产业链接路径、用户消费模式全方位变革。

视听内容创作传播消费全流程智能化,从内容创作到终端体验人工智能无处不在。以多模态大模型为代表的生成式人工智能在行业的应用,呈现出以下4个显著特点——

从“显性工具”向“隐形基础设施”转变,应用呈现无感化、自动化状态

广电人工智能应用正通过自动化生产渗透、隐形审核推荐、分层基建集成等方式实现智能工具向智能基础设施的质变。从硬件到软件,从创作到传播,人工智能应用深度嵌入,成为产业底层能力。

视听机构积极建设大模型平台、一站式工作室、创作平台等推动技术决策融入视听全流程,推动大模型自动调用、算法自动优化等方式融入日常生产决策,人工智能服务进入无感化应用状态。

AI正从辅助工具升级为支撑内容创新的关键能力——

中央广播电视总台建立人工智能工作室,强化“央视听媒体大模型”研发、训练和应用,“总台算法”成为首批通过国家标准认证的大模型。借助自有大模型,总台推出《千秋诗颂》《中国神话》《来龙去脉》《2024中国AI盛典》等一批AI产品。

北京广播电视台基于AIAgent的编排模式建设AI智作平台,接入多个国产大模型,台内工作人员可以通过该平台一键生成文本、语音、图片等内容,实现无感化使用。AI智作平台支持文生视频、自动字幕,日均生成500+条短视频。

山东广播电视台以自主研发的融媒体内容生产管理平台闪电云平台为基座,融入国内头部科技企业的技术,将人工智能技术深入融入内容生产各个环节,研发了闪电成章、智能小融、智能审核、融媒百宝箱、AI文稿助手等多个智能产品。多款智能产品的协同,构建了覆盖全流程的“隐形”智能基础设施。

在影视制作中,AI全方位融入成为“创作合伙人”,降低了专业级视频创作的门槛——

2024年7月,阿里达摩院发布寻光视频创作平台。针对视频后期编辑,通过简易的分镜头组织形式和丰富的视频编辑能力,让用户实现对视频内容的精准控制,并保持多个视频中角色和场景的一致性。

“寻光”分镜故事板一键创建、定制自己的故事角色、生成具备一致性的角色和场景画面,再利用运镜控制、运动编辑,创作AI视频作品;同时,可以使用各类视频编辑功能进行修改,更有图层拆解和融合功能,定制化视频内容,方便用户利用AI创作高质量、高一致性的故事视频片段,而非几十秒的创意AI视频。

影视制作公司推出导演视觉创意AI系统。使用该系统,影视拍摄中演员绿幕表演、导演依靠想象把控现场的状况彻底终结,融入人工智能的拍摄系统让导演直观看到实际表演效果,演员也能随时调整自己的表演状态。

在微短剧的应用中更为突出,AIGC短片创意系统可以深度模仿人类思维,“一站式”生成具有统一角色设定和连贯叙事逻辑的影片。

AI也深度融入影视硬件中,例如拍摄使用的机械臂融合了人工智能应用,可以通过算法选择完成10秒钟的复杂运镜。

在虚拟影棚中的LED巨幕也普遍搭载AI算法,可以根据演员位置动态调整光源与景深,替代传统绿幕抠像的复杂调试。

从软件到硬件,AI正以“润物细无声”的方式成为影视制作的智能内核。

人工智能推动生产流程重构,向人机协同的生态化系统演进

人工智能通过重构生产流程、重塑协作生态及优化经济模型,推动视听行业完成从“人力密集”向“人机协同”的系统性跃迁。技术红利下,效率提升与成本节约已成常态,生态化协作将是未来竞争核心。

人工智能重构视听生产流程,极大提升效率。根据报道,正在拍摄的《流浪地球3》引入人工智能技术辅助剧本创作与特效渲染,超80%的场景使用虚拟制片系统。

在拍摄中使用动态光照大模型自动匹配光线折射角度,让剧中演员的太空服在太阳光下呈现真实金属质感;人工智能应用Pika生成的行星发动机爆炸镜头,成本仅为传统制作的1%。

剧组与商汤科技合作建立数字演员库,扫描1000多名真人演员的微表情数据,通过人工智能分析面部肌肉运动规律,可以生成跨越20年的年龄变化特效。

AI自动化剪辑工具(如Runway、剪映)大幅提升效率。抖音平台“图文成片”功能输入文本后自动匹配素材、添加字幕和音乐,视频产出效率提升300%。

未来人工智能将逐步从参与短视频、微短剧创作向深度参与长剧、电影创作转向,从后期特效、中期拍摄向制作全环节扩展,从参与奇幻、玄幻、战争等场景创作向全类型场景扩散。

视听创作从手工作坊式生产转向智能化流水线作业,实现效率跃升、成本下降,人工智能也将完成从技术工具向灵感激发者、美学共创者的角色转换。这种角色已经在部分创作环节发挥着越来越重要的作用。

例如在《长歌行》拍摄中,使用AI融合历史考据与创新设计,为剧中人物设计符合唐制且具有现代美感的服饰,缩短设计周期70%。

雅文传播让AI学习5000小时影视对白,可以生成带悲喜语调的多语种配音。

完美世界微短剧生产中,AI承担IP筛选、剧本解构等80%基础工作,个人创作者则聚焦20%的创意工作。

人工智能助力视听消费场景升级,线下沉浸式体验持续扩展产业边界

人工智能技术在消费场景升级拓展中发挥了重要作用。动作捕捉、实时渲染、游戏引擎(UnrealEngine)和视听叙事叠加,在人工智能助力下,广电视听行业正持续开发以沉浸式场景为代表的线下新消费,把“屏幕里的故事”变成观众“身边的体验”,跳出了被动接受观众“看”与“不看”的藩篱。

未来随着垂直模型的细化,个性化内容生产成本降低,千人千面的视听线下消费体验有望成为产业新的增长点。

随着超高清纪录片《布达拉宫》的上映,中国移动咪咕公司打造了《布达拉宫》VR大空间沉浸展,展览基于布达拉宫超级IP,采用了数字采集、三维建模、AI人工智能等新技术打造。观众佩戴VR头显进入虚拟时空,乘坐马头船穿越雪山,在神秘宝珠的引领下漫游布达拉宫,探秘布达拉宫迷宫回廊,全方位感受藏文化独特之处。

陕西广电借助电视剧的热播效应,将《长安十二时辰》《白鹿原》《唐朝诡事录》《大秦赋》等IP延伸至线下,打造出“长安十二时辰”唐朝市井文化生活体验街区、“白鹿原”影视城旅游线路、“唐朝诡事录”国潮沉浸剧场、“大秦赋”秦文化历史体验项目等特色产品。

陕西广电还计划以“XR”为业务抓手,将传统视听体验升级为三维空间视频体验,推动XR+纪录片、XR+微短剧、XR+丝路春晚、XR+节展会赛等多个板块创新场景应用。

陕西台《中国考古》节目就通过人工智能实现节目线上播出+大空间线下落地运营联动。河南卫视也借助人工智能和XR技术推出了《隐秘的秦岭》《唐宫夜宴》等沉浸式影像展。

这些展览打破了视听内容传统的单向传播模式,让视听产品从一次性消费品,变为可交互、可交易、可迭代的产品和服务,打造了视听+文旅的新典范。

未来,人工智能驱动的消费升级正从技术应用层面向产业生态系统演进,视听、文旅、零售等场景融合加速,沉浸式体验和个性化消费将助力视听增长动能转换。在可见的未来有望形成“AI原生消费”。在需求端,用户表达需求,AI精准匹配。在供给端按需生成内容和服务,实现需求—供给—消费的闭环。

人工智能破除传播壁垒,视听内容生产和传播进入无国界时代

AI翻译技术带来视听作品在海外母语级个性化体验,视听内容生产和传播从“多国适配”转向“全球同步”转变。

大量人工智能翻译工具实现自动翻译、配音及字幕生成,显著降低跨语言传播成本。

人工智能加速视听内容本地化推动触达全球受众,YouTube平台60%观看量来自非英语国家,多语言字幕和配音使平台海外收入增加。

TikTok旅游博主使用AI翻译视频功能后,多语种观众参与度提升30%。

在国内,越来越多的影视制作机构在内容策划、生产阶段就关注适配国际市场。

华策使用自研的剧本模型“有风”在拍摄前进行剧情跨文化冲突检测,制作中使用“国色”大模型对台词、禁忌词进行语境改写,使同一部剧集快速拥有海外“本土化版本”,海外发行效率提升。

2025年4月揭牌的马栏山微短剧智能译制中心,把120分钟短剧的翻译+配音周期从3天压缩到4~5小时。其一站式工具集成大语言模型、声音克隆、人声分离、字幕识别与擦除、情感语音合成等模块,支持20余种语言,情感保留度超过90%。这种效率的飞跃,使得内容的“全球同步”传播成为可能。

我们也应该看到,当前人工智能技术在视听领域的应用仍然处于初级阶段,还存在明显的问题——

例如人工智能技术与影视内容生产的高质量适配不足,优质内容生成需要高度人为干预。视听领域生成式应用的产业尚未形成生态闭环,投入与收益失衡,部分企业仍然因为政策、成本等问题存在迟疑。

行业既懂视听艺术创作又精通AI复合型人才断层,内容创作同质化现象严重。有的机构反映,制作机构需同时雇用导演团队与算法工程师,沟通成本占项目预算15%。

算法偏好导向导致内容模板化与情感窄化,创意同质化普遍存在。例如部分古装剧创作中,制作人员过度依赖AI导致“算法美学”,导致剧集场景、服化道雷同。

有技术专家警告,若AI持续替代人类创意决策,将导致情感表达贫困化,观众长期消费此类内容可能降低艺术鉴赏力。

广电视听行业要坚持守正创新、以人为本,统筹发展与安全,推动AI技术与内容生产深度融合,确保技术用得稳、内容把得牢、导向把得准,持续为广电视听行业高质量发展注入新动能。