B站打通国内外 App，并上线自研 AI 原声翻译器

思路作者：发表于 2026-04-03 15:56 阅读：0

在今年的世界人工智能大会上，B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」，以便海外用户更好体验游戏、科技、二次元等主推内容。B站似乎已经做好准备蓄力开拓海外市场。

本次发布的「AI原声翻译」功能--除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外，而非传统的机器音翻译，同时还能基于翻译语言进行口型模拟。这意味着在未来中文用户观看外语UP主视频或海外用户观看中文UP主视频时能无差别体验原汁原味的“本地化”翻译视频。后续，B站还将视需求把日语等语言加入「AI原声翻译」功能中，持续扩展在海外市场的适配能力。

目前B站「AI原声翻译功能」中，跨语言声音还原技术源自内部代号为「 IndexTTS2」的语音生成模型，其整体框架如下图所示。该模型引入了一种新颖、通用且兼容自回归架构的语音时长及情感控制方法。该方法支持指定token数量，从而实现对语音时长的**调控，降低了翻译任务的难度。另外对情感表达与说话人身份进行了有效解耦，实现了高质量地复刻原片语音中蕴含的情感。

***基于语音时长匹配、原声翻译标准与UP主**风格构建多目标奖励模型，并采用对抗式强化学习（RL）训练驱动模型持续进化与精准适配。同时，引入Deep Research深度挖掘技术，专攻专有名词与流行梗点的翻译难点，确保最终译文准确、地道、传神。字幕擦除部分则结合了**的多模态大模型OCR技术和基于STTN的视频重绘技术，实现字幕区域的精准检测与与高还原度擦除。

本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体)，仅供学习参考。用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权，请联系我们反馈本站将在三个工作日内改正。