2025-12-21 16:48:39

火山引擎推豆包语音识别2.0，支持多模态与13种海外语言

摘要

12月5日，火山引擎推出豆包语音识别模型2 0版本，基于Seed混合专家大语言模型架构打造。该版本在推理能力方面实现显著提升，能够通过深度

火山引擎推豆包语音识别2.0，支持多模态与13种海外语言

12月5日，火山引擎推出豆包语音识别模型2.0版本，基于Seed混合专家大语言模型架构打造。该版本在推理能力方面实现显著提升，能够通过深度理解上下文内容完成更精准的语音识别，整体关键词召回率较此前提高20%。

新版本引入多模态视觉识别能力，不仅可处理语音信息，还能结合图像内容进行综合判断，支持单图与多图输入，使文字识别结果更加准确。系统现已覆盖日语、韩语、德语、法语等13种海外语言，具备较强的跨语种识别性能。

针对实际使用中的复杂场景，模型在专有名词、人名、地名、品牌名称以及易混淆的多音字识别方面进行了专项优化。例如，在讨论历史人物苏辙时，当用户提到其贬谪地“筠（yún）州”，即便上下文中未直接出现该地名，模型也能结合当前语境和相关背景知识，准确区分“筠州”与发音相近的“云州”“郓州”等，有效避免误识别。

目前，豆包语音识别模型2.0已在火山方舟体验中心上线，并开放API接口，供外部接入使用。

时事资讯

2026-01-05 01:21:01

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

2026-01-02 08:16:31

5000元显卡推荐

2025-12-28 07:32:10

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

2026-01-09 11:56:06

璩静离职百度热搜，新公司已注册

2026-01-07 06:10:00

豆包更新语音对话功能：能讲粤语、四川话等4种方言

2026-01-04 10:37:20

大疆入局 3D打印行业“硝烟”再起

查看更多

科技趋势

时事资讯

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

单12V-2×6实现为RTX 5090供电750W！甚至都没敢跑分

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

我国新一代太空感知星座发布 156颗卫星组建太空星眼监测空间碎片

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

NVIDIA GPU＋显存不再捆绑强卖！显卡价格生死难料

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

为什么上班以后越来越胖 5个 “隐形元凶”是关键！

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

飞行速度5-7马赫！四川一民企造出高超音速导弹仅70万元：官方回应基本型已量产

年产20发！航宇火箭总装智造基地正式投产

年产20发！航宇火箭总装智造基地正式投产

空投利刃砸中必死！央视曝光改装无人机狩猎案

空投利刃砸中必死！央视曝光改装无人机狩猎案

日常维修不求人友福汽修工具套装46件套16.9元大促

日常维修不求人友福汽修工具套装46件套16.9元大促

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

4699元起华为Mate 80系列开售晨曦金版本成爆款已售罄缺货

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

查看更多

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

曝三星正研发新一代 Odyssey OLED G6 显示器：27 英寸 2K 面板，有望明年上市

5000元显卡推荐

5000元显卡推荐

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

实探毫末智行北京总部！已人去楼空，有员工抱着显示器离开

璩静离职百度热搜，新公司已注册

璩静离职百度热搜，新公司已注册

豆包更新语音对话功能：能讲粤语、四川话等4种方言

豆包更新语音对话功能：能讲粤语、四川话等4种方言

大疆入局 3D打印行业“硝烟”再起

大疆入局 3D打印行业“硝烟”再起

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

英伟达：我们为谷歌在 AI 方面的成功而高兴，但现阶段我们的芯片领先一代

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

消息称谷歌重启 AI 眼镜：富士康代工、三星设计，最快明年四季度发布

索尼光喻发布LYTIA 901并全面升级命名体系

索尼光喻发布LYTIA 901并全面升级命名体系

话费小额充值消失背后：效率与用户选择权的博弈

话费小额充值消失背后：效率与用户选择权的博弈

查看更多