发布: 4:46pm 08/03/2023

Google最新公布AI语音目标支援1000种语言

（纽约8日综合电）搜寻巨擎谷歌（Google）宣布，已朝建立一个支持1000种不同语言的人工智能语言模型的目标，迈进了”关键第一步”。

谷歌在部落格透露了有关这个通用语音模型（USM）的更多信息。

在去年11月谷歌宣布，计划创建一个支持全球1000种最常用语言的语言模型，同时还披露了其USM模型。谷歌当时将USM描述为 “一个最先进的语音模型系列”，它有20亿个参数，在1200万小时的语音和超过300种语言的280亿个句子中进行训练。

近期，谷歌发表了关于USM的API和研究成果。谷歌的自动语音辨识（ASR）是以“不断自我监督学习并微调”的方式进行。目前已经可以支援 100 多种语言自动辨识，最终目标是希望开发到1000种语言。

据悉，YouTube已经使用USM来生成封闭式字幕，它还支持自动语音识别（ASR）。这可以自动检测和翻译语言，包括英语、普通话、阿姆哈拉语、宿务语、阿萨姆语等等。

Meta公司也正在开发一个类似的人工智能翻译工具，目前仍处于早期阶段。

这项技术的一个目标可能是在增强现实的眼镜内，就像谷歌去年在I/O活动中展示的概念一样，能够检测并提供实时翻译，就在你眼前出现。不过，这项技术似乎还有点遥远，谷歌在I/O大会期间对阿拉伯语的错误表述证明了它是多么容易出错。

4小时前

Google