(纽约8日综合电)搜寻巨擎谷歌(Google)宣布,已朝建立一个支持1000种不同语言的人工智能语言模型的目标,迈进了”关键第一步”。
谷歌在部落格透露了有关这个通用语音模型(USM)的更多信息。
ADVERTISEMENT
在去年11月谷歌宣布,计划创建一个支持全球1000种最常用语言的语言模型,同时还披露了其USM模型。谷歌当时将USM描述为 “一个最先进的语音模型系列”,它有20亿个参数,在1200万小时的语音和超过300种语言的280亿个句子中进行训练。
近期,谷歌发表了关于USM的API和研究成果。谷歌的自动语音辨识(ASR)是以“不断自我监督学习并微调”的方式进行。目前已经可以支援 100 多种语言自动辨识,最终目标是希望开发到1000种语言。
据悉,YouTube已经使用USM来生成封闭式字幕,它还支持自动语音识别(ASR)。这可以自动检测和翻译语言,包括英语、普通话、阿姆哈拉语、宿务语、阿萨姆语等等。
Meta公司也正在开发一个类似的人工智能翻译工具,目前仍处于早期阶段。
这项技术的一个目标可能是在增强现实的眼镜内,就像谷歌去年在I/O活动中展示的概念一样,能够检测并提供实时翻译,就在你眼前出现。不过,这项技术似乎还有点遥远,谷歌在I/O大会期间对阿拉伯语的错误表述证明了它是多么容易出错。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT