近期,Meta旗下的AI科研团队公布了一种自监督学习的语音处理方案XLS-$,其特点是可识别128种语言,实现语音识别、语言识别、语音翻译等功能。
据悉,Meta希望将语音识别技术与未来的虚拟技术结合,其表示:交谈是人与人互动的自然方式,而语音技术可以让我们与设备和虚拟系统互动,让虚拟体验与物理世界更加融为一体。
据青亭网了解,Meta号称训练XLS-R采用的公共数据是其他语言模型的近10倍,它可以识别的语言类型也是其他模型的两倍多。细节方面,训练XLS-R的数据包括43.6万小时的公开演讲录音,涉及有声读物、议会程序等各种内容。