- A+
所属分类:英语资源
最近,猿辅导又憋了个大招:猿辅导的ai团队在一项语音合成顶级比赛中,过五关斩六将,战胜了19名来自各大高校及企业的高手们,获得了冠军。
这项顶级赛事的全称是“多说话人多风格音色克隆大赛(m2voc)”。m2voc挑战赛是2021年声学、语音和信号处理国际会议(icassp2021)信号处理挑战的旗舰任务之一,比赛的项目内容即为“语音克隆”,在每个目标说话人提供少量音频的条件下,实现合成该说话人的语音,力求在语音质量、和目标说
话人的相似度、表现力和鲁棒性上有更好的表现。
“多说话人多风格音色克隆比赛”猿辅导参赛团队
语音克隆听着玄乎,怎么形容这个技术呢?让我们来想象一个场景:一个网课老师的精力有100分,其中如果有30分精力要用来出题、念题,还要反复更正,有了ai后,这30分变成了10分,多出来的20分精力,老师可以用来做更多的学生互动,设计更好玩的互动内容,优化课程,最终让孩子受益。
当然,这一切的前提是,ai说英语能“native”到和外国人一样。在这方面,猿辅导研发团队进行了多年的投入:在标准的英文发音中,对一些发音有着非常严苛的要求,或者是英语面向低龄教学里会需要一些自然拼读的语段,一般的语音合成是无法满足这些需求的。而猿辅导则以此为突破点,在语音合成中加入了许多韵律信息,以让语音合成的用力更加流畅、自然,有节奏感。最终猿辅导团队终于让英语合成的语音更为顺滑,也正是这一突出的优势,让他们摘得了m2voc挑战赛的桂冠。在获胜背后,这个平均年龄不足三十岁的年轻团队倾注了长期大量的心血。
更重要的是,技术的发展还能更高效地推动教育普惠的实现。当前,城乡义务教育资源配置依然存在不平衡、不充分的难题,通过科技手段弥合差距,成为了促进教育公平的新机遇。其中,人工智能在多种教育场景下的具体应用,为破解难题提供了
可行方案。
例如,人工智能技术可以打破地域资源的限制,让农村地区的孩子也可以享受和城市孩子一样的教学。通过在线教育,扩大优质教育资源的覆盖面,推动城乡教育均衡化,助力教育扶贫。
再比如,智慧课堂可以通过语音合成、智能语音评测技术,开发语言教学系统,构建标准化的语音教学环境,帮助解决农村等边远地区的学科因师资力量短缺而难以开展的问题。
而上述这些需求,都需要在线教育行业长期投入技术研发,不断摸索和实践“ai+教育”的更多种可能。在这方面,猿辅导已经走在了前列:2014年,猿辅导就成立了国内首家在线教育领域的ai研究院,结合教育需求持续投入技术研发。目前,猿辅导的语音识别、大数据技术等,已经广泛在包括猿题库、斑马
ai课等多个产品中。
“推进教育公平还需久久为功。一方面,借助科技的力量让教育公平而有质量,另一方面,还要注重技术开发中的科技伦理,落实好立德树人的根本任务。”猿辅导联合创始人李鑫表示。