AISHELL Speaker Verification Challenge 2019 赛事介绍
智能语音市场处于大幅增长前期,逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地,声纹识别的技术成为人体物理特征验证的一项重要语音技术。未来智能语音交互的设备都将具备声纹识别功能、借此确认用户身份,只有自己的声纹才可以启动购物、签字、控制等。5G的到来,AI+IoT成为可能,万物联网所带来的智能化时代,语音助手、安防等领域有着广泛的应用场景,声纹识别技术将面临很多挑战。
本届大赛以智能家居场景为假设,从近场注册远场测试和远场注册远场测试两个技术点出发设计赛题。通过赛事发现参赛技术方的优秀创新成果,引领声纹识别的未来。
赛事组织者
李明 昆山杜克大学 卜辉 AISHELL 邹月娴 北京大学深圳研究生院 那兴宇 微软 都家宇、吴本谷 AISHELL Foundation
赛事任务
数据
赛事数据来自希尔贝壳的AISHELL-WakeUp-1唤醒数据库。录音内容为“你好,米雅” “hi, mia”的唤醒词。340名录音人在真实家居环境中录制,设置7个录音位,包括6个圆形16路PDM麦克风阵列录音板做远场拾音(16kHz,16bit)、1个高保真麦克风用做近场拾音(44.1kHz,16bit)。
The setup of the AISHELL-WakeUp-1 database
本赛事数据为抽取AISHELL-WakeUp-1的高保真近讲Mic、1m、3m、5m的中文内容“你好,米雅”数据,其中训练集(254人)、开发集(42人)和测试集(44人)。数据详细信息可参考 AISHELL-WakeUp-1.pdf。Download
任务
多通道远场文本相关声纹识别:
Track1:近场数据注册,远场数据测试
即用高保真近讲Mic作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。
Track2:远场数据注册,远场数据测试
即用距离说话人1m的阵列语音作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。
赛事日程
|
|
|
|
|
参赛须知
参赛条件
- 参赛人群:大赛面向社会各界开放,不限年龄国籍,高校、科研院所、企业从业人员均可报名参赛。参与大赛组织工作有关单位不可参赛;
- 报名要求:每人仅能拥有一支团队(1-5人),报名时所有个人或团队在注册信息里必须提供基本信息;
参赛步骤
- 注册成功即为报名成功;
- 注册之后登陆界面,点击赛事数据下载,签署协议之后即可获得比赛数据;
- 待提交结果通道开启之后,提交结果。
参赛规则
在您(以下简称“参赛者”)参赛前,请您务必仔细、审慎阅读并充分理解本协议的内容。如果参赛者有任何疑问请通过邮件提问,举办方将尽快解答。
参赛者一旦选择“同意”,将视为同意并签署了本协议的所有内容。如若参赛者“不同意”,将视为自动放弃参加比赛资格。
- 组队规则:在关闭报名通道前,单人团队可以加入其它单人或多人团队,一旦加入不可离队;
- 知识产权:参赛数据版权归主办方希尔贝壳所有。参赛者提交评测数据将对公众开源;
- 公平竞技: 本赛事为指定唤醒词训练集,如扩充只可使用openslr开源数据和AISHELL2,其他数据禁止使用。推荐参赛者优先使用kaldi开源系统做技术能力,禁止利用规则漏洞或技术漏洞等不良途径提高成绩排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现将取消比赛成绩并严肃处理。比赛过程中将持续自动化反作弊,针对系统的封禁可发邮件至challenge@aishelltech.com申诉;
- 组织声明:组委会保留对比赛规则进行调整修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团队奖项的权利。
评审标准
基线
赛事基线系统由昆山杜克大学提供,使用kaldi x-vector标准框架来实现声纹识别系统,仅使用单通道数据开展训练与单条语音来注册模板,没有使用openslr以及aishell任何数据做预训练。
本赛事基于远场声纹识别前沿性技术相关研究可参考以下论文:
1:Xiaoyi Qin,Danwei Cai,Ming Li,"Far-Field End-to-End Text Dependent Speaker Verification based on Mixed Training Data with Transfer Learning and Enrollment Data Augmentation", Interspeech 2019.Download
2:Danwei Cai,Xiaoyi Qin,Ming Li,"Multi Channel Training for End-to-End Speaker Recognition under Reverberant and Noisy Environment",Interspeech 2019. Download
标准
评分标准以1、3、5m混合测试集的EER结果做评测。
奖项
每个赛道(Track)设置一、二、三等奖各一名。
权威证书
赛题获一二三等奖,都可以获得主办单位冠名的纸质证书,团队成员都可获得电子版证书。
绿色通道
赛题获一二三等奖,可获得企业内推入职及实习机会绿色通道。
免费书籍
赛题获一二三等奖,可免费获得《Kaldi语音识别实践》一本。
结果提交
提交内容为参赛者真实结果文件,格式参考:
example_scores Download
提交结果通道开放后,请登录平台,于左侧菜单【提交结果】进入提交通道
注意文件格式统一为UTF-8(无签名),每日最多提交3次
赛事结果
10月10日 开放测试集,开启结果提交通道
10月20日 关闭提交结果通道
FAQ
-
如何提交结果?以及结果文件格式如何?
请参考结果提交 相关介绍
-
结果文件提交总是失败,是否有其他方式提交结果?
可以,将结果文件发送邮箱至 challenge@aishelltech.com,并说明团队相关信息。
联系我们
challenge@aishelltech.com