AISHELL Speaker Verification Challenge 2019 赛事介绍

智能语音市场处于大幅增长前期，逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地，声纹识别的技术成为人体物理特征验证的一项重要语音技术。未来智能语音交互的设备都将具备声纹识别功能、借此确认用户身份，只有自己的声纹才可以启动购物、签字、控制等。5G的到来，AI+IoT成为可能，万物联网所带来的智能化时代，语音助手、安防等领域有着广泛的应用场景，声纹识别技术将面临很多挑战。

本届大赛以智能家居场景为假设，从近场注册远场测试和远场注册远场测试两个技术点出发设计赛题。通过赛事发现参赛技术方的优秀创新成果，引领声纹识别的未来。

赛事组织者

李明昆山杜克大学卜辉 AISHELL 邹月娴北京大学深圳研究生院那兴宇微软都家宇、吴本谷 AISHELL Foundation

赛事任务

数据

赛事数据来自希尔贝壳的AISHELL-WakeUp-1唤醒数据库。录音内容为“你好，米雅” “hi, mia”的唤醒词。340名录音人在真实家居环境中录制，设置7个录音位，包括6个圆形16路PDM麦克风阵列录音板做远场拾音(16kHz，16bit)、1个高保真麦克风用做近场拾音(44.1kHz，16bit)。

The setup of the AISHELL-WakeUp-1 database

本赛事数据为抽取AISHELL-WakeUp-1的高保真近讲Mic、1m、3m、5m的中文内容“你好，米雅”数据，其中训练集（254人）、开发集（42人）和测试集（44人）。数据详细信息可参考 AISHELL-WakeUp-1.pdf。Download

任务

多通道远场文本相关声纹识别：

Track1：近场数据注册，远场数据测试

即用高保真近讲Mic作为注册语音，将1m, 3m, 5m的阵列语音作为测试语音。

Track2：远场数据注册，远场数据测试

即用距离说话人1m的阵列语音作为注册语音，将1m, 3m, 5m的阵列语音作为测试语音。

赛事日程


2019年09月06日报名启动并开放训练集与开发集
2019年09月28日报名截止
2019年10月10日开放测试集并开启结果提交通道
2019年10月20日关闭提交结果通道
2019年10月26日 kaldi第四届线下技术交流会举办并颁奖

参赛须知

参赛条件

参赛人群：大赛面向社会各界开放，不限年龄国籍，高校、科研院所、企业从业人员均可报名参赛。参与大赛组织工作有关单位不可参赛；
报名要求：每人仅能拥有一支团队（1-5人），报名时所有个人或团队在注册信息里必须提供基本信息；

参赛步骤

注册成功即为报名成功；
注册之后登陆界面，点击赛事数据下载，签署协议之后即可获得比赛数据；
待提交结果通道开启之后，提交结果。

参赛规则

在您（以下简称“参赛者”）参赛前，请您务必仔细、审慎阅读并充分理解本协议的内容。如果参赛者有任何疑问请通过邮件提问，举办方将尽快解答。

参赛者一旦选择“同意”，将视为同意并签署了本协议的所有内容。如若参赛者“不同意”，将视为自动放弃参加比赛资格。

组队规则：在关闭报名通道前，单人团队可以加入其它单人或多人团队，一旦加入不可离队；
知识产权：参赛数据版权归主办方希尔贝壳所有。参赛者提交评测数据将对公众开源；
公平竞技： 本赛事为指定唤醒词训练集，如扩充只可使用openslr开源数据和AISHELL2，其他数据禁止使用。推荐参赛者优先使用kaldi开源系统做技术能力，禁止利用规则漏洞或技术漏洞等不良途径提高成绩排名，禁止在比赛中抄袭他人作品、交换答案、使用多个小号，经发现将取消比赛成绩并严肃处理。比赛过程中将持续自动化反作弊，针对系统的封禁可发邮件至challenge@aishelltech.com申诉；
组织声明：组委会保留对比赛规则进行调整修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团队奖项的权利。

评审标准

基线

赛事基线系统由昆山杜克大学提供，使用kaldi x-vector标准框架来实现声纹识别系统，仅使用单通道数据开展训练与单条语音来注册模板，没有使用openslr以及aishell任何数据做预训练。

本赛事基于远场声纹识别前沿性技术相关研究可参考以下论文：

1：Xiaoyi Qin,Danwei Cai,Ming Li,"Far-Field End-to-End Text Dependent Speaker Verification based on Mixed Training Data with Transfer Learning and Enrollment Data Augmentation", Interspeech 2019.Download

2：Danwei Cai,Xiaoyi Qin,Ming Li,"Multi Channel Training for End-to-End Speaker Recognition under Reverberant and Noisy Environment",Interspeech 2019. Download

标准

评分标准以1、3、5m混合测试集的EER结果做评测。

奖项

每个赛道（Track）设置一、二、三等奖各一名。

权威证书

赛题获一二三等奖，都可以获得主办单位冠名的纸质证书，团队成员都可获得电子版证书。

绿色通道

赛题获一二三等奖，可获得企业内推入职及实习机会绿色通道。

免费书籍

赛题获一二三等奖，可免费获得《Kaldi语音识别实践》一本。

结果提交

提交内容为参赛者真实结果文件，格式参考：

example_scores Download

提交结果通道开放后，请登录平台，于左侧菜单【提交结果】进入提交通道

注意文件格式统一为UTF-8(无签名)，每日最多提交3次

赛事结果

10月10日开放测试集，开启结果提交通道

10月20日关闭提交结果通道

FAQ

如何提交结果？以及结果文件格式如何？
请参考结果提交相关介绍
结果文件提交总是失败，是否有其他方式提交结果？
可以，将结果文件发送邮箱至 challenge@aishelltech.com，并说明团队相关信息。

联系我们

challenge@aishelltech.com