AISHELL Speaker Verification Challenge 2019
查看排名 登录/注册

AISHELL Speaker Verification Challenge 2019 赛事介绍

智能语音市场处于大幅增长前期,逐渐成熟的语音技术使得智能语音的商业化落地成为可能。随着智能音箱以及智能语音交互的设备不断落地,声纹识别的技术成为人体物理特征验证的一项重要语音技术。未来智能语音交互的设备都将具备声纹识别功能、借此确认用户身份,只有自己的声纹才可以启动购物、签字、控制等。5G的到来,AI+IoT成为可能,万物联网所带来的智能化时代,语音助手、安防等领域有着广泛的应用场景,声纹识别技术将面临很多挑战。

本届大赛以智能家居场景为假设,从近场注册远场测试和远场注册远场测试两个技术点出发设计赛题。通过赛事发现参赛技术方的优秀创新成果,引领声纹识别的未来。

赛事组织者

李明 昆山杜克大学 卜辉 AISHELL 邹月娴 北京大学深圳研究生院 那兴宇 微软 都家宇、吴本谷 AISHELL Foundation

赛事任务

数据

赛事数据来自希尔贝壳的AISHELL-WakeUp-1唤醒数据库。录音内容为“你好,米雅” “hi, mia”的唤醒词。340名录音人在真实家居环境中录制,设置7个录音位,包括6个圆形16路PDM麦克风阵列录音板做远场拾音(16kHz,16bit)、1个高保真麦克风用做近场拾音(44.1kHz,16bit)。

The setup of the AISHELL-WakeUp-1 database

本赛事数据为抽取AISHELL-WakeUp-1的高保真近讲Mic、1m、3m、5m的中文内容“你好,米雅”数据,其中训练集(254人)、开发集(42人)和测试集(44人)。数据详细信息可参考 AISHELL-WakeUp-1.pdf。Download

任务

多通道远场文本相关声纹识别:

Track1:近场数据注册,远场数据测试

即用高保真近讲Mic作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。

Track2:远场数据注册,远场数据测试

即用距离说话人1m的阵列语音作为注册语音,将1m, 3m, 5m的阵列语音作为测试语音。

赛事日程

  • 2019年09月06日 报名启动并开放训练集与开发集
  • 2019年09月28日 报名截止
  • 2019年10月10日 开放测试集并开启结果提交通道
  • 2019年10月20日 关闭提交结果通道
  • 2019年10月26日 kaldi第四届线下技术交流会举办并颁奖
  • 参赛须知

    参赛条件

    • 参赛人群:大赛面向社会各界开放,不限年龄国籍,高校、科研院所、企业从业人员均可报名参赛。参与大赛组织工作有关单位不可参赛;
    • 报名要求:每人仅能拥有一支团队(1-5人),报名时所有个人或团队在注册信息里必须提供基本信息;

    参赛步骤

    • 注册成功即为报名成功;
    • 注册之后登陆界面,点击赛事数据下载,签署协议之后即可获得比赛数据;
    • 待提交结果通道开启之后,提交结果。

    参赛规则

    在您(以下简称“参赛者”)参赛前,请您务必仔细、审慎阅读并充分理解本协议的内容。如果参赛者有任何疑问请通过邮件提问,举办方将尽快解答。

    参赛者一旦选择“同意”,将视为同意并签署了本协议的所有内容。如若参赛者“不同意”,将视为自动放弃参加比赛资格。

    • 组队规则:在关闭报名通道前,单人团队可以加入其它单人或多人团队,一旦加入不可离队;
    • 知识产权:参赛数据版权归主办方希尔贝壳所有。参赛者提交评测数据将对公众开源;
    • 公平竞技: 本赛事为指定唤醒词训练集,如扩充只可使用openslr开源数据和AISHELL2,其他数据禁止使用。推荐参赛者优先使用kaldi开源系统做技术能力,禁止利用规则漏洞或技术漏洞等不良途径提高成绩排名,禁止在比赛中抄袭他人作品、交换答案、使用多个小号,经发现将取消比赛成绩并严肃处理。比赛过程中将持续自动化反作弊,针对系统的封禁可发邮件至challenge@aishelltech.com申诉;
    • 组织声明:组委会保留对比赛规则进行调整修改的权利、比赛作弊行为的判定权利和处置权利、收回或拒绝授予影响组织及公平性的参赛团队奖项的权利。

    评审标准

    基线

    赛事基线系统由昆山杜克大学提供,使用kaldi x-vector标准框架来实现声纹识别系统,仅使用单通道数据开展训练与单条语音来注册模板,没有使用openslr以及aishell任何数据做预训练。

    本赛事基于远场声纹识别前沿性技术相关研究可参考以下论文:

    1:Xiaoyi Qin,Danwei Cai,Ming Li,"Far-Field End-to-End Text Dependent Speaker Verification based on Mixed Training Data with Transfer Learning and Enrollment Data Augmentation", Interspeech 2019.Download

    2:Danwei Cai,Xiaoyi Qin,Ming Li,"Multi Channel Training for End-to-End Speaker Recognition under Reverberant and Noisy Environment",Interspeech 2019. Download

    标准

    评分标准以1、3、5m混合测试集的EER结果做评测。

    奖项

    每个赛道(Track)设置一、二、三等奖各一名。

    权威证书

    赛题获一二三等奖,都可以获得主办单位冠名的纸质证书,团队成员都可获得电子版证书。

    绿色通道

    赛题获一二三等奖,可获得企业内推入职及实习机会绿色通道。

    免费书籍

    赛题获一二三等奖,可免费获得《Kaldi语音识别实践》一本。

    结果提交

    提交内容为参赛者真实结果文件,格式参考:

    example_scores Download

    提交结果通道开放后,请登录平台,于左侧菜单【提交结果】进入提交通道

    注意文件格式统一为UTF-8(无签名),每日最多提交3次

    赛事结果

    10月10日 开放测试集,开启结果提交通道

    10月20日 关闭提交结果通道

    FAQ

    1. 如何提交结果?以及结果文件格式如何?
      请参考结果提交 相关介绍

    2. 结果文件提交总是失败,是否有其他方式提交结果?
      可以,将结果文件发送邮箱至 challenge@aishelltech.com,并说明团队相关信息。

    联系我们

    challenge@aishelltech.com