【资料图】

近日,语音与语言处理学术圈顶会IEEE SLT(Spoken Language Technology Workshop,口语技术研讨会)2022年论文录用情况正式公布,150余篇顶级学术成果出炉。由数美科技人工智能研究院李田、孟庆梁、孙宇健等专家联合研究发表的论文“IMPROVED NOISY ITERATIVE PSEUDO-LABELING FOR SEMI-SUPERVISED SPEECH RECOGNITION”(《改良NIPL训练方案在半监督语音识别领域的应用》)顺利通过严格的交叉评审(接收率42.1%)后被国际会议SLT 2022录用。

由于ASR(Automatic Speech Recognition,自动语音识别技术)标注成本较高,实施半监督式训练一直是科研界和工业界的热点问题。在本篇论文中,数美科技人工智能研究院的专家们提出了一种基于假设分布检验的经验评分方法来指导迭代PL训练,从而降低数据实验成本,同时提高ASR效果。

研究提出了一种基于高斯分布置信度的数据质量过滤方案,同时提出了一个切实可行的启发式评分策略来指导标记和未标记数据之间的平衡。研究数据表明,这种策略不仅大大减少了数据实验的数量,而且提高了ASR效果的上限,此外还可以在一定程度上预测PL训练下一次迭代的有效性。

数美科技NLP技术专家、研究项目负责人李田表示,这项研究的最终目的是要解决半监督学习在工业界落地的问题,最大程度地避免无穷无尽的数据实验,达到降低实验成本、增强ASR效果、提升字准确率的目的。

据悉,IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理技术委员会(Speech and Language Processing Technical Committee,SLTC)是国际上语音与语言处理研究的权威学术组织。IEEE Spoken Language Technology Workshop(SLT,口语技术研讨会)是该委员会主导的两年一次的旗舰会议,是语音与语言处理学术圈的顶会,历史悠久,影响广泛。会议通过广泛的论文征集,严格的同行评审,并通过特邀报告、特别议题、论文展示、企业展台等多种形式,呈现最前沿的学术进展和最活跃的学术思想,极大地促进了国际上语音与语言处理技术相关科研人员的交流合作。

谈及此次科研项目的意义,李田和孙宇健说,“数美科技人工智能研究院与业界其他研究院的不同之处在于,我们的研究是与公司业务紧密结合的,此次研究的成果也将助力数美天净产品效果升级,进一步提升ASR准确率。我们享受不断探索认知边界的乐趣,逐步扫清人类的未知领域,是我们在艰难险阻中将研究进行下去的动力,时刻保持对未知领域的探索也是我们永远热衷的事情。”

2023年1月,李田、孙宇健两位专家将代表数美科技人工智能研究院赴卡塔尔多哈参加2022 IEEE口语技术研讨会,与Google,Facebook,Amazon等前沿科技企业分享他们在语音和文本领域内的研究成果,届时该论文也将在此次研讨会上正式亮相。让我们共同期待这场语音与语言处理最前沿的学术进展和最活跃的学术思想盛宴!

科技创新永无止境。作为一家以科技创新为立身之本的人工智能风控公司,数美科技既扎根于国内创新创业土壤,同时也锐意进取,积极追随国际最前沿的技术脚步。此次数美科技人工智能研究院的科研成果能够入选语音与语言处理顶级会议IEEE SLT,正是数美科技迈向国际化的重要一步。未来,数美科技将怀抱“成为一家世界一流的科技公司”愿景,保持对前沿技术永无止境的追求,深化国际科技交流合作,推动人工智能风控技术走向世界。

关于数美科技人工智能研究院: 数美科技人工智能研究院成立于2016年,由数十位在图像、语音、自然语言处理领域深耕多年的研究员、开发者和架构师组成,时刻走在深度学习等人工智能领域最前沿,推动数美数字风控从前沿技术到实用产品的落地创新,针对行业场景和客户需求不断开展高通用性、强定制化的模型策略研发工作。数美科技人工智能研究院独创业界首家娇喘识别技术,掌握上万种广告变体识别技术、账号设备风险分析技术等前沿科技。

推荐内容