研究课题

说话人识别

说话人识别(Speaker Recognition)又称声纹识别(Voiceprint Recognition),是一种根据声音来判别说话人身份的技术。它与人们较为熟悉的指纹识别、虹膜识别一样都属于生物识别技术的范畴,具有使用方便,不会丢失遗忘的特点。尤其在需要远距离身份验证的情况下,说话人识别更具有简便、经济、易于实施的优势。

与语音识别不同,说话人识别是利用的语音信号中说话人的信息,而不考虑语音内容。说话人识别系统主要分为以下两个阶段:

1. 注册阶段。注册的说话人提供必要的语音数据,系统通过分析训练得到该说话人的模板以及一些辅助参数保存在系统中。

2. 验证阶段。未知说话人提供一段语音,系统通过与注册说话人模板的比对做出未知说话人是否就是注册说话人的判断。

东芝说话人识别技术主要针对存储量小、计算能力有限的手持电子设备,如手机、掌上电脑或嵌入其它电子产品,如复印机、收银机。可以实现注册简单(只需重复三遍语音密码)、识别迅捷的说话人识别及验证功能,具有很高的实用性。该项技术已经在中国、日本、美国申请了多项专利,并在国际学术会议和期刊上发表了多篇论文。

返回 >>