Maximum likelihood polynomial regression for robust speech recognition

(整期优先)网络出版时间:2011-03-13
/ 1
线性假设是最大的可能性的主要劣势线性re-gressionMLLR。这份报纸使用多项式回归方法为改编建模并且为柔韧的语音识别用最大的可能性的多项式回归MLPR建立一个非线性的模型改编算法。在这个算法,在在每条Mel隧道训练并且测试Gaussian工具之间的非线性的关系被一套多项式接近,多项式系数用期望在测试envi-ronment从改编数据被估计--最大化他们算法和最大的可能性的ML标准。试验性的结果证明秒顺序多项式能接近实际非线性的函数更好并且在噪音赔偿和扬声器改编,MLPR的词错误率是比MLLR的那些显著地低的。建议MLPR算法克服好的线性假设和罐头减少的限制噪音,说话者和另外的因素的影响同时。它对说话者和噪音的联合改编特别合适。