بازشناسی مقاوم به نویز و تنوعات گفتار از طریق به اشتراک گذاشتن مؤلفههای مشترک
الموضوعات : مهندسی برق و کامپیوترپروین زارعی اسکی کند 1 , سیدعلی سیدصالحی 2
1 - دانشگاه صنعتی امیرکبیر
2 - دانشگاه صنعتی امیرکبیر
الکلمات المفتاحية: استخراج مؤلفههای اساسی بازشناسی گفتار مقاوم به نویز به اشتراک گذاشتن مؤلفههای مشترک جاذب پیوسته پویا کاهش بعد غیر خطی,
ملخص المقالة :
یکی از روشهای بهبود عملکرد سامانههای بازشناسی در برابر نویز و یا تنوعات ناخواسته، استخراج اطلاعات مشترک بین دادههای مختلف ورودی میباشد. در مورد شبکههایی که ظرفیت بسیار پایینی دارند امکان ذخیرهسازی الگوها بهصورت مفاهیم جداگانه وجود ندارد، لذا کیفیت بازشناسی شدیداً افت پیدا میکند. در این مقاله ساختاری ارائه شده است که بتواند زیرفضای مشترک بین دادههای ورودی را استخراج کرده و آن را در میان گویندگان مختلف به اشتراک بگذارد. ساختار چندتکلیفی شبکه این امکان را فراهم میکند که این زیرفضا بهصورت یک جاذب پیوسته واحد شکل بگیرد که این جاذب نسبت به تنوعاتی مانند تغییرات گوینده در فضای ورودی پویا میباشد. لذا دادههای ورودی آغشته به نویز توسط یک نگاشت غیر خطی به یک مانیفولد در ابعاد پایین فیلتر میشوند که پویایی این مانیفولد مقاومبودن آن را نسبت به تنوعاتی مثل تغییر گوینده تأمین میکند. اتصالات بازگشتی در طی روند تعلیم، یک جاذب پیوسته را در فضای ورودی شکل میدهند که کدهای گوینده به اطلاعات لازم جهت پویاسازی این جاذب تبدیل میشوند. پس از فرایند جذبشدن داده آغشته به نویز، عمل بازشناسی بر روی داده تمیز حاصله اعمال میشود. استخراج و به اشتراک گذاشتن مؤلفههای مشترک در این ساختار توانسته است کارایی جاذبها را در بازشناسی مقاوم آوا تا حدود 5% نسبت به مدل مشابه، بدون پویایی جاذبها، در نسبت سیگنال به نویز dB 0 بهبود بخشد.