تسجيل الدخول MIU

نظام التعرف على المتحدث بطريقة تردد ميل ولفائف وكميات المتجهات

نظام التعرف على المتحدث باستخدام طريقة التعبئة بتردد ميل
تكميم المتجه

 

علي مصطفى
قسم الهندسة الكهربائية، جامعة براويجايا
البريد الإلكتروني: a_tofa@yahoo.com

ملخص – التعرف على المتحدث هو عملية تحديد صوت شخص ما. يعتبر التعرف على المتحدث مفيدًا للمصادقة الحيوية والتواصل بين أجهزة الكمبيوتر والبشر. تستخدم تقنية معاملات الطلاقة الترددية (MFCC) لاستخراج الميزات من إشارات الكلام ومقارنتها بمتحدث غير معروف ومتحدثين موجودين في قاعدة البيانات. تُستخدم مصفوفة المرشحات كغلاف للترددات الميلية. تجميع المتجهات (VQ) هي عملية لوضع متجهات الميزات الكبيرة وإنشاء متجهات صغيرة الحجم تتعلق بتوزيعات المركز. تُستخدم خوارزمية K-means للتجميع. في مرحلة التعرف، يُستخدم مقياس التشوه بناءً على تقليل المسافة الإقليدية لمطابقة المتحدث غير المعروف بالمتحدثين الموجودين في قاعدة البيانات. تستخدم قاعدة بيانات الكلام 10 متحدثين مختلفين مع 12 MFCC، و 20 كتاب ترميز، و 16 مركزًا.

كلمات مفتاحية: متحدث، معاملات ميل سبترال الترددية، تكميم المتجه، المتوسطات الذكية

أخبار ذات صلة