نظام التعرف على المتحدث باستخدام طريقة التعبئة بتردد ميل
تكميم المتجه
علي مصطفى
قسم الهندسة الكهربائية، جامعة براويجايا
البريد الإلكتروني: a_tofa@yahoo.com
ملخص – التعرف على المتحدث هو عملية تحديد صوت شخص ما. يعتبر التعرف على المتحدث مفيدًا للمصادقة الحيوية والتواصل بين أجهزة الكمبيوتر والبشر. تستخدم تقنية معاملات الطلاقة الترددية (MFCC) لاستخراج الميزات من إشارات الكلام ومقارنتها بمتحدث غير معروف ومتحدثين موجودين في قاعدة البيانات. تُستخدم مصفوفة المرشحات كغلاف للترددات الميلية. تجميع المتجهات (VQ) هي عملية لوضع متجهات الميزات الكبيرة وإنشاء متجهات صغيرة الحجم تتعلق بتوزيعات المركز. تُستخدم خوارزمية K-means للتجميع. في مرحلة التعرف، يُستخدم مقياس التشوه بناءً على تقليل المسافة الإقليدية لمطابقة المتحدث غير المعروف بالمتحدثين الموجودين في قاعدة البيانات. تستخدم قاعدة بيانات الكلام 10 متحدثين مختلفين مع 12 MFCC، و 20 كتاب ترميز، و 16 مركزًا.
كلمات مفتاحية: متحدث، معاملات ميل سبترال الترددية، تكميم المتجه، المتوسطات الذكية

