اكتشاف النشاط الصوتي
المظهر
خاصية اكتشاف النشاط الصوتى (بالإنجليزية: Voice activity detection)، اختصارًا (VAD)، أو ما يعرف بـ «اكتشاف الحديث» هو تقنية مستخدمة في معالجة الحديث (معالجة الكلام) حيث يتم اكتشاف وجود أو غياب الصوت البشرى.[1] الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) والتعرف على الكلام.
تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات «الصوت عبر بروتكول الإنترنت» (الصوت عبر الإنترنت) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.
هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.[2]
المراجع
[عدل]- ^ Manoj Bhatia؛ Jonathan Davidson؛ Satish Kalidindi؛ Sudipto Mukherjee؛ James Peters (20 أكتوبر 2006). "VoIP: An In-Depth Analysis - Voice Activity Detection". Cisco. مؤرشف من الأصل في 2020-07-20.
- ^ Ravi Ramachandran؛ Richard Mammone (6 ديسمبر 2012). Modern Methods of Speech Processing. Springer Science & Business Media. ص. 102–. ISBN:978-1-4615-2281-2. مؤرشف من الأصل في 2016-11-06.
مصادر
[عدل]- DMA minimum performance standards for discontinuous transmission operation of mobile stations TIA doc. and database IS-727, June 1998.
- M. Y. Appiah, M. Sasikath, R. Makrickaite, M. Gusaite, "Robust Voice Activity Detection and Noise Reduction Mechanism (PDF)", Institute of Electronics Systems, Aalborg University
- X. L. Liu, Y. Liang, Y. H. Lou, H. Li, B. S. Shan, Noise-Robust Voice Activity Detector Based on Hidden Semi-Markov Models, Proc. ICPR'10, 81–84.