גלאי של פעילות דיבור – מימוש בזמן אמת

שנה
2005
מבצעי הפרוייקט
הדס בלומנפלד

פרויקט מצטיין 

גלאי של פעילות דיבור הינו אבן בניין חיונית במרבית האלגוריתמים לעיבוד דיבור. יחידת הקצה של  מערכות לניקוי רעשים, זיהוי דיבור או דחיסת דיבור תכיל בד"כ גלאי כזה. בעשרות השנים האחרונות פותחו אלגוריתמים רבים המבוססים על תכונות האופייניות לאות הדיבור. דיבור בקטעיו הקוליים מתאפיין במחזוריות הנובעת מהעירור של חלל הפה ע"י מיתרי הקול. לכן, אלגוריתמים רבים מסתמכים על גילוי מחזוריות. בין השיטות ניתן למנות משערכי קורלציה בגרסאות שונות, קפסטרום (לוגריתם של התמרת פורייה), היסטוגרמה של הרמוניות ועוד. אלגוריתמים רבים משלבים גם סינון, הלבנה ועיבוד לא-לינארי.   מטרת הפרויקט היא מימוש בזמן-אמת של אלגוריתם לגילוי פעילות דיבור.  

הפרויקט הוצג בכנס  EDERS2006. 

Real-Time Implementation of an Energy-Based
by Hadas Blumenfeld

 Voice activity detector (VAD) is an essential component in most voice processing algorithms. These algorithms are used to reduce the transmission rate, exploiting the speech silence periods. A VAD has numerous speech processing applications, e.g. voice over IP (VoIP) gateways, speech enhancers, speech compression algorithms,digital answering machines (DAM), unified messaging systems (UMS), automatic level control (ALC) units, and many more.This paper presents a real-time implementation of an energy-based voice activity detector. The very low computational complexity of the proposed algorithm is its major merit, making the real-time implementation feasible. However, this simplicity restricts the allowable signal-to-noise ratios to the higher end.The main goal of the student project, which is summarized in this contribution, was to make the student acquainted with speech processing and the involved real-time DSP implementation issues. For the sake of this purpose we were willing to comprise on the obtainable performance.

 The project was presented in EDERS 2006

מנחה חיצוני
חזי רחמים

תאריך עדכון אחרון : 04/12/2022