ابتدا با مفهوم صوت و مفهوم spectogram به عنوان ویژگی با معنی برای صوت آشنا شدیم.
سپس برای بازشناسی گفتار دو روش بر پایه attention و CTC loss خلاصه بیان شد.
در انتهای جلسه trigger word detection به عنوان یک مساله ساده شده صوت را معرفی کردیم و راهکار آموزش آن بیان شد. در ادامه پیاده سازی یک RNN حساس به کلمه ای خاص را پیاده سازی کردیم.
آی-ویدئو