تماشای ویدئو مباحث ویژه 2 جلسه 18 پردازش صوت در RNNها از آی-ویدئو

ابتدا با مفهوم صوت و مفهوم spectogram به عنوان ویژگی با معنی برای صوت آشنا شدیم. سپس برای بازشناسی گفتار دو روش بر پایه attention و CTC loss خلاصه بیان شد. در انتهای جلسه trigger word detection به عنوان یک مساله ساده شده صوت را معرفی کردیم و راهکار آموزش آن بیان شد. در ادامه پیاده سازی یک RNN حساس به کلمه ای خاص را پیاده سازی کردیم.
20 آذر 1397
آی-ویدئو