بازگشت به بانک اطلاعات پایان نامه ها

شماره دانشجویی : 950479321
نام و نام خانوادگي : حمید رضا غیاثوند
عنوان پایان نامه : بهبود سیستم تبدیل گفتار به متن با استفاده از استخراج ویژگی های زبان فارسی مبتنی بر شبکه های عصبی بازگشتی
دانشكده : دانشکده فنی و مهندسی
گروه تحصيلي : برق
رشته/گرایش تحصيلي : مخابرات
مقطع تحصيلي : کارشناسی ارشد
استاد راهنما (عضو هیات علمی مرکز) : حسین رضا صراف زاده ,
استاد مشاور (عضو هیات علمی مرکز) : لیلا قابلی ,
چكيده : يادگيري عميق از زير شاخه هاي يادگيري ماشيني است كه در سالهاي اخير مورد توجه قرار گرفته است و نتايج بسيار خوبي در زمينه هاي مختلف توسط آن بدست آمده است. يكي از اين زمينه ها پردازش زبان هاي طبيعي است. اما در زبان فارسي هنوز كاري به وسيله‌ي اين روش انجام نشده است . امروزه از روش های مختلفی جهت بازشناسی گفتار استفاده می شود، که مهمترین آن ها روش آماری مدل مخفی مارکوف و شبکه عصبی می باشد. یکی از مشکلاتی که هنوز در این حوزه مطرح است، بحث افزایش دقت و کارایی این سیستم-ها می باشد و با توجه به اینکه یکی از راه های افزایش دقت سیستم‌های بازشناسی گفتار، بهبود مدل آوایی می باشد،. در این پایان¬نامه به منظور افزایش دقت تشخیص گفتار زبان فارسی، از شبکه¬ی عصبی LSTM استفاده کردیم. پس از ارائه¬ی شبکه¬ی عصبی بازگشتی (RNN) و حل مشکل حافظه در شبکه¬های عصبی عمیق، از این شبکه عصبی به طور گسترده در تشخیص گفتار انگلیسی استفاده شده است. هدف اصلی استفاده از تکنیک Long Short می باشد. از آن‌جایی‌که سیگنال صوت نمونه‌ای از داده‌های متوالی می‌باشد که در آن‌ها مقدار داده فعلی به داده‌های قبلی وابسته است، شبکه‌های عصبی بازگشتی به دلیل دارا بودن حافظه برای این نوع داده‌ها مناسب می‌باشند. شبکه عصبی حافظه کوتاه‌مدت ماندگار یک شبکه عصبی بازگشتی است که در آن با جایگزین کردن نرون های لایه پنهان با بلوک‌های حافظه، مشکل فراموشی داده‌ها در دنباله‌های طولانی رفع شده است و کارایی بالای خود را در مدل‌سازی داده‌های ترتیبی در کاربردهای مختلف نشان داده است. کلمات کلیدی: شبکه عصبی، یادگیری عمیق، شبکه های عصبی بازگشتی ، تشخیص گفتار به متن
كلمات كليدي : شبکه عصبی، یادگیری عمیق، شبکه های عصبی بازگشتی ، تشخیص گفتار به متن
تاريخ دفاع : 1397-10-18