بازگشت به بانک اطلاعات پایان نامه ها

شماره دانشجویی : 930569350
نام و نام خانوادگي : علي فتاحي
عنوان پایان نامه : ارائه روشي براي خلاصه سازي متون وب فارسي با استفاده از تحليل متون درون تگ هاي اچ تي ام ال
دانشكده : دانشکده فنی و مهندسی
گروه تحصيلي : مهندسي کامپيوتر
رشته/گرایش تحصيلي : تجارت الکترونيکي
مقطع تحصيلي : کارشناسی ارشد
استاد راهنما (عضو هیات علمی مرکز) : بابک وزیری ,
استاد مشاور (عضو هیات علمی مرکز) : تورج بنی رستم ,
چكيده : در اين پژوهش، روش جديدي براي خلاصه ساز استخراجي متون وب فارسي ارائه‌شده است. روش ارائه شده در اين مقاله بر دوپايه استوار است: 1- استفاده از تگهاي اچ تي ام ال. 2- توليد سؤال.فرض اصلي بر اين است که اگر بتوان سؤالاتي مشابه پرسش‌هايي که در ذهن خواننده شکل مي گيرد به صورت خودکار طرح کرد، آنگاه مي توان با يافتن پاسخ، نکات مهم متن را استخراج نمود. فرآيند طرح سؤال از متون درون تگ هاي اچ تي ام ال آغاز مي شود. به دليل نبود مجموعه داده استاندارد براي خلاصهسازي متون وب فارسي، ابتدا مجموعه دادهاي شامل 200 مقاله از دو وب‌سايت پربازديد فارسي زبان تهيه شد. سپس با استفاده از ابزارهاي برنامهنويسي رايج، روش پيشنهادي پيادهسازي گرديد. تعداد 20 عدد از مقالات موجود در مجموعه داده به‌عنوان ورودي به کد پياده‌سازي داده شد تا خلاصه متن به دست بيايد. همين مقالات به 4 عدد کاربر انساني داده شد تا يک مجموعه خلاصه استاندارد به دست بيايد. سپس با استفاده از معيارهاي پیوستگی ، دقت، بازيابي و فشردگي خلاصههاي توليدشده ارزيابي شدند. از طرفی خلاصه ها به طور جداگانه توسط 300 نفر خبره و به کمک پرسش نامه های طراحی شده طبق طیف لیکرت نیز مورد ارزیابی قرار گرفتند . نتایج نشان داد که از نظر آماری تفاوت معنی داری بین نتایج نمونه های استاندارد و ارزیابی خبرگان وجود ندارد . علاوه بر اين، دو عدد از پژوهشهاي پيشين درزمينه خلاصهسازي متن فارسي به نامهاي ازوم و لکس رنک هم پيادهسازي گرديد و 20 عدد مقاله به دو روش وارد شد تا روش پيشنهادي با روش ازوم و لکس رنک به دو صورت نمونه استاندارد و ارزیابی خبرگان مقايسه شود. طبق نتايج به‌دست‌آمده، اولا تفاوت معنی داری بین نتایج روش نمونه استاندارد و ارزیابی خبرگان در این حالت هم وجود نداشت ثانیا روش پيشنهادي بهبود اندکي نسبت به روش ازوم و لکس رنک داشته است ولی ازنظر کلي تا به دست آمدن نتيجه مطلوب فاصله زيادي وجود دارد. کلمات کليدي: خلاصه ساز، پردازش متن، تگ اچ تي ام ال، توليد سؤال خودکار
كلمات كليدي : خلاصه ساز، پردازش متن، تگ اچ تي ام ال، توليد سؤال خودکار.
تاريخ دفاع : 1397-06-13