پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1394
پدیدآورندگان:
اعظم محمد زاده [پدیدآور اصلی]، مرتضی زاهدی[استاد راهنما]
چکیده: امروزه با توجه به حجم گسترده اطلاعات موجود، کمبود زمان بررسی و پردازش مطالب و همچنین عدم وجود یک سیستم خلاصه ساز کارآمد برای خلاصه سازی حجم انبوه اطلاعات، نیاز به یک سامانه قدرتمند جهت خلاصه سازی متون احساس می شود. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. از کابردهای خلاصه سازی می توان به خلاصه سازی اتوماتیک اخبار و ارسال آن ها از طریق پست الکترونیکی یا پیامک اشاره نمود خلاصه-سازی متون به دو صورت چکیده ای و استخراجی قابل انجام است. روش چکیده ای شبیه به روشی است که توسط انسان بکار برده می شود. این مورد به دلیل اینکه نیاز به درک معنی دارد، پیچیده می باشد از اینرو بیشتر روش های ارائه شده برای خلاصه سازی متون، از نوع استخراجی می باشد. در روش استخراجی، جملاتی از متن براساس متدهایی بعنوان چیکیده انتخاب می شوند. یکی دسته از روش های استخراجی پیشنهاد شده برای خلاصه سازی متون، روش های آماری می باشند. در این روش ها، همه اطلاعات از خود متن بیرون کشیده شده و نیاز به هیچ دانش اولیه ای وجود ندارد. هدف از این پایان نامه ارائه یک روش آماری به منظور خلاصه سازی متون فارسی می باشد. این مدل که ترکیبی از یک الگوریتم آماری و یک مدل خوشه بندی است، ابتدا کلمات کلیدی را استخراج کرده سپس به هر یک از آنها وزنی اختصاص داده و سپس جملات را براساس آنها، وزن دهی می کند. سپس با استفاده از یک مدل خوشه-بندی، جملات مشابه را در یک خوشه قرار داده و درنهایت براساس دو معیار وزن جملات و شباهت آنها، بهترین جملات را استخراج می کند. استفاده از شباهت جملات به همراه وزن آنها، باعث می شود جملاتی با اهمیت تری که نیز به یکدیگر وابسته هستند، استخراج گردد. به منظور ارائه نتایج، مجموعه داده که متشکل از مطالب روزنامه های همشهری و مجله نسیم آفتاب بود، تشکیل گردید. همچنین نتایج بدست آمده با استفاده از عامل انسانی ارزیابی شد.
کلید واژه ها (نمایه ها):
#خلاصه سازی #خوشه بندی #مجموعه داده ,وزن دهی
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)