{
    "metadata": {
        "dataset_id": "shahroodut-thesis",
        "record_id": "TK260",
        "title": "تشخیص برون خطی کلمه دست نوشته فارسی با استفاده از مدل مخفی مارکوف",
        "publisher": "دانشگاه صنعتی شاهرود",
        "owner": "کتابخانه مرکزی دانشگاه صنعتی شاهرود",
        "license": "CC-BY-4.0",
        "license_url": "https://creativecommons.org/licenses/by/4.0/",
        "license_text": "استفاده، بازنشر، تحلیل، پردازش و بهره برداری پژوهشی، آموزشی و صنعتی با ذکر منبع دانشگاه صنعتی شاهرود مجاز است.",
        "publication_date": "1392",
        "last_update": "2026-06-27",
        "language": "fa",
        "format": "application/json",
        "contact": "thesis@shahroodut.ac.ir",
        "access": {
            "fulltext_available": "true",
            "public_access": "true"
        }
    },
    "data": {
        "thesis_id": "TK260",
        "title": "تشخیص برون خطی کلمه دست نوشته فارسی با استفاده از مدل مخفی مارکوف",
        "degree": null,
        "faculty": "مهندسی برق",
        "year": 1392,
        "authors": [
            {
                "name": "زهرا ایمانی",
                "role": "پدیدآور اصلی"
            },
            {
                "name": "علیرضا احمدی فرد",
                "role": "استاد راهنما"
            },
            {
                "name": "حسین خسروی",
                "role": "استاد مشاور"
            }
        ],
        "keywords": [
            ": بازشناسی کلمه دست‎نوشته فارسی",
            "پایگاه داده فارسا",
            "هیستوگرام کد‎های زنجیره‎ای",
            "نگاشت خود‎سازمانده",
            "مدل مخفی مارکوف",
            "معیار اطمینان",
            "k نزدیک ترین همسایه"
        ],
        "abstract": "در این پایان نامه سیستمی برای بازشناسی برون خط کلمات دست‎نویس فارسی ارائه شده است. پیچیدگی نگارش فارسی و شکل متفاوت حروف بسته به موقعیت آن که اول کلمه، وسط کلمه، انتهای کلمه یا جدا از بخش های دیگر کلمه باشد بازشناسی کلمات در این زبان را بسیار دشوار نموده است. بطوریکه درصد بازشناسی روش های موجود کمتر از نرخ مطلوب برای تجاری شدن این سیستم‎ها می باشد. یک سیستم بازشناسی کلمه در حالت کلی شامل مراحل پیش‎پردازش، استخراج ویژگی و کلاسه‎بندی است. در این پایان نامه سه روش جهت بازشناسی پیشنهاد شده و کارایی این روش ها در مقایسه با روش های موجود ارزیابی شده است.\r\nبه دلیل نبود یک پایگاه داده مناسب و با تعداد تصویر کافی برای ارزیابی کارایی سیستم پیشنهادی، پایگاه داده  فارسا، شامل  30000 تصویر از 300 کلمه متداول دست نوشته در زبان فارسی،  ایجاد شد. جهت ارزیابی روش های پیشنهادی و مقایسه با روش های موجود 198 کلاس از این پایگاه داده مورد استفاده قرار گرفت.\r\nدر روش اول تصویر کلمه به پنجره‎های عمودی دارای همپوشانی تقسیم می‎شود و از هر پنجره هیستوگرام کد‎های زنجیره‎ای استخراج می‎شود، هر پنجره یک بردار 20 عنصری را تولید می‎نماید. برای آموزش و ارزیابی HMM گسسته بردار ویژگی‎های استخراج شده از پنجره لغزان، با استفاده از شبکه عصبی نگاشت خود‎سازمانده کوانتیزه می‎شود . برای تعداد حالت‎های مخفی مدل HMMدر هر کلاس کلمه ، کمترین تعداد پنجره‎ برای تصاویر آموزش در هر کلاس بدست می‎آید. تعداد حالت‎های مخفی ضریبی از این مقدار کمینه است. با آزمایش ضرایب مختلف، سیستم در مقدار 8/1 به بهترین نرخ بازشناسی می‎رسد. برای پارامتر‎ هموارسازی روی مقادیر مختلف آزمایش شد، سیستم در مقدار 001/0 به جواب بهتری رسید. اندازه کتاب رمز 49 تنظیم می‎شود. در نهایت روش پیشنهادی اول با تعیین ضرایب بیان شده در بالا به نرخ بازشناسی 57/66% در198 کلاس از پایگاه داده فارسا می‎رسد.\r\nدر روش پیشنهادی دوم علاوه بر هیستوگرام کد‎های زنجیره‎ای، از ویژگی میانگین بلوکی برای کلاسه‎بندی استفاده می‎شود و ابعاد بردارهای ویژگی به 25 افزایش می‎یابد. نرخ بازشناسی با استفاده از همان ضرایب تنظیم شده در روش اول، 88/68% بدست می‎آید. که افزایش بیش از 2% را نسبت به روش اول نشان ‎می‎دهد.\r\nروش پیشنهادی سوم در واقع بکارگیری یک سیستم دو خبره‎ای است. با استفاده از بررسی که روی نتایج ارزیابی روش دوم انجام شد یک مفهوم جدید به نام معیار اطمینان برای کلاسه‎بند HMM معرفی میشود. با مشاهده هیستوگرام اختلاف دو بزرگترین احتمال در خروجی HMM برای تصاویر آزمون یک مقدار آستانه به عنوان معیار اطمینان معرفی می‎شود. تصاویری که شرایط معیار اطمینان را دارند با کلاسه‎بند  HMM بازشناسی می‎شوند و تصاویری که این شرایط را ندارند با استفاده از کلاسه‎بند KNN  بازشناسی می‎شوند. برای کلاسه‎بند  KNNاز ویژگی‎های ساختاری ، تعداد مولفه‎های متصل تصویر، تعداد مولفه‎های متصل بالای خط کرسی و تعداد مولفه‎های متصل پایین خط کرسی، استفاده می‎شود. کلاسه‎بند  KNN با استفاده از این ویژگی‎ها و با 11 نزدیک‎ترین همسایه و معیار فاصله بلوک شهری به نرخ بازشناسی 69/61%  دست می‎یابد. در این سیستم  HMM برای تصاویری که معیار اطمینان را دارند به نرخ بازشناسی 85% دست می‎یابد. در کل نرخ بازشناسی این روش برای 198 کلاس از پایگاه داده فارسا 49/76% است. که نسبت به روش اول افزایش  7% را بدنبال دارد.",
        "repository": "کتابخانه مرکزی دانشگاه صنعتی شاهرود",
        "note": "حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.",
        "download_url": "https://shahroodut.ac.ir/fa/thesis/files/somefiles/sf_TK260.pdf"
    },
    "dictionary": {
        "thesis_id": "شناسه پایان نامه",
        "title": "عنوان پایان نامه",
        "degree": "مقطع تحصیلی",
        "faculty": "دانشکده",
        "year": "سال دفاع",
        "authors": "پدیدآورندگان",
        "keywords": "کلیدواژه ها",
        "abstract": "چکیده",
        "repository": "محل نگهداری",
        "note": "یادداشت",
        "download_url": "آدرس فایل پایان نامه"
    }
}