پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > علوم ریاضی > مقطع کارشناسی ارشد > سال 1394
پدیدآورندگان:
سعید محمدی [پدیدآور اصلی]، داود شاهسونی[استاد راهنما]، حسین باغیشنی[استاد راهنما]
چکیده: فن‌آوری‌های نوین، داده‌های حجیمی را با بعد بالا تولید می‌کنند که مسئله تحلیل آن‌ها موجب ابداع روش‌های آماری جدید شده است. قبل از اعمال این روش‌ها، معمول است که بعد داده‌های اصلی توسط روش‌هایی نظیر تحلیل مولفه‌های اصلی و تحلیل عاملی، کاهش داده شده و متغیر‌های موثر شناسایی ‌شوند. برای داده‌های با بعد بالا، روش‌هایی نظیر غربال‌گری مستقل مطمئن ‎(SIS)‎ و جنگل‌های تصادفی، متغیرها را با توجه به اهمیت آن‌ها رتبه‌بندی کرده و اثرات مهم را شناسایی می‌کنند. این روش‌ها هزینه محاسباتی بالایی ندارند ‏اما اثرات متقابل را در نظر نمی‌گیرند، در حالی که تجربه محقق ممکن است حاکی از لزوم وجود این اثرات باشد. در این تحقیق، با ارائه رویکرد ضریب همبستگی تعمیم‌یافته (درستنمایی ماکسیمم)، اثرات اصلی و متقابل موثر را با ارائه یک الگوریتم دومرحله‌ای شناسایی می‌کنیم. یکی از مزایای این رهیافت نسبت به روش ‎SIS‎ آن است که مجموعه اثرات منتخب، می‌تواند عملکرد روش‌های رده‌بندی از جمله ‎- k ‎نزدیک‌ترین همسایگی و مرکز - مبنا را بهبود بخشد.‎
کلید واژه ها (نمایه ها):
#غربال‌گری مستقل مطمئن #رده‌بندی #رگرسیون لجستیک #رتبه‌دهی متغیرها #ضریب همبستگی تعمیم‌یافته #اثرات متقابل

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)