پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > علوم ریاضی > مقطع کارشناسی ارشد > سال 1394
پدیدآورندگان:
سعید محمدی [پدیدآور اصلی]، داود شاهسونی[استاد راهنما]، حسین باغیشنی[استاد راهنما]
چکیده: فنآوریهای نوین، دادههای حجیمی را با بعد بالا تولید میکنند که مسئله تحلیل آنها موجب ابداع روشهای آماری جدید شده است. قبل از اعمال این روشها، معمول است که بعد دادههای اصلی توسط روشهایی نظیر تحلیل مولفههای اصلی و تحلیل عاملی، کاهش داده شده و متغیرهای موثر شناسایی شوند.
برای دادههای با بعد بالا، روشهایی نظیر غربالگری مستقل مطمئن (SIS) و جنگلهای تصادفی، متغیرها را با توجه به اهمیت آنها رتبهبندی کرده و اثرات مهم را شناسایی میکنند. این روشها هزینه محاسباتی بالایی ندارند اما اثرات متقابل را در نظر نمیگیرند، در حالی که تجربه محقق ممکن است حاکی از لزوم وجود این اثرات باشد. در این تحقیق، با ارائه رویکرد ضریب همبستگی تعمیمیافته (درستنمایی ماکسیمم)، اثرات اصلی و متقابل موثر را با ارائه یک الگوریتم دومرحلهای شناسایی میکنیم. یکی از مزایای این رهیافت نسبت به روش SIS آن است که مجموعه اثرات منتخب، میتواند عملکرد روشهای ردهبندی از جمله - k نزدیکترین همسایگی و مرکز - مبنا را بهبود بخشد.
کلید واژه ها (نمایه ها):
#غربالگری مستقل مطمئن #ردهبندی #رگرسیون لجستیک #رتبهدهی متغیرها #ضریب همبستگی تعمیمیافته #اثرات متقابل دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: