پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1398
پدیدآورندگان:
حسین حسن نژاد نامقی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، مرتضی زاهدی[استاد مشاور]
چکیده: جریان داده به دنباله‌ای از داده‌ها گفته می‌شود که از منابع اطلاعاتی مختلف با سرعت زیاد و حجم بالا تولید می‌شوند. از مهم‌ترین چالش‌های موجود در تحلیل جریان‌ داده وجود تغییر مفهوم در آن‌ها است. تغییر مفهوم به معنای تغییر ویژگی‌های آماری داده‌هاست. در بسیاری از پژوهش‌های موجود برای مقابله با چالش نامحدود بودن طول جریان داده و یا چالش تغییر مفهوم، از رویکردهایی با فرض موجود بودن برچسب درست برای همه داده‌ها استفاده می‌کنند. در حالی که با توجه به هزینه‌بر بودن فرآیند برچسب‌دهی جریان داده، عموما فرض می‌شود تنها بخشی از داده‌ها دارای برچسب هستند. همچنین یکی دیگر از چالش‌های مهم تحلیل جریان داده تکامل مفهوم است. زمانی که تغییر داده‌ها موجب پدیدار شدن مفاهیم جدید می‌گردد، تکامل مفهوم اتفاق می‌افتد و به صورت ظاهر شدن کلاس جدید نمایان می‌شود. در این مقاله یک روش یادگیری گروهی نیمه‌نظارتی ارائه شده که از تغییر آنتروپی برای تشخیص تغییر مفاهیم در رده‌بندی جریان داده استفاده می‌کند. مدل یادگیری گروهی پیشنهادی با تعداد محدودی داده برچسب‌دار اولیه آموزش می‌بیند. سپس در صورت مشاهده تغییر مفهوم، از داده‌های بدون برچسب برای به روز رسانی مدل رده‌بند گروهی استفاده می‌کند. همچنین در این روش کلاس جدید با شناسایی داده‌های دور افتاده‌ای که همبستگی قوی بین خودشان دارند، تشخیص داده می‌شود. روش پیشنهادی قادر است تغییرات موجود در مجموعه داده را تشخیص داده و با به روز رسانی مدل یادگیری، در بهبود دقت الگوریتم موثر باشد. نتایج آزمایش‌ها نشان می‌دهد که روش پیشنهادی از نظر تشخیص تغییر، تکامل مفهوم و دقت نسبت به سایر روش‌ها کارایی بیشتری دارد.
کلید واژه ها (نمایه ها):
#جریان داده #یادگیری گروهی #تغییر مفهوم #آنتروپی #تکامل مفهوم #رده‌بند نیمه‌نظارتی

دانلود نسخه تمام متن (رایگان)

محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرود
یادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده:
پایان نامه های مرتبط (بر اساس کلیدواژه ها)