پایان نامه > کتابخانه مرکزی دانشگاه صنعتی شاهرود > مهندسی کامپیوتر > مقطع کارشناسی ارشد > سال 1398
پدیدآورندگان:
حسین حسن نژاد نامقی [پدیدآور اصلی]، هدی مشایخی[استاد راهنما]، مرتضی زاهدی[استاد مشاور]
چکیده: جریان داده به دنبالهای از دادهها گفته میشود که از منابع اطلاعاتی مختلف با سرعت زیاد و حجم بالا تولید میشوند. از مهمترین چالشهای موجود در تحلیل جریان داده وجود تغییر مفهوم در آنها است. تغییر مفهوم به معنای تغییر ویژگیهای آماری دادههاست. در بسیاری از پژوهشهای موجود برای مقابله با چالش نامحدود بودن طول جریان داده و یا چالش تغییر مفهوم، از رویکردهایی با فرض موجود بودن برچسب درست برای همه دادهها استفاده میکنند. در حالی که با توجه به هزینهبر بودن فرآیند برچسبدهی جریان داده، عموما فرض میشود تنها بخشی از دادهها دارای برچسب هستند. همچنین یکی دیگر از چالشهای مهم تحلیل جریان داده تکامل مفهوم است. زمانی که تغییر دادهها موجب پدیدار شدن مفاهیم جدید میگردد، تکامل مفهوم اتفاق میافتد و به صورت ظاهر شدن کلاس جدید نمایان میشود. در این مقاله یک روش یادگیری گروهی نیمهنظارتی ارائه شده که از تغییر آنتروپی برای تشخیص تغییر مفاهیم در ردهبندی جریان داده استفاده میکند. مدل یادگیری گروهی پیشنهادی با تعداد محدودی داده برچسبدار اولیه آموزش میبیند. سپس در صورت مشاهده تغییر مفهوم، از دادههای بدون برچسب برای به روز رسانی مدل ردهبند گروهی استفاده میکند. همچنین در این روش کلاس جدید با شناسایی دادههای دور افتادهای که همبستگی قوی بین خودشان دارند، تشخیص داده میشود. روش پیشنهادی قادر است تغییرات موجود در مجموعه داده را تشخیص داده و با به روز رسانی مدل یادگیری، در بهبود دقت الگوریتم موثر باشد. نتایج آزمایشها نشان میدهد که روش پیشنهادی از نظر تشخیص تغییر، تکامل مفهوم و دقت نسبت به سایر روشها کارایی بیشتری دارد.
کلید واژه ها (نمایه ها):
#جریان داده #یادگیری گروهی #تغییر مفهوم #آنتروپی #تکامل مفهوم #ردهبند نیمهنظارتی دانلود نسخه تمام متن (رایگان)
محل نگهداری: کتابخانه مرکزی دانشگاه صنعتی شاهرودیادداشت: حقوق مادی و معنوی متعلق به دانشگاه صنعتی شاهرود می باشد.
تعداد بازدید کننده: