جلسه دفاع از پایاننامه: آقای سعید سربازی آزاد، گروه مهندسی کامپیوتر
خلاصه خبر: یک الگوریتم تطبیقی جهت انتخاب خصیصه در دادههای بیان ژن با استفاده از معیارهای پیچیدگی
چکیده: تشخیص بهموقع و صحیح بیماری تأثیر زیادی در میزان کمک به فرد بیمار و جامعه دارد. یکی از انواع مهم داده در تشخیص بیماریهایی همچون سرطان، دادههای میکرو آرایه بیانژن است. مهمترین ویژگی دادههای میکرو آرایه تعداد ابعاد بسیار زیاد و در مقابل تعداد کم نمونهها است. طبق تحقیقات انجامشده بسیاری از خصیصههای موجود در این دادهها کمک شایانی به حل مسئله و تشخیص بیماری نمیکنند. از طرفی در برخی دادهها وجود این ابعاد باعث ابهام و پیچیدگی بیشتر مسئله میشود. بههمینخاطر در دو دهه اخیر پژوهشگران زیادی درصدد کاهش ابعاد این مسائل با روشهای مختلف برآمدهاند. انتخاب خصیصهها یکی از روشهای کاهش ابعاد است که در آن خصیصههای بااهمیت را انتخاب و بقیه را حذف میکنند. پژوهشگران در تحقیقات انجامشده تابهحال توانستهاند تعداد خصیصهها را بهخوبی کاهش دهند، اما در برخی مجموعهدادهها هنوز جای افزایش دقت وجود دارد. تابحال محققانی که از معیارهای پیچیدگی داده برای کاهش ابعاد استفاده کردهاند، از آنجایی که این فراویژگیها همبستگی و وابستگی بین خصیصهها را در نظر نمیگیرند، در برخی موارد دقت بالایی حاصل نشدهاست. از طرف دیگر در مواردی که از الگوریتم ژنتیک استفادهشده، فراویژگیها در نظر گرفته نشدهاند و از این رو، دقت پایین و زمان اجرای بالایی دارند. در این پژوهش، روشی برای انتخاب خصیصهها بر اساس میزان پیچیدگی مجموعهداده ارائه میشود. روش پیشنهادی از یک الگوریتم تکاملی که ایده اولیه آن از الگوریتم کلونی مورچهها گرفته شدهاست، استفاده میکند. دانش اولیه یا پیشپردازش مسئله شامل اعمال فراویژگیها روی مجموعهداده و ایجاد یک بردار رای یا باور بر اساس میزان اهمیت هر خصیصه است. هدف از بکارگیری معیارهای پیچیدگی داده، تبدیل ورودی، به مسئلهای جدید با حداقل میزان ابهام و پیچیدگی است. برای انتخاب خصیصهها الگوریتم ژنتیک بهنحوی پیادهسازی شده که خصیصههایی با اهمیت بیشتر (بر اساس بردار رای) ترجیحا در دنبالهژن انتخابی حضور داشته باشند. پنج مورد از دادههای باینری با نامهای Gli85, Colon, DLBCL, CNS, SMK مورد آزمایش قرار گرفتهاند. نتایج حاصل از اعمال روش نشان میدهد دقت بدستآمده به استثنای داده SMK، بهترین دقت و میزان آن 100 درصد است. قابلذکر است که روش ارزیابی 5-flod cross validation می باشد. 14 بهمن 1397 / تعداد نمایش : 1637
|