پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

word 2 MB 30894 102
1391 کارشناسی ارشد مهندسی صنایع
قیمت قبل:۶۵,۰۰۰ تومان
قیمت با تخفیف: ۲۴,۸۵۰ تومان
دانلود فایل
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • پایان نامه کارشناسی ارشد در رشته مهندسی اتوماسیون و ابزار دقیق 

    چکیده

    ارائه روشی جدید در خوشه­بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c-means

    خوشه­بندی قرار دادن داده­ها در گروه­هایی است که اعضای هر گروه از زاویه خاصی به هم شباهت دارند .  شباهت بین داده­های درون هر خوشه حداکثر و شباهت بین داده­­های درون خوشه­های متفاوت حداقل می­باشد.

    Fuzzy c-means نیز یک تکنیک خوشه­بندی فازی است که علی­رغم حساس بودن به مقدار دهی اولیه و همگرائی به نقاط بهینه محلی ، به دلیل کارآمد بودن و پیاده سازی آسان، یکی از متداول­ترین روش­ها می­باشد. در این رساله جهت رفع مشکلات موجود از روش ترکیبی مبتنی بر الگوریتم خفاش و Fuzzy c-means بهره گرفته ­خواهد ­شد. به منظور اعتبارسنجی، روش پیشنهادی بر روی چندین داده متفاوت مشهور پیاده­سازی می­گردد و نتایج با روش­های الگوریتم­ جستجوی ممنوع، مورچگان، اجتماع ذرات، آبکاری فولاد و k-means مقایسه خواهد­گردید. توانایی بالا و مقاوم بودن این روش بر اساس نتایج مشهود خواهد بود. 

    مقدمه

    داده و الگو یکی از شاخص­های بسیار مهم در دنیای اطلاعات هستند و خوشه­بندی یکی از بهترین روش­هایی است که برای کار با داده­ها ارائه شده است. قابلیت آن در ورود به فضای داده و تشخیص ساختار آن­ها باعث گردیده که خوشه بندی یکی از ایده­آل­ترین مکانیزم­ها برای کار با دنیای عظیم داده­ها باشد.

    در خوشه­بندی، نمونه­ها به دسته­هایی تقسیم می­شوند که از قبل معلوم نیستند. بنابراین، خوشه­بندی یک روش یادگیری است که بدون دانش پیشین و مشاهده نمونه­های از قبل تعریف شده­، داده­ها را به صورت خود مختار و مستقل دسته بندی می­کند.

    خوشه بندی در واقع یافتن ساختار در مجموعه داده­هایی است که طبقه بندی نشده­اند. به بیان دیگر خوشه­بندی قرار­دادن داده­ها در گرو­ه­هایی است که اعضای هر گروه از زاویه­ی خاصی به هم شباهت دارند. در نتیجه شباهت بین داده­های درون هر خوشه حداکثر و شباهت بین داده­های درون خوشه­های متفاوت حداقل می­باشد. معیار شباهت در اینجا، فاصله بوده یعنی نمونه­هایی که به یکدیگر نزدیک­ترهستند، در یک خوشه قرار می­گیرند. لذا محاسبه­ی فاصله­ی بین دو داده در خوشه­بندی بسیار مهم می­باشد؛ زیرا کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد.

    فاصله که همان معرف عدم تجانس است حرکت در فضای داده­ها را میسر می­سازد و سبب ایجاد خوشه­ها می­گردد. با محاسبه­ی فاصله­ی بین دو داده، می­توان فهمید که چقدر این دو داده به هم نزدیک هستند و در یک خوشه قرار می گیرند یا نه؟ توابع ریاضی مختلفی برای محاسبه­ی فاصله وجود دارند؛ فاصله اقلیدسی، فاصله همینگ و ....

     

    1-1-بیان مسأله

    خوشه­بندی یافتن ساختار، درون مجموعه­ای از داده­های بدون برچسب است و می­توان آن را  به عنوان مهم­ترین مسأله در یادگیری بدون نظارت در نظر گرفت. ایده­ی خوشه­بندی اولین بار در دهه­ی 1935 مطرح شد و امروزه با پیشرفت­ها و جهش­های عظیمی که در آن به­وجود آمده در کاربردها و جنبه­های مختلفی حضور یافته است. یک جستجوی ساده در وب یا حتی در پایگاه داده یک کتابخانه، کاربرد شگفت انگیز آن را برای ما آشکار می­سازد.  الگوریتم­های خوشه­بندی در زمینه­های مختلفی کاربرد دارد که به عنوان نمونه می­توان موارد زیر را برشمرد:

    داده کاوی[1]: کشف اطلاعات و ساختار جدید از داده‌های موجود

    تشخیص گفتار[2]: در ساخت کتاب کد از بردارهای ویژگی، در تقسیم کردن گفتار بر حسب گویندگان آن یا فشرده‌سازی گفتار

    تقسیم‌بندی تصاویر[3]: تقسیم‌بندی تصاویر پزشکی یا ماهواره‌ای

    وب (WWW): دسته‌بندی اسناد و یا دسته‌بندی سایت­ها و ...

    زیست‌‌‌شناسی[4]: دسته‌بندی حیوانات و گیاهان از روی ویژگی‌های آن­ها

    برنامه ریزی شهری[5]: دسته‌بندی خانه‌ها بر اساس نوع و موقعیت جغرافیایی آن­ها

     مطالعات زلزله‌نگاری[6]: تشخیص مناطق حادثه‌خیز بر اساس مشاهدات قبلی

    کتابداری: دسته‌بندی کتاب­ها

    بیمه: تشخیص افراد متقلب

    بازاریابی[7]: دسته‌‌بندی مشتریان به دسته‌هایی بر حسب نیاز آن­ها از طریق مجموعه آخرین خرید‌های آنان.

    با توجه به کاربرد روزافزون خوشه­بندی، امروزه شاهد ارائه­ی روش­های جدید و کارآمدتری هستیم که هر یک برای کاربردی خاص ارائه می­شود. ولی با همه این تلاش­ها هنوز خوشه­بندی در بسیاری از علوم آن­چنان که باید مورد استفاده قرار نگرفته است و قابلیت گسترش بسیار زیادی برای آن وجود دارد.

    1-2-پیشینه تحقیق

    ما در جها­نی پر از داده زندگی می­کنیم و هر روز با حجم وسیعی از ذخیره یا نمایش اطلاعات روبه­رو هستیم. یکی از روش­های حیاتی کنترل و مدیریت این داده­ها، خوشه­بندی می­باشد. در این روش داده­هایی که دارای خواص مشابه می­باشند، درون یک دسته یا یک خوشه قرار می­گیرند. اولین بار ایده­ی خوشه­بندی در دهه­ی 1935 ارائه شد و امروزه با پیشرفت­ها و جهش­های عظیمی که در آن پدید آمده مورد توجه بسیاری از محققان قرار گرفته است. لذا در کاربردها و جنبه­های مختلفی حضور یافته و روش­های مختلفی برای بهره­برداری از آن مطرح گردیده است [1]. از یک نظر، الگوریتم­های خوشه بندی می تواند در دو دسته کلی تقسیم­بندی شوند: خوشه بندی سخت و خوشه بندی فازی. در خوشه­بندی سخت یک داده به یک و فقط یک خوشه تعلق می­گیرد، درحالی­که در خوشه­بندی فازی یک داده ممکن است بطور هم­زمان به دو خوشه یا بیشتر تعلق داشته باشد [2]، [3]، [4]. الگوریتم Fuzzy c-means یکی از روش­های معروف خوشه­بندی فازی محسوب می­گردد که به سادگی قابل پیاده­سازی می­باشد. متأسفانه نسخه­ی اصل آن دارای محدودیت­هایی از جمله وابستگی به مقادیر اولیه و همگرایی به پاسخ بهینه محلی می­باشد [5]، [6]. در الگوریتم ژنتیک این محدودیت­ها از بین رفته است. در عین حال با ترکیب این دو الگوریتم نتایج قابل توجهی حاصل شده است که سرعت همگرایی آن نیز به مراتب از نمونه­های قبل بیشتر گردیده است [7]. Kao و همکارانش با ترکیب دو الگوریتم ژنتیک و PSO روشی را ابداع نمود که در آن از عملگر جهش و تقاطع برای ژنتیک بهره گرفته است. این روش توانست مشکلات مختلف توابع پیوسته را رفع نماید. هم­چنین در یافتن جواب بهینه­ی سراسری و نسبت همگرایی تغییرات چشمگیری حاصل شده است [8]. با استفاده از ترکیب الگوریتم ژنتیک و روش فازی، روشی توسط عسگریان در سال 1386 مطرح شد. در این روش مشکل وابستگی به تعداد اولیه خوشه­ها ­و مکان اولیه مراکز آن­ها مرتفع و با عدم توانایی خوشه­بندی داده­هایی که فاصله­ی آنها از مراکز چند خوشه به یک اندازه می­باشد؛ مقابله گردید. از مزایای دیگر این ترکیب کاهش پیچیدگی محاسبات می­باشد [9]. یکی دیگر از روش­های ترکیبی که در مسائل داده­کاوی کاربرد دارد استفاده از ترکیب Fuzzy c-means و PSO می­باشد که توانست مشکل همگرایی به بهینه­ی محلی و سرعت همگرایی را بهبود بخشد [10] ،[11]. از دیگر روش­های ترکیبی جدید ترکیب الگوریتمFCM  و الگوریتم مِمتیک فازی است. در راستای بهبود عملکرد خوشه­بندی، نتایج حاصل از این تکنیک نشان می­دهد که جواب­های بهتری داشته و پایداری آن نیز بالاتر می­باشد [12]. ترکیب FCM و SA نمونه­ای دیگر از روش­های ترکیبی است که در تشخیص سرطان  استفاده می­شود [13]،[14]،[15]،[16]. در راستای تلاش­های ذکر شده، در این پایان­نامه سعی بر آن است تا با استفاده از ترکیب الگوریتمFCM  و الگوریتم خفاش از مزایای دو الگوریتم در حل مسائل خوشه­بندی بهره گرفته شود.

    1-3-هدف تحقیق

    هدف در این تحقیق این است که با بررسی الگوریتم­های موجود در زمینه خوشه­بندی، الگوریتمی ارائه گردد که تا حد قابل قبولی بتواند محدودیت­های موجود را پوشش دهد. برخی از محدودیت­های موجود را می­توان به شرح ذیل برشمرد:

    × کارایی برای پایگاه داده­ها با حجم بالا

    × کشف خوشه­ها با اشکال مختلف

    × عدم حساسیت به ترتیب داده­های ورودی

    × قابلیت تفسیر و استفاده

    1-4-اهمیت تحقیق

    همزمان با افزایش سیستم­های پایگاه داده و ابزار­های متعدد برای ذخیره­ی حجم بالای داده­ها نیاز به روش­های خودکار برای کشف دانش از درون داده­ها کاملاً احساس می­شد. علاوه بر آن به دلیل هزینه­ی بالای نیروی انسانی و مادی جهت انجام عملیات روی حجم انبوه داده­ها ارائه روشهایی با کمترین دخالت کاربر ضروری بود. استخراج اطلاعات مناسب از میان انبوه داده‏ها و تبدیل آنها به دانش مورد نیاز سازمان­ها - به­ویژه در تصمیم‌گیری‏های سازمانی - نیازمند استفاده از روش‏های نوین در این حوزه بود. داده­کاوی[8] یکی از این ابزارهاست که به کشف دانش از پایگاه داده­ها کمک می‏کند. می­توان گفت داده­کاوی استخراج اطلاعات معتبر، قابل فهم و قابل اعتماد از پایگاه داده­های بسیار بزرگ است که به کشف الگوهای پنهان و روابط مطمئن بین داده­ها و استفاده از آن در تصمیم­گیری کمک می­نماید. در حقیقت شناخت و دست­و­پنجه نرم کردن با داده­ها یکی از اهداف مهم در داده­کاوی است.

     این فرآیند از اواخر دهه 90 مطرح شد و از سال 1995 به صورت جدی وارد مباحث آماری گشت و در حال حاضر جزء مهم­ترین ابزار بهره­برداری مؤثر از انبوه داده­ها می­باشد و اهمیت وجود آن هر روز افزایش می­یابد. به عبارت دیگر داده­کاوی­­، علمی نسبتاً جدید است که از انجام تحقیقات در رشته­های آمار، یادگیری ماشین و علوم کامپیوتر مخصوصاً مدیریت پایگاه داده­ها شکل گرفته است.

    داده کاوی در سه حوزه مستقل از علوم مورد استفاده قرار می­گیرد:

    × آمار کلاسیک و الگوهای آماری

    × هوش مصنوعی

    × یادگیری خودکار و شبکه های عصبی

    برای انجام داده­کاوی از ابزار مختلف نظیر تفکیک کردن، دسته­بندی، درخت تصمیم­گیری، تحلیل قواعد وابستگی، تحلیل خوشه­ها و الگوریتم­های عمومی استفاده می­شود. در ادامه چند نمونه از کاربردهای این فرایند ذکر می­گردد که در صورت عدم حضور داده­کاوی، دستیابی به اهداف غیر ممکن می­گردید.

    ×× با استفاده از داده کاوی می­توان کاربرد نمودارهای کنترلی را بهبود بخشید. فرض کنید 4 پارامتر در یک مشخصه­ی کیفیِ مرتبط با یک قطعه­ی تولید شده در یک کارخانه، تأثیر­­گذار باشند و هدف، بهبود کیفیت آن مشخصه باشد. با استفاده از اطلاعات موجود که از حجم بالایی برخوردار می باشد، در صورتی­که کیفیت مشخصه­ی مذکور از محدوده قابل قبول خارج گردد طبق اصول مرتبط با کنترل کیفیت آماری، لازم است علل مربوط به انحرافات که باعث خروج مشخصه­ی کیفی از محدوده­ی کنترلی شده است را شناسایی نموده، و پس از رفع آن، وضعیت دوباره بررسی گردد. عملاً زمان بسیار زیادی در این راه صرف خواهد شد. تکنیک داده­کاوی می­تواند با بررسی اطلاعات موجود در مورد 4 پارامتر مذکور به جای استفاده از روش­های قبلی، با رسم نمودار میله­ای پارامتری که بیشترین انحراف را نسبت به میانگین خود دارد مورد بررسی قرار داده و با کنترل آن عملاً دامنه­ را محدود نماید.

    کاربرد اصلی داده­کاوی آن است که به جای بررسی حجم بالایی از پارامترهای تأثیر گذار، با خوشه بندی اطلاعات بر اساس اهمیت آن­ها و تأثیر­گذاری آن­ها بر پارامتر کیفیِ موردنظر، بتوان دامنه­ی عمل را محدود نموده و در کمترین زمان و با حداقل هزینه به هدف رسید.

    ×× در موارد پزشکی ارائه­ی روش­های جدید جهت پیش­بینی ابتلای شخص به بیماری­های واگیردار خطرناک با استفاده از اطلاعات اولیه­ی موجود بسیار ضروری می­باشد. پزشکان جهت تشخیص دقیق و مطمئن ابتلای یک شخص به بیماری سل به مدت زمان طولانی احتیاج دارند. اما در این مدت ممکن است شخص مبتلا بیماری ر ا به 10 تا 15 نفر منتقل نماید. بنابراین با به­کارگیری روش­های داده­کاوی می­توان بر اساس اطلاعات به دست آمده از آزمایشات، در ساعات اولیه­ی مراجعه بیمار احتمال ابتلای وی را تشخیص دهیم. هم­چنین، از این تکنیک­ها، در به­دست آوردن روابط مفید جهت جلوگیری از مرگ و میر افراد مبتلا به بیماری­های قلب و عروق، می­توان بهره گرفت [17].

    ×× در مسائل اقتصادی نیز کاربردهای داده­کاوی به وضوح قابل رؤیت می­باشد. با توجه به روند تغییرات در صنعت بانکداری، (رواج بانکداری الکترونیکی) حجم اطلاعات در حال رشد است. با بهره­گیری از این اطلاعات، می­توان عملکردهایی را اتخاذ نمود که در این راستا رضایت­مندی دوجانبه از طرف مشتری و بانک به­دست آید. مواردی مانند بازاریابی، حفظ مشتری، تشخیص تقلب، مدیریت ریسک و ... را می­توان برشمرد. به طور نمونه، با توجه به اطلاعات موجود و استفاده از تکنیک­های خوشه­بندی می­توان مشتریان خوش­حساب­تر و سودآورتر را برگزید و با اعطای تسهیلات، آن­ها را مورد تشویق  قرار داد. هم­چنین مدیران بانک می­توانند احتمال این را که کدام مشتری دارای ریسک بیشتر برای عدم پرداخت وام و بدهی می­باشد تشخیص دهند  [18].

    داده­کاوی الگوهای حاوی اطلاعات را در داده­های موجود جستجو می­کند. این الگوها و الگوریتم­ها می­توانند توصیفی[9] باشند؛ یعنی داده­ها را توصیف کنند یا جنبه­ی پیش­بینی[10] داشته باشند. داده­کاوی توصیفی به دنبال یافتن اگرها در فعالیت­ها و اقدامات گذشته است و داده­کاوی پیش بینانه با نگاه به سابقه، رفتار آینده را پیش بینی می­کند.                                                                                                                                                                   

    خوشه­بندی داده­ها یکی از تکنیک­های داده­کاوی است که در گروه اول (توصیف کننده) قرار می­گیرد و برای استخراج مدل از داده­ها به­کار گرفته می­شود. الگوریتم Fuzzy c-means   یکی از روش­های خوشه­بندی اطلاعات می­باشد که از آن می­توان بهره گرفت. با توجه به اهمیت داده­کاوی در دنیای امروز، ارائه­ی روش­های جدید که به­وسیله­ی آن داده­ها مورد استفاده مفید قرار گیرد ضروری است. دراین تحقیق با ترکیب الگوریتم Fuzzy c-means و الگوریتم خفاش به این مهم دست خواهیم یافت.

    1-5-گفتارهای پایان نامه

    این پایان نامه بصورت زیر تنظیم شده است.

    در فصل دوم، روش­های موجود جهت خوشه­بندی معرفی خواهد گردید. محاسن و معایب آن بررسی می­گردد و در نهایت الگوریتم که در این رساله از آن بهره خواهیم گرفت شرح داده خواهد شد.

    در فصل سوم، با تکنیک­های بهینه­سازی آشنا شده و کلیه­ی روش­های تکاملی که در این رساله مورد مقایسه قرار گرفته­اند به طور اجمالی تشریح می­گردد. در نهایت الگوریتم رقابت خفاش که اساس این پایان­نامه می­باشد به تفصیل توضیح داده خواهد شد.

    در فصل چهارم، الگوریتم پیشنهادی که مبتنی بر ترکیب الگوریتم Fuzzy c-means و خفاش می­باشد، توصیف می­گردد.

    در فصل پنجم، نتیجه­گیری و پیشنهادات برای کارهای آینده آورده خواهد شد.

     

     

    [1]- Data mining

    [2]- Speech Recognition

    [3]- Image Segmentation

    [4] -Biology

    [5] -City-Planning

    [6] -Earthquake studies

    [7] -Marketing

    [8]- Data mining

     Descriptive -[9]

    Predictive  -[10]

    ABSTRACT

     

    A new hybrid algorithm for data clustering based on Bat Algorithm and Fuzzy c-means

     

    BY

     

     

    Clustering is a division of data into groups of similar objects. Each cluster consist of objects that  are similar between themselves and dissimilar to objects of other groups. Fuzzy c-means (FCM) algorithm is one of the most popular fuzzy clustering techniques because it is efficient, straightforward and easy to implement. However, FCM is sensitive to initialization and is easily trapped in local optima.

     In this thesis, a hybrid fuzzy clustering method based on FCM and Bat algorithm is proposed which make use of the merits of both algorithms.

    The new hybrid algorithm is tested on several data sets and its performance is compared with those of ACO, PSO, SA, TS, K-means. Experimental results show that our proposed method is efficient and can reveal encouraging results.

  • فهرست:

    عنوان                                                                                                                   صفحه

     

    1- فصل اول: مقدمه ....................................................................................................................................... 2

      1-1- بیان مسأله .......................................................................................................................................... 3

      1-2- پیشینه تحقیق ..................................................................................................................................... 4

      1-3- هدف تحقیق ........................................................................................................................................5

      1-4- اهمیت تحقیق .......................................................................................................................................5

      1-5- گفتارهای پایان نامه ..............................................................................................................................8

    2- فصل دوم: خوشه بندی بر مبنای الگوریتم Fuzzy c-means ...............................................................10

      2-1- مقدمه .................................................................................................................................................11

      2-2- خوشه بندی اطلاعات ........................................................................................................................11

        2-2-1- تفاوت خوشه­بندی و طبفه­بندی ..................................................................................................13

        2-2-2-کاربردهای خوشه­بندی............................................................................................................... 13   

        2-2-3- انواع خوشه­ها..............................................................................................................................15

        2-2-4- مراحل خوشه بندی ....................................................................................................................15

        2-2-5- انواع روش های خوشه بندی .................................................................................................. 18

        2-2-6- خوشه بندی سلسله مراتبی ...................................................................................................... 18

          2-2-6-1- خوشه بندی سلسله مراتبی تقسیم شونده ............................................................................19

          2-2-6-2- خوشه بندی سلسله مراتبی متراکم شونده ......................................................................... 19

     

     

    عنوان                                                                                                                   صفحه

     

        2-2-7- خوشه بندی افراز­بندی یا پارتیشنی .............................................................................................22

          2-2-7-1- الگوریتم k-means ...........................................................................................................23

        2-2-8- خوشه بندی همپوشانی................................................................................................................26

          2-2-8-1- خوشه بندی فازی.................................................................................................................27

    3- فصل سوم: بهینه سازی بر مبنای الگوریتم خفاش .................................................................................. 33

      3-1- مقدمه .............................................................................................................................................. 34

      3-2- شرح مسئله بهینه سازی .................................................................................................................. 35

      3-3- روش های حل مسائل بهینه سازی ................................................................................................. 39

        3-3-1- الگوریتم بهینه­سازی توده ذرات .............................................................................................  43

        3-3-2- الگوریتم جفت گیری زنبور عسل ........................................................................................... 45

        3-3-3- الگوریتم مورچگان .................................................................................................................. 46

        3-3-4- الگوریتم الگوی جستجوی ممنوع ........................................................................................... 48

        3-3-5-الگوریتم آبکاری فولاد .............................................................................................................. 49

        3-3-6- الگوریتم خفاش ....................................................................................................................... 51

        3-3-7-راه­حلهای پیشنهادی برای بهبود عملکرد الگوریتم خفاش ......................................................... 54

         3-3-7-1-انتخاب جمعیت اولیه بر اساس قاعده نولید عدد متضاد ...................................................... 54

         3-3-7-2-استراتژی جهش خود تطبیق ................................................................................................ 55

      3-4- معیارهای مقایسه الگوریتمهای بهینه­سازی ...................................................................................... 58

          3-4-1- کارایی.................................................................................................................................... 58

          3-4-2- انحراف استاندارد................................................................................................................... 58

          3-4-3- قابلیت اعتماد.......................................................................................................................... 59

          3-4-4- سرعت همگرایی.................................................................................................................... 59

       

     

     

         عنوان                                                                                                             صفحه

         

      3-5-تعریف مسایل عددی گوناگون.......................................................................................................... 60

        3-5-1-تابع Rosenbrock.................................................................................................................. 61

        3-5-2- تابع Schewefel  ....................................................................................................................62

        3-5-3- تابع Rastragin  ......................................................................................................................63

        3-5-4- تابعAchley .............................................................................................................................64

        3-5-5- تابع Greiwank .......................................................................................................................65

    4- فصل چهارم: الگوریتم پیشنهادی ..............................................................................................................66

      4-1- مقدمه .............................................................................................................................................. 67

      4-2- خوشه بندی اطلاعات به روش ترکیبی پیشنهادی ........................................................................... 68

      4-3- تنظیم پارامترهای الگوریتم پیشنهادی .............................................................................................. 71

      4-4- بررسی نتایج حاصل از الگوریتم پیشنهادی و مقایسه آن با دیگر الگوریتم ها.................................. 71

        4-4-1- معرفی داده های استفاده شده و نتایج شبیه سازی مربوط به آن  ..................................................72     

          4-4-1-1- مجموعه داده Iris ............................................................................................................ 72

          4-4-1-2- مجموعه داده Wine ........................................................................................................ 75

          4-4-1-3- مجموعه داده CMC ....................................................................................................... 77

          4-4-1-4- مجموعه داده Vowel ..................................................................................................... 80

    5- فصل پنجم: نتیجه گیری و پیشنهادات ......................................................................................................82

      5-1- نتیجه ............................................................................................................................................... 83

      5-2- پیشنهاد کارهای آینده ...................................................................................................................... 84

     

     

     

     

    فهرست جدول­ها

     

     

    عنوان و شماره                                                                           صفحه    

     

    جدول2‑1 مزایا و معایب الگوریتم k-means ...............................................................................................................26

    جدول2‑2 معایب و محاسن الگوریتم c میانگین فازی ................................................................................................ 31

    جدول2‑3 معیارهای تشابه بر اساس توابع فاصله مختلف..............................................................................................32

     جدول3-1  توابع عددی مورد استفاده برای تست الگوریتم‌ها ....................................................................................60

    جدول4‑1 پارامترهای مربوط به الگوریتم های پیشنهادی ...........................................................................................71  جدول4‑2مراکز خوشه به دست آمده با اجرای الگوریتم FCM-BA روی مجموعه دادهIris  ......................73

    جدول4‑3پاسخ الگوریتم های موجود بر روی مجموعه دادهIris ...............................................................................74

    جدول4‑4 پاسخ الگوریتم FCM-BA بازاء مقادیر مختلف پارامترها بر روی مجموعه داده Iris ................... 74

    جدول4‑5 پاسخ الگوریتم های موجود بر روی مجموعه داده Wine........................................................................75 

     جدول4‑6 مراکز خوشه به دست آمده بااجرای الگوریتم FCM-BA روی مجموعه داده Wine....................76

    جدول4‑7پاسخ الگوریتمFCM-BA   بازاء مقادیر مختلف پارامترها برروی مجموعه دادهWine ................. 77

    جدول 4‑8 مراکز خوشه به دست آمده با اجرای الگوریتم پیشنهادی روی مجموعه داده CMC ................... 78

    جدول 4‑9پاسخ الگوریتم های موجود بر روی مجموعه داده CMC .......................................................................79

    جدول4‑10پاسخ الگوریتم   FCM-BAبازاء مقادیر مختلف پارامترها بر روی مجموعه داده CMC ............79

    جدول 4‑11 مراکز خوشه به دست آمده با اجرای الگوریتم پیشنهادی روی مجموعه داده Vowel ...............80

    جدول 4-12 پاسخ الگوریتم های موجود بر روی مجموعه داده Vowel ................................................................80

    جدول 4‑13 پاسخ الگوریتمFCM-BA بازاء مقادیر مختلف پارامترهابرروی مجموعه داده Vowel ..........  81

    منبع:

    مراجع

     

    [1]M.R. Anderberg, 'Cluster Analysis for Application.', New Yourk Academic Press, 1973.

    [2]J.A. Hartigan, “Statistical theory in clustering.”, Journal of Classification, 1985, Vol.2, pp.63-76.

    [3]Jon R Kettering, “The Practice of Cluster Analysis.”, Journal of Classification, 2006, Vol.23, pp.3-30.

    [4]J.J. H.Ward, “Hierarchical Grouping to Optimize an Objective Function.”, Journal of the American Statistical Association, 1963, Vol.58, pp.236-244.

    [5]J. MacQueen, “Some Methods for Classification and Analysis of MultivariateObservations.”, Fifth Berkeley Symp. Math.Statistics and Probability, 1967, Vol.2. pp.281-297.

    [6] Bezdek, J. “Fuzzy mathematics in pattern classification”, Ph.D. thesis. Ithaca, NY: Cornell University, 1794

    [7] I. Karen, A.R. Yildiz, N. Kaya, N. Ozturk, F. Ozturk, Hybrid approach

           for genetic algorithm and Taguchi’s method based design

          optimization in the automotive industry, International Journal of

           Production Research 4 (2006) 4897–4914.

     [8] Yi-Tung Kao, Erwie Zahara, I-Wei Kao,“A hybridized approach to data clustering.”, Expert Systems with Applications, 2008, Vol.34. pp.1754-1762.

     [9] احسان عسگریان ، حسین معین زاده ، محسن سریانی ، جعفر حبیبی ”رویکرد جدید برای خوشه بندی فازی بوسیله الگوریتم ژنتیک.“.,سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران.1386.

     [10] Hesam Izakian, Ajith Abraham, “Fuzzy C - means and fuzzy swarm            for fuzzy clustering problem”, Expert Systems with

          Applications 38, 1835–1838, 2011.  

     [11] K.S.F. Shu, Z. Erwie, A hybrid simplex search and particle swarm                optimization for unconstrained optimization, European Journal            of Operational Research 181 (2007) 527–548.

    [12] Fatemeh Golichenari, Mohammad Saniee Abadeh, A new Method For         Fuzzy Clustering Besed - on Fuzzy C - means Algorithm and

           Memetic Algorithm,2007

     [13] S. Kirkpatrick, C. D. Gelatt Jr., and M. P. Vecchi,

            “Optimization by Simulated Annealing”, Science, 220, 4598, pp. 671-680, 1983.

     [14] Saeed parsa, Hamid saadi, Hamid mohamadi , Scheduling jobs on                computational grid using imulated annealings,2007 

     [15] Suman, B. (2004) "Study of simulated annealing based algorithms for multi objective optimization of a constrained problem", Computers and Chemical Engineering, Volume 28, Issue 9, pp. 1849-1871.

      [16] Zhang, R. and Wu, C. (2010) "A hybrid immune simulated annealing         algorithm for the job shop scheduling problem", Applied Soft              Computing, 10, pp. 79–89.

    [17]آیدا خیابانی، جمال شهرابی، رسول علیان نژاد، آرش صباغی،”کاربرد داده کاوی در تشخیص بیماری سل.“،سومین کنفرانس داده کاوی ایران، 1388.

    [18]محمدرضا تقوا، لعیا الفت،”بکارگیری تکنیک های داده کاوی جهت مدیریت ارتباط با مشتری در صنعت بانکداری.“،سومین کنفرانس داده کاوی ایران، 1388.

    [19] J. C. Bezdek, "Feature selection for binary data-Medical diagnosis

            with fuzzy sets," in Proc. Nat. Comput. Conf. AFIPS Press, 1972,

             pp. 1057-1068.

    [20]مسعود یقینی، مریم رنجپور، فرید یوسفی، ”مروری بر الگوریتم های خوشه بندی فازی.“، سوین کنفرانس داده کاوی ایران، 1388.

    [21]Jiawei Han, MichelineKamber,. 'Data Mining consepts and techniques.',Diane Cerra, 2006.

    [22]Gabriela Czibula, Grigreta Sofia Cojocar, Istvan Gergely Czibula,

       “A Partitional Clustering Algorithm for Crosscutting Concerns          

           Identification.”,proceedings of the 8th wseas int. conference on  

           software engineering, parallel and distributed systems, 2010,       

           pp.111-116.

          

    [23]Jiahai Wang, Yalan Zhou, “Stochastic optimal competitive Hopfield network for partitional clustering”,. Expert Systems with Applications, 2009, Vol.36. pp.2072-2080.

    [24]A.K.Jain, M.N. Murty, P.J. Flynn,“Data Clustering: A Review.”,ACM Computing Surveys, 1999, Vol.31. pp.264-323.

    [25]Georgios P. Papamichail, Dimitrios P. Papamichail,“The k-means range algorithm for personalized data clustering in e-commerce.”,European Journal of Operational Research, 2007, Vol.177. pp.1400-1408.

    [26]Ohn Mar San, Van-Nam Huynh,Yoshiteru Nakamori, “An alternative extension of the k-means algorithm for clustering.”,Int. J. Appl. Math. Comput, 2004, Vol.14. pp.241-247.

    [27]Tarsitano Agostino, “A computational studyof several relocation methods for k-means algorithms.”,Pattern Recognition, 2003, Vol.36. pp.2955-2966.

    [28]H. Ralambondrainy,“A conceptual version of the K-means algorithm. ”, Pattern Recognition Letters, 1995, Vol.16. pp.1147-1157.

    [29]Dingxi Qiu, Ajit C. Tamhane,“A comparative study of the K-means algorithm and the normal mixture model for clustering: Univariate case.”,Journal of Statistical Planning and Inference, 2007, Vol.137. pp.3722-3740.

     [30]Stephen J. Redmond, Conor Heneghan,“A method for initialising the K-means clustering algorithm using kd-trees.”,Pattern Recognition Letters, 2007, Vol.28. pp.965-973.

    [31] Yiu-Ming Cheung, “k*-Means: A new generalized k-means clustering algorithm.”,Pattern Recognition Letters, 2003, Vol. 24. 2883-2893.

    [32]K. S. Al-Sultan and S. Z. Selim, “A Global Algorithm for the Fuzzy                               

          Clustering Problem”, Pattern Recognition, vol. 26, no. 9, pp. 1357-           

           1361, 1993.

    [33] George E. Tsekouras, Haralambos Sarimveis, " A newapproach for 

           measurin g the validity of the fuzzy c-means algorithm", Advances in

      Engineering Software, vol. 35, pp. 567–575, July 2004.

     [34] Li-Xin Wang,"A Course in Fuzzy Systems and Control" , Prentice- 

       Hall International, Inc. 1997

    [35]Sadaaki Miyamoto," An Overview and New Methods in Fuzzy

          Clustering"  , 2nd Inter. Conf. on Knowledge-Based Intelligent  

          Electronic Systems, 21-23 April 1998

     [36]Beightler, C.S., D.T. Phillips, and D. J. Wilde.1979. Foundations of   

           Optimization (2nd ed.). Englewood Cliffs, NJ: Printice-Hall.

     [37] مسعود یقینی، محمد رحیم اخوان کاظم ‌زاده. "الگوریتم‌های بهینه‌سازی فراابتکاری"، جهاد دانشگاهی واحد صنعتی امیر کبیر ‫

    [38]M. Murugan, V. Selladurai,“Optimization and implementation of cellular manufacturing system in a pump industry using three cell formation algorithms.”,Int J Adv Manuf Technol, 2007, Vol.35. pp.135-149.

    [39]Tushar Jain, M.J. Nigam,“Synergy of evolutionary algorithm and socio-political process for global optimization.”,Expert Systems with Applications, 2010, Vol.37. pp.3706–3713.

    [40]Yaghini, Masoud; Akhavan, Rahim, DIMMA: "A Design and   

            Implementation Methodology for Metaheuristic Algorithms"،1993

    [41]A.R. Yildiz, "A novel particle swarm optimization approach for product

           design and manufacturing", International Journal of Advanced      

      Manufacturing Technology 40 (2009) 617–628.

    [42]Chui-Yu Chiu, I-Ting Kuo,“Applying particle swarm optimization and honey bee mating optimization in developing an intelligent market segmentation system.”,Journal of Systems Science and Systems Engineering, 2010, Vol.19. pp.182-191.

    [43]Xin Zhang, Hong Peng, Qilun Zheng. Beijing,“A Novel Ant Colony Optimization Algorithm for Clustering.”,8th International Conference on Signal Processing, 2006.

    [44]P.S. Shelokar, V.K. Jayaraman, B.D. Kulkarni,“An ant colony approach for clustering.”, Analytica Chimica Acta, 2004, Vol.509. pp.187–195.

    [45] A. Fanni, A. Manunza, M. Marchesi, and F. Pilo, “Tabu search  

           metaheuristics for electromagnetic problems optimization continuous   

           domains,” IEEE Trans. Magn., vol. 35, no. 3, pp. 1694–1697, 1999.

     [46]Xiao Ying Wang, Glenn Whitwell, Jonathan M Garibaldi,“Simulated Annealing Fuzzy Clustering in Cancer Diagnosis.”,Informatica, 2005, Vol.29. pp.61-70.

    [47]D. Janaki Ram, T. H. Sreenivas, K. Ganapathy Subramaniam, “Parallel Simulated Annealing Algorithms.”,Journal of Parallel and Distributed Computing, 1996, Vol.37. pp.207-212.

    [48]X. S. Yang, “A new bat-inspired algorithm,” Nature Inspired 

          Cooperative Strategies for Optimization (NICSO 2010), vol. 284,

          Springer, Studies Computational Intelligence, pp. 65–74, 2010.

    [49]K. Deb, Multi-Objective Optimization Using Evolutionary Algorithms.

           New York:Wiley-Interscience Series Systems and Optimization, 2001.

    [50] Rosenbrock, H. H. (1960), "An automatic method for finding the greatest or least value of a function", The Computer Journal 3: 175–184 [52]G.W. Gates,“The Reduced Nearest Neighbor Rule”,. IEEE Transactions on Information Theory, 1972. pp.431-433.

    [51]A. Törn and A. Zilinskas. "Global Optimization". Lecture Notes in Computer Science, Nº 350, Springer-Verlag, Berlin, 1989.

    [52] Cho, H.; Olivera, F.; and Guikema, S. D. "A Derivation of the Number of Minima of the Griewank Function." Appl. Math. Comput. 204, 694-701, 2008. [54]T.S. Lim, W.Y Loh, Y.S Shih,“A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms.”,Machine Learning, 2000, Vol.40. pp.203-229.

    [53]M. Kudo, J. Toyama, M. Shimbo,“Multidimensional Curve 

          Classification Using Passing-Through Regions.”,Pattern Recognition  

          Letters, 1999, Vol.20. pp.1103-1111.

    [54] B.V. Dasarathy,Nosing Around the Neighborhood: “A New System Structure and Classification Rule for Recognition in Partially Exposed Environments.”,IEEE Transactions on Pattern Analysis and Machine Intelligence, 1980, Vol.PAMI-2. pp.67-71.

    [55] P. Cortez, A. Cerdeira, F. Almeida, T. Matos, J. Reis,“Modeling wine preferences by data mining from physicochemical properties.”,In Decision Support Systems, Elsevier, 2009, Vol.47. pp.547-553.

    [56] T.S. Lim, W.Y Loh, Y.S Shih,“A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms.”,Machine Learning, 2000, Vol.40. pp.203-229.

    [57] M. Kudo, J. Toyama, M. Shimbo,“Multidimensional Curve       

            Classification Using Passing-Through Regions.”,Pattern   

            Letters, 1999, Vol.20. pp.1103-1111.


موضوع پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, نمونه پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, جستجوی پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, فایل Word پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, دانلود پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, فایل PDF پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, تحقیق در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, مقاله در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروژه در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروپوزال در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, تز دکترا در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, تحقیقات دانشجویی درباره پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, مقالات دانشجویی درباره پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروژه درباره پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, گزارش سمینار در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروژه دانشجویی در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, تحقیق دانش آموزی در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, مقاله دانش آموزی در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, رساله دکترا در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

پایان نامه کارشناسی ارشد در رشته مهندسی اتوماسیون و ابزار دقیق چکیده ارائه روشی جدید در خوشه­بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c-means خوشه­بندی قرار دادن داده ­ها در گروه­هایی است که اعضای هر گروه از زاویه خاصی به هم شباهت دارند . شباهت بین داده­های درون هر خوشه حداکثر و شباهت بین داده­­های درون خوشه­های متفاوت حداقل می­باشد. Fuzzy c-means نیز یک تکنیک خوشه­ ...

پایان ‌نامه برای دریافت درجه کارشناسی ارشد رشته مهندسی کامپیوتر - هوش مصنوعی چکیده خوشه‌بندی داده‌ها روشی برای دسته‌بندی داده‌های مشابه می باشد که این روش سال‌ها در علوم مختلف به کار رفته و الگوریتم‌های زیادی در این زمینه طراحی شده است . تحقیقات اخیر خوشه‌بندی به سمت روش های ترکیبی که دارای قابلیت استحکام و دقت بیشتر هستند، هدایت می‌کند. خوشه‌بندی ترکیبی سعی می‌کند ابتدا ...

پایان­نامه برای دریافت درجه کارشناسی ارشد رشته مهندسی کامپیوتر – هوش مصنوعی چکیده بخش­بندی تصویر یک فرآیند اساسی در بسیاری از کاربردهای پردازش­ تصویر و بینایی ماشین است که می­تواند به عنوان اولین مرحله پردازش سطح پایین در پردازش تصاویر دیجیتالی در نظر گرفته شود. بخش­بندی تصویر کاربردهای گوناگونی مانند پردازش تصاویر پزشکی، شناسایی چهره، سیستم­های کنترل ترافیک و غیره دارد. با توجه ...

پایان نامه کارشناسی ارشد رشته: مهندسی کامپیوتر گرایش: نرم‌افزار چکیده گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار می­رود. برای مقابله با این مشکل، سیستم‌های شخصی­سازی وب ارائه شده­اند که محتوا و سرویس­های یک وب­سایت را با افراد براساس علایق و رفتار گردشی آن­ها سازگار می­کنند. یک مؤلفه­ی اساسی در هر سیستم شخصی­سازی وب، مدل کاربر آن است. هدف از شخصی سازی وب، مهیا ساختن ...

پايان نامه جهت اخذ درجه کارشناسي ارشد رشته مهندسي صنايع مهر 1391 شناسايي ارزش[1] مشتريان، از مولفه‌هاي اصلي موفقيت در فروشگاه‌ هاي مختلف مي‌باشد که امروزه مورد توجه بيش از پيش قر

پایان نامه برای دریافت درجه کارشناسی ارشد رشته هوش مصنوعی چکیده یکی از پیچیده‌ترین کار‌ها در پردازش تصاویر دیجیتال، بخش‌ بندی تصاویر است. به‌دلیل افزایش توجه به این تکنیک توسط محققان و تبدیل آن به یک نقش حیاتی در بسیاری از زمینه‌های کاربردی مثل کاربرد‌های پزشکی مورد استفاده قرار می‌گیرد. امروزه در دندان‌پزشکی مدرن، تکنیک‌های مبتنی بر استفاده از کامپیوتر مانند طرح‌ریزی و ...

پایان نامه جهت اخذ مدرک کارشناسی ارشد در رشته مهندسی کامپیوتر – گرایش نرم‌افزار چکیده در تمامی پروژه­ هایی که امروزه انجام می­شوند بحث مدیریت مسأله­ای بسیار تعیین کننده است. پروژه­های نرم­افزاری نیز از این قاعده مستثنی نیستند. از مهم‌ترین جنبه­های فعالیت توسعه نرم­افزاری بحث مدیریت زمان و هزینه است. با توجه به اینکه در مراحل ابتدایی توسعه نرم­افزار اطلاعات دقیقی نسبت به جنبه­های ...

پایان نامه­ی کارشناسی ارشد در رشته­ی مهندسی کامپیوتر- نرم­افزار چکیده آسیب پذیری­ های نرم افزار می­تواند منجر به تلفات مالی و اطلاعاتی شود. به علت محدود بودن منابع مالی و انسانی، اولویت دهی به آسیب­ها بسیار مورد توجه می­باشد. پیش از این پژوهش، تعداد زیادی از محققان آسیب پذیری­ها را براساس دانش­های تجربی و آماری، رده بندی کرده­اند. اماگاهی طبیعت متغییر آسیب پذیر ی­ها، فراهم کردن ...

پایان‏نامه کارشناسی ارشد رشته مهندسی کامپیوتر – گرایش نرم ‏افزار چکیده خوشه‏بندی را می‏توان یکی از مهمترین مراحل در تحلیل داده‏ها برشمرد. روش‏های خوشه‏بندی بسیاری تاکنون توسعه و ارائه داده شده‏اند. یکی از این روش‏ها که در مطالعات اخیر مورد توجه و بررسی قرار گرفته است، روش خوشه‏بندی توافقی می‏باشد. هدف خوشه‏بندی توافقی ترکیب چند خوشه‏بندی اولیه و بدست آوردن یک خوشه‏بندی نهایی است ...

پایان نامه کارشناسی ارشد رشته مهندسی کامپیوتر چکیده: در سال های اخیر با توجه به رشد روز افزون درخواستها و پیوستن مشتریان جدید به دنیای محاسبات، سیستم های محاسباتی نیز باید تغییر کنند و قدرتمندتر وانعطاف پذیرتر از قبل عمل نمایند. در این میان محاسبات ابری به عنوان مدلی فراتر از یک سیستم ارائه شد که در حال حاضر توانایی پاسخگویی به اکثر درخواست ها و نیازمندی ها را دارد. راه حل های ...

ثبت سفارش