پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

word 1 MB 31019 74
1393 کارشناسی ارشد مهندسی کامپیوتر

قیمت قدیم:۶۵,۰۰۰ تومان

قیمت: ۳۵,۰۰۰ تومان

دانلود فایل

بخشی از محتوا
وضعیت فهرست و منابع

پایان نامه کارشناسی ارشد در رشته مهندسی کامپیوتر(نرم افزار)

فصل اول پیشگفتار

1-1-     مقدمه

برخی نویسندگان داده کاوی را به عنوان ابزاری برای جستجو کردن اطلاعات سودمند در حجم زیادی از داده ها تعریف می کنند. برای انجام فرایند داده کاوی با زمینه های گوناگون تحقیقی مواجه می‌شویم، مانند پایگاه داده، یادگیری ماشین و آمار. پایگاه داده‌ها برای تحلیل کردن حجم زیادی از داده‌ها ضروری هستند. یادگیری ماشین، یک ناحیه هوش مصنوعی است که با ایجاد تکنیک‌هایی امکان یادگیری به وسیله تحلیل مجموعه‌های داده‌ای را به کامپیوترها می‌دهند. تمرکز این روش‌ها روی داده سمبولیک است و با آنالیز داده‌های تجربی سر و کار دارد. پایه آن تئوری آماری است. در این تئوری عدم قطعیت و شانس به وسیله تئوری احتمال مدل می‌شوند. امروزه بسیاری از روش‌های آماری در زمینه داده کاوی استفاده می‌شوند. می‌توان گفت که متن کاوی از تکنیک‌های بازیابی اطلاعات، استخراج اطلاعات همچنین پردازش کردن زبان طبیعی استفاده می‌کند و آن‌ها را به الگوریتم‌ها و متدهای داده کاوی، یادگیری ماشین و آماری مرتبط می‌کند. با توجه به ناحیه‌های تحقیق گوناگون، بر هر یک از آن‌ها می‌توان تعاریف مختلفی از متن کاوی در نظر گرفت در ادامه برخی از این تعاریف بیان می‌شوند:

متن کاوی = استخراج اطلاعات: در این تعریف متن کاوی متناظر با استخراج اطلاعات در نظر گرفته می‌شود (استخراج واقعیت‌ها از متن).

متن کاوی = کشف داده متنی: متن کاوی را می‌توان به عنوان متدها و الگوریتم‌هایی از فیلدهای یادگیری ماشین و آماری برای متن‌ها با هدف پیدا کردن الگوهای مفید در نظر گرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روش‌ها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازش‌های ساده برای استخراج داده از متون استفاده می‌شود، سپس می‌توان الگوریتم‌های داده کاوی را بر روی داده‌های استخراج شده اعمال کرد.

متن کاوی = فرایند استخراج دانش: که در بخش قبلی به طور کامل توضیح داده شده است و در اینجا دیگر بیان نمی‌شود. در این تحقیق ما بیشتر متن کاوی را به عنوان کشف داده متنی در نظر می‌گیریم و بیشتر بر روی روش‌های استخراج الگوهای مفید از متن برای دسته‌بندی مجموعه‌ های متنی یا استخراج اطلاعات مفید، تمرکز می‌کنیم.

در دنیای کنونی مشکل کمبود اطلاعات نیست، بلکه مشکل کمبود دانشی است که از این اطلاعات می توان بدست آورد. میلیونها صفحه ی وب، میلیونها کلمه در کتابخانه‌های دیجیتال و هزاران صفحه اطلاعات در هر شرکت، تنها چند دست از این منابع اطلاعاتی هستند. اما نمی‌توان به طور مشخص منبعی از دانش را در این بین معرفی کرد. دانش خلاصه‌ی اطلاعات است و نیز نتیجه گیری و حاصل فکر و تحلیل بر روی اطلاعات.

داده کاوی، یک روش بسیار کارا برای کشف اطلاعات از داده‌های ساختیافته‌ای که در جداول نگهداری می‌شوند، است. داده کاوی، الگوها را از تراکنش‌ها، استخراج می‌کند، داده را گروه‌بندی می‌کند و نیز آنرا دسته‌بندی می‌کند. بوسیله‌ی داده کاوی می‌توانیم به روابط میان اقلام داده‌ای که پایگاه داده را پر کرده‌اند، پی ببریم. در عین حال ما با داده کاوی مشکلی داریم و آن عدم وجود عامیت در کاربرد آن است. بیشتر دانش ما اگر به صورت غیر دیجیتال نباشند، کاملاً غیر ساختیافته اند. کتابخانه‌های دیجیتال، اخبار، کتابهای الکترونیکی، بسیاری از مدارک مالی، مقالات علمی و تقریباً هر چیزی که شما می‌توانید در داخل وب بیابید، ساختیافته نیستند. در نتیجه ما نمی‌توانیم آموزه‌های داده کاوی را در مورد آنها به طور مستقیم استفاده کنیم. با این حال، سه روش اساسی در مواجهه با این حجم وسیع از اطلاعات غیر ساختیافته وجود دارد که عبارتند از: بازیابی اطلاعات، استخراج اطلاعات و پردازش زبان طبیعی.

بازیابی اطلاعات: اصولاً مرتبط است با بازیابی مستندات و مدارک. کار معمول دربازیابی اطلاعات این است که با توجه به نیاز مطرح شده از سوی کاربر، مرتبط ترین متون و مستندات و یا در واقع بقچه‌ی کلمه را ازمیان دیگر مستندات یک مجموعه بیرون بکشد. این یافتن دانش نیست بلکه تنها آن بقچه‌ای از کلمات را که به نظرش مرتبط‌تر به نیاز اطلاعاتی جستجوگر است را به او تحویل می‌دهد. این روش به واقع دانش و حتی اطلاعاتی را برایمان به ارمغان نمی‌آورد.

پردازش زبان طبیعی: هدف کلی پردازش زبان طبیعی رسیدن به یک درک بهتر از زبان طبیعی توسط کامپیوترهاست. تکنیک‌های مستحکم و ساده‌ای برای پردازش کردن سریع متن به کار می‌روند. همچنین از تکنیک‌های آنالیز زبان شناسی نیز برای پردازش کردن متن استفاده می‌شود.

استخراج اطلاعات: هدف روش‌های استخراج اطلاعات، استخراج اطلاعات خاص از سندهای متنی است. استخراج اطلاعات می‌تواند به عنوان یک فاز پیش پردازش در متن‌کاوی بکار برود. استخراج اطلاعات عبارتند از نگاشت کردن متن‌های زبان طبیعی (مثلا گزارش‌ها، مقالات journal، روزنامه‌ها، ایمیل‌ها، صفحات وب، هر پایگاه داده متنی و.....) به یک نمایش ساختیافته و از پیش تعریف شده یا قالب‌هایی که وقتی پر می‌شوند، منتخبی از اطلاعات کلیدی از متن اصلی را نشان می‌دهند. یکبار اطلاعات استخراج شده و سپس اطلاعات می‌توانند در پایگاه داده برای استفاده‌های آینده، ذخیره شوند.

کاربردهای متن کاوی

در این قسمت تعدادی از کاربردهای متن‌کاوری را بیان خواهیم کرد. امروزه با وجود حجم زیادی از اطلاعات متنی، متن‌کاوی از جمله روش های تحقیقی-تجاری می‌باشد که از اهمیت ویژه‌ای برخوردار است. همه شرکت‌های تجاری، تولید کنندگان کالاها، ارائه کنندگان خدمات و سیاست‌مداران قادرند با بهره‌گیری از فرایند متن‌کاوی دانش مفیدی را به عنوان بازخورد از کالا، خدمات و عملکرد خود دریافت کنند. از جمله کاربردهای متن کاوی می‌توان به موارد زیر اشاره نمود:

1.شناساییspam: آنالیز کردن عنوان و محتوای یک ایمیل دریافتی، برای تشخیص اینکه آیا ایمیل می‌تواند spam باشد یاخیر.

2 .نظارت :یعنی نظارت کردن رفتار شخص یا گروهی از انسان‌ها به صورت پنهان. پروژه‌ای به نام ENCODA تلفن، اینترنت و دیگر وسایل ارتباطی را برای شناسایی تروریسم نظارت می‌کند.

3. شناسایی نامهای مستعار: نام‌های مستعار در مراقبت‌های پزشکی برای شناسایی تقلب‌ها آنالیز می‌شوند. برای مثال یک صورت حساب ممکن هست با نام John Smith، J. Smith و Smith, John ارائه شود. از این طریق یا با استفاده از روش‌های دیگری مطالبه کنندگان امکان سوءاستفاده را خواهند یافت و مطالبات حق بیمه زیادی تحت نام‌های مستعار مختلف دریافت می‌کنند. استفاده از متن‌کاوی برای تشخیص این نام‌های مستعار می‌تواند در یافتن تقلب به شرکت‌های بیمه کمک فراوانی کند.

4.خلاصه سازی: منظور از خلاصه سازی، روند استخراج و ارائه مجموعه‌ای مفاهیم پایه‌ای از متن، تنها در چند خط است. این کار می‌تواند بررسی محتویات مستندات را برای کاربران ساده‌تر کند و آنها را در مسیر رسیدن به آنچه نیاز دارند، سرعت بخشد.

5. روابط میان مفاهیم: از جمله واقعیتهایی که می توان از یک مجموعه متون دریافت، ارتباط و وابستگی برخی مفاهیم با مفاهیم دیگراست. این واقعیات به طور مثال می‌تواند بگوید که پدیدار شدن بعضی کلمات ممکن است که وابسته باشد به ظاهر شدن بعضی دیگر از کلمات. منظور این است که هرگاه مجموعه ی اول کلمات را ببینیم، می‌توانیم انتظار داشته باشیم که مجموعه‌ی دوم لغات را نیز در ادامه مشاهده خواهیم کرد. این مفهوم نیز از داده کاوی در دیتابیس به امانت گرفته شده است.

6. یافتن وتحلیل رفتارها: برای شرح این کاربرد فرض کنید که مدیر یک کمپانی تجاری هستید. مشخصاً شما باید همواره بر فعالیتهای رقیبانتان نظارت داشته باشید. این می‌تواند هر نوع اطلاعاتی باشد که شما از اخبار، معاملات بورس و یا از مستندات تولید شده توسط همان کمپانی رقیب گرفته‌اید. امروزه اطلاعات به طور فزآینده‌ای در حال افزایش است، مدیریت تمامی این منابع داده‌ای قطعاً تنها به کمک چشمان ممکن نیست. متن‌کاوی این امکان را می‌دهد که به طور اتوماتیک رفتارها و تغییرات جدید را بیابید. در واقع آنچه اصولاً باید از متن‌کاوی انتظار برود این است که به شما بگوید چه اخباری در میان گستره‌ای از اخبار به آنچه می خواهید مرتبط است و در این میان کدام خبر جدیداست، چه پیشرفتهایی در زمینه‌ی کاری شما صورت می گیرد و علایق و رفتارهای فعلی چگونه است و با چه روندی تغییر می‌کند. با استفاده از این اطلاعات، مدیران قادرند از اطلاعات کشف شده برای بررسی وضعیت رقیب سود جویند.

7. تحلیل احساس : در این کاربرد هدف از متن کاوی تشخیص احساس نویسنده متن است. درجه رضایت یا خوشحالی و ناراحتی نویسنده تشخیص داده می‌شود. این رساله به بررسی متن کاوی به منظور تحلیل احساس موجود در متون خواهد پرداخت، لذا در ادامه با جزئیات بیشتری تحلیل احساس در متون را بررسی خواهیم کرد.

همه اطلاعات متنی را می‌توان به دو دسته:حقایق[1] و عقاید[2] دسته بندی کرد. حقایق عبارات علمی‌ و عملی درباره موجودیت‌ها، رویدادها و ویژگی‌های آنها هستند که بصورت عینی و واقعی در دنیای بیرون وجود دارند یا به وقوع پیوسته‌اند. عقاید عبارات غیر عینی و ذهنی هستند که نظرات، ارزیابی‌ها یا احساسات افراد را درباره یک موجودیت، رویداد و ویژگی‌های آنها بیان می‌کنند [23]. شکل 1-1 مثالی را برای هر کدام بیان میکند. در این رساله تنها به یک جنبه از این مفهوم یعنی احساسات خواهیم پرداخت.

قبل از سال 2000 به دلیل کمبود منابع داده‌ای و کمبود متون حاوی نظرات و عقاید در تارنمای گسترده جهانی[1] تحقیقات اندکی در این زمینه به انجام رسیده است. امروزه با گسترش اینترنت و همه‌گیر شدن شبکه‌های اجتماعی، کاربران می‌توانند نظرات خود درباره محصولات یا خدمات را در سایت‌های تجاری، شبکه‌های اجتماعی، وبلاگ‌ها بیان کنند؛ صفحات وب متون زیادی را در بر دارند که مشتمل بر نظرات، عقاید، ارزیابی کاربران پیرامون یک کالا یا خدمات خاص هستند. اطلاعاتی که از این نوع داده‌ها قابل دست‌یابی است، برای شرکت‌های سازنده و همچنین سازمان‌های ارائه کننده خدمات بسیار مفید و گاهی ضروری خواهند ‌بود. همچنین برای کاربرانی که قصد انتخاب خدمات یا یک نوع کالا را دارند راهنمایی مفیدی را ارائه می‌دهند. شخصی را در نظر بگیرید که قصد دارد موبایل یا دوربین دیجیتالی بخرد، برای آگاهی از کیفیت دوربین و مطلوبیت خدمات شرکت سازنده بدون شک به پرسش و جمع‌آوری اطلاعات از اطرافیان روی خواهد آورد، ولی امروزه با رشد اینترنت می‌توان بصورت آنلاین نظرات و تجربیات صدها نفر را درباره یک کالای خاص مطالعه کرد و برای تصمیم گیری از آنها مدد گرفت.

امروزه تعدد و گوناگونی منابع اینترنتی حاوی نظرات و احساسات کاربران به حدی زیاد شده است که یافتن و ارزیابی آنها کار بسیار پیچده‌ای است. در بسیاری موارد نظرات و عقاید کاربر در یک پست طولانی پنهان شده است. برای استخراج نظرات و عقاید درباره یک موجودیت باید در ابتدا منابع اینترنتی مرتبط با آن را یافت سپس متن مورد نظر خوانده شود، جملات بیان کننده نظرات و عقاید کاربر از متن استخراج شوند، خلاصه سازی شوند و به فرم قابل استفاده تبدیل شوند. از جمله مشکلاتی که در این زمینه وجود دارد حجم زیاد داده می‌باشد. در صفحه توییتر شخصی جاستین بیبر روزانه 300000 نظر ثبت می‌شود [22]. این حجم از داده‌ها میتوانند اطلاعات مفیدی را برای شرکت‌ها و همچنین مشتری‌ها به همراه داشته باشند؛ ولی پردازش آنها بصورت دستی و انسانی غیر ممکن می‌باشد، لذا طراحی یک روش اتوماتیک برای تحلیل متن و استخراج نظرات و عقاید موجود در متن ضروری است. در همین راستا تلاش‌های فراوانی صورت گرفته است، مثلا در کشور آمریکا 20 تا 30 شرکت به ارائه خدمات تخصصی تحلیل احساس می‌پردازند [17].

در این رساله روشی برای تحلیل احساس ارائه می‌شود. روش پیشنهادی سعی در ارائه مجموعه مناسبی از خصیصه‌ها[2] را دارد به نحوی که بتوان به دقت بهتری در ارزیابی اتوماتیک متون دست یافت، همچنین تعداد خصیصه‌ها در حد متناسبی حفظ شود. برای انتخاب خصیصه‌ها از الگوریتم‌های ساده و با حداقل پیچیدگی زمانی بهره می‌بریم و نیاز به استفاده از الگوریتم انتخاب خصیصه با پیچیدگی زمانی بالا مرتفع شده است.

1-1-     تحلیل احساس در متن

تحلیل احساس در واقع مطالعه محاسباتی نظرات عقاید و احساسات بیان شده در متن است. متن زیر نظر یک کاربر درباره iphone است.

"(1) I bought an iphone a few days ago. (2) It was such a nice phone. (3) The touch screen was really cool. (4) The voice quality was clear. (5) Although the battery life was not long, that is ok for me. (6) However my mother was mad with me as I did not tell her before I bough it. (7) She also thought the phone was too expensive, and wanted me to return it to shop……”

چه اطلاعاتی می‌توان از متن استخراج کرد ؟ ابتدا باید توجه کنیم چند نظر در این متن وجود دارد، جملات (2)، (3) و (4) نظرات مثبتی را بیان می‌کنند. جملات (5)، (6) و (7) نظرات منفی را بیان می‌کنند. آیا نظرات بیان شده درباره یک موجودیت بیان شده‌اند؟ این موجودیت کدام است؟ جمله (2) بصورت کلی نظری را درباره iphone بیان کرده است. جملات (3)، (4) و (5) نظراتی درباره صفحه لمسی، وضوح صدا و طول عمر باتری بیان می‌کنند. جمله (7) عقیده مشتری نسبت به قیمت موبایل را بیان می‌کند. ولی نظرات بیان شده در جمله (6) درباره شخص می‌باشد نه درباره موبایل iphone. این نکته بسیار مهم است باید توجه داشت متنی که حاوی نظرات کابران می‌باشد لزوما درباره یک موجودیت خاص نیست، ممکن است در طول متن نظرات مثبت و منفی درباره موجودیت‌های متفاوت بیان شده باشد.

تحلیلگر احساس و عقاید معمولا ورودی‌های خود(جملات، اسناد) را به دو گروه نظرات و عقاید مثبت و نظرات و عقاید منفی دسته‌بندی می‌کند. برخی از تحقیقات نیز ضعیف یا قوی بودن نظرات در نظر گرفته‌اند و متون در 4 گروه دسته بندی می‌شوند. گروه اول نظرات کاملا منفی، دوم نظرات کمی‌منفی، سوم نظرات کمی‌مثبت، چهارم نظرات کاملا مثبت.

فرایند تحلیل احساس در سه سطح انجام می‌شود:

در سطح کلمات

در سطح جمله

در سطح سند.

برای هر سطح پیش فرض‌ها و وظایفی برشمرده می‌شود که باید در تحلیلگر لحاظ شوند. در ادامه به تشریح تحلیلگر احساس در سطوح متفاوت خواهیم پرداخت.

تحلیلگر احساس در سطح کلمه یک سند یا مجموعه ای از جملات را به عنوان ورودی دریافت می‌کند. ابتدا کلمات متفاوت که ویژگی‌های یک موجودیت را بیان می‌کنند را از متن استخراج می‌کند. سپس نظرات بیان شده در متن پیرامون ویژگی‌های موجودیت را تشخیص می‌دهد. شکل1-2 یک مثال از عملکرد تحلیلگر احساس در سطح کلمه را بیان می‌کند.

(تصاویر در فایل اصلی موجود است)

Abstract

Dynamic Consolidation of Virtual Machines in Data Centers

Nowadays, large data centers are used to implement cloud computing environment. Large data centers are constructed from hundreds of computational hosts, tens of high speed switches and other network devices which consume significant amount of energy. It has been forecasted that data center’s energy consumption will which to 139.8 terawatt by 2020. Various algorithms have been proposed to reduce energy consumption such as dynamic, static management of virtual machines and DVFS. In this thesis two algorithms have been proposed that use dynamic consolidation of VMs and considers data center architecture. Implementation results in cloudSim shows that a remarkable decrease in energy consumption of hosts and switches by considering SLA violation.

Keywords: Cloud Computing, Data Center, Dynamic Virtual Machine Consolidation
فصل اول پیشگفتار. 1

1-1- مقدمه. 2

1-3- تحلیل احساس در متن. 6

1-4- اهداف رساله. 8

1-5- روش کار. 9

1-6- ساختار پایان نامه. 9

فصل دوم کارهای انجام شده 10

2-1- مقدمه. 11

2-2- تعریف مسئله. 11

2-3- گام اول تحلیل احساس در متن. 12

2-4- روش‌های مبتنی بر خصیصه‌های N-gram.. 13

2-5- الگوریتم‌های انتخاب خصیصه. 18

فصل سوم روش پیشنهادی. 22

3-1- پیش گفتار. 23

3-2- منابع مورد نیاز. 23

3-3- روش پیشنهادی اول. 25

3-3-1.               پیش پردازش اسناد 26

3-3-2.               برچسب گذاری ادات سخن. 29

3-3-3.               استخراج بردار خصیصه‌ها و ترکیب خصیصه‌ها 30

3-3-4.                اعمال الگوریتم انتخاب خصیصه. 33

3-4- روش پیشنهادی دوم 34

3-5- روش پیشنهادی سوم 37

3-5-1.               استخراج پلاریته کلمات و فیلتر بردار خصیصه. 38

فصل چهارم پیاده سازی و نتایج گرفته شده 47

4-1- مقدمه. 48

4-2- مجموعه داده‌ها 48

4-3- طبقه‌بندی داده‌ها 48

4-4- نتایج روش اول. 49

4-5- نتایج روش دوم 52

4-6- نتایج روش سوم 53

4-7- مقایسه روش پیشنهادی با روش‌های قبل. 53

8-4-    نتایج اعمال روش پیشنهادی برای زبان فارسی..........................................................................................................................54

4-9- کارهای آینده 58

مراجع و منابع. 59

منبع:

[1] A. Abbasi, S. France, Z. Zhang, H. Chen; ” Selecting Attributes for Sentiment Classification Using Feature Relation Networks.”, IEEE Transactions on Knowledge and Data Engineering 23, pp. 447–462 (2011).

[2] A. Ahmed, H. Chen, A. Salem; “Sentiment Analysis in Multiple Languages: Feature Selection for Opinion Classification in Web Forums,” ACM Trans. Information Systems,vol. 26, no. 3,article no. 12, 2008

[3] A. Abbasi, H. Chen, S. Thoms, T. Fu; “Affect Analysis of WebForums and Blogs Using Correlation Ensembles” IEEE Trans.Knowledge and Data Eng.,vol. 20, no. 9, pp. 1168-1180, Sept. 2008.

[4] B. Pang, L. Lee, S. Vaithyanathan; ”Thumbs up? Sentiment classification using machine learning techniques.”,   Empirical Methods in Natural Language Processing (EMNLP), pp. 79–86, (2002).

[5] B. Agarwal, N. Mittal; ”Optimal Feature Selection Methods for Sentiment Analysis”, 14th International Conference on Intelligent Text Processing and Computational Linguistics, Vol-7817, pages-13-24, 2013.

[6] C.E. Shannon; “A Mathematical Theory of Communication,”Bell Systems Technical J.,vol. 27, no. 10, pp. 379-423, 1948.

[7] C. Priyanka, G. Deepa, ” Identifying the Best Feature Combination for Sentiment Analysis of Customer Reviews” International Conference on Advances in Computing, Communications and Informatics (ICACCI),India , pp. 102 – 108, Aug 2013.

[8] C.E. Shannon, “A Mathematical Theory of Communication,”Bell

Systems Technical J.,vol. 27, no. 10, pp. 379-423, 1948.

[9] E.Andrea and S.Fabrizio, "SENTIWORDNET: A Publicly Available Lexical Resource for Opinion Mining," In Proceedings of the 5th Conference on Language Resources and Evaluation , LREC’06, page 417-422,2006.

[10] E. Riloff, S. Patwardhan, and J. Wiebe, “Feature Subsumption for Opinion Analysis,”Proc. Conf. Empirical Methods in Natural Language Processing,pp. 440-448, 2006.

[11] J.R. Quinlan; “Induction of Decision Trees”, Machine Learning, vol. 1, no. 1, pp. 81-106, 1986.

[12] J. Wiebe, T. Wilson, R. Bruce, M. Bell, and M. Martin; “Learning Subjective Language”, Computational Linguistics,vol. 30,      no. 3, pp. 277-308, 2004.

[13] J. Blitzer, M. Dredze, F. Pereira; ”Biographies, Bollywood, boom-boxes and blenders: Domain adaptation for       sentiment classification.”, Proceedings of the Association for Computational Linguistics (ACL), pp. 440–447 (2007).

[14] J. Yi, T. Nasukawa, R. Bunescu, and W. Niblack, “Sentiment Analyzer: Extracting Sentiments about a Given Topic Using Natural Language Processing Techniques,”Proc. Third IEEE Int’l Conf. Data Mining,pp. 427-434, 2003.

[15] J.R. Quinlan, “Induction of Decision Trees,” Machine Learning,vol. 1, no. 1, pp. 81-106, 1986.

[16] K. Tsutsumi, K. Shimada, and T. Endo, “Movie Review Classification Based on Multiple Classifier,”Proc. 21st Pacific Asia Conf. Language, Information, and Computation,pp. 481-488, 2007.

[17] L. Bing , Z. Lei “Mining Text Data”, springer, USA , 2012.

[18] L. Yu and H. Liu, “Feature Selection for High-Dimensional Data: A Fast Correlation-Based Filter Solution,”Proc. 20th Int’l Conf. Machine Learning,pp. 856-863, 2003.

[19] L. Yu and H. Liu, “Efficient Feature Selection via Analysis of Relevance and Redundancy,”J. Machine Learning Research, vol. 5,pp. 1205-1224, 2004.

[20] M. Gamon; “Sentiment Classification on Customer Feedback Data:Noisy Data, Large Feature Vectors, and the Role of Linguistic Analysis,”Proc. 20th Int’l Conf. Computational Linguistics,pp. 841-847, 2004.

[21] M. Hall, L.A. Smith; “Feature Subset Selection: A Correlation Based Filter Approach,”Proc. Fourth Int’l Conf. Neural Information Processing and Intelligent Information Systems,pp. 855-858, 1997.

[22] M. Ghiassi, J. Skinner, D. Zimbra: “Twitter brand sentiment analysis: A hybrid system usingN-gram analysis and dynamic artificial neural network”, Expert Systems with Applications, 40, (2013) 6266–6282

[23] p. Bo, Lillian Lee, “Opinion Mining and Sentiment Analysis”, Information Retrieval, Vol. 2, Nos. 1–2, pp. 1–135, (2008)

[24] T. Zhang, D. Tao, X. Li, and J. Yang, “Patch Alignment for Dimensionality Reduction,”IEEE Trans. Knowledge and Data Eng., vol. 21, no. 9, pp. 1299-1313, Sept. 2009

[25] V. Ng, S. Dasgupta, S.M.N. Arifin; “Examining the Role of Linguistic Knowledge Sources in the Automatic Identification and Classification of Reviews”, Conf. Computational Linguistics, Assoc. for Computational Linguistics, pp. 611-618, 2006.

[26] Z. Fei, J. Liu, G. Wu; “Sentiment Classification Using Phrase Patterns”, Proc. Fourth IEEE Int’l Conf. Computer Information Technology,pp. 1147-1152, 2004.

[27] WEKA. Open Source Machine Learning Software Weka, http://www.cs.waikato.ac.nz/ml/weka/

کلمات کلیدی: احساس موجود در نوشتجات - بازیابی اطلاعات - پایگاه داده - تحلیل احساس - داده کاوی - هوش مصنوعی - یادگیری ماشین

دانلود پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, پروژه دانشجویی برای پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, پروپوزال برای موضوع پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, تحقیق در مورد پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, مقاله پیرامون پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, رساله و تز دکترا با موضوع پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات, گزارش سمینار پایان نامه ارائه یک مدل مبتنی بر خصیصه جهت تحلیل احساس موجود در نوشتجات

پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

مهندسی صنایع ۱۰۲

پایان نامه کارشناسی ارشد در رشته مهندسی اتوماسیون و ابزار دقیق چکیده ارائه روشی جدید در خوشهبندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c-means خوشهبندی قرار دادن دادهها در گروههایی است که اعضای هر گروه از زاویه خاصی به هم شباهت دارند . شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد. Fuzzy c-means نیز یک تکنیک ...

پایان نامه داده کاوی (Data Mining)

مهندسی کامپیوتر ۹۱

پايان نامه مقطع کارشناسي ناپيوسته رشته کامپيوتر سال 1387 چکيده: در دو دهه قبل تواناييهاي فني بشر براي توليد و جمع آوري داده‌ها به سرعت افزايش يافته است. عواملي نظير استفاده

پایان نامه مدلی کارا برای ساخت پیکره متنی موازی از روی پیکره متنی تطبیقی

مهندسی کامپیوتر ۹۴

پایان‌نامه کارشناسی ارشد در رشته مهندسی کامپیوتر (نرم افزار) چکیده اغلب رویکردهای نوین ترجمه در حوزه ترجمه ماشینی از جمله ترجمه ماشینی آماری، ترجمه ماشینی مبتنی بر مثال و ترجمه ماشینی ترکیبی از مجموعه متون هم‌ترجمه تحت عنوان پیکره‌های متنی موازی به عنوان داده آموزشی اصلی استفاده می‌کنند. اما برای اغلب زبان‌ها پیکره‌های موازی به میزان بسیار کمی در دسترس هستند و یا مربوط به دامنه ...

پایان نامه خوشه ‏بندی توافقی بر روی داده‏ های توزیع شده ناهمگن

مهندسی کامپیوتر ۱۲۰

پایان‏نامه کارشناسی ارشد رشته مهندسی کامپیوتر – گرایش نرم ‏افزار چکیده خوشه‏بندی را می‏توان یکی از مهمترین مراحل در تحلیل داده‏ها برشمرد. روش‏های خوشه‏بندی بسیاری تاکنون توسعه و ارائه داده شده‏اند. یکی از این روش‏ها که در مطالعات اخیر مورد توجه و بررسی قرار گرفته است، روش خوشه‏بندی توافقی می‏باشد. هدف خوشه‏بندی توافقی ترکیب چند خوشه‏بندی اولیه و بدست آوردن یک خوشه‏بندی نهایی است ...

پایان نامه خوشه بندی فازی داده ها بر اساس منطق فازی

مهندسی کامپیوتر ۴۶

پایان ‌نامه برای دریافت درجه کارشناسی ارشد رشته مهندسی کامپیوتر - هوش مصنوعی چکیده خوشه‌بندی داده‌ها روشی برای دسته‌بندی داده‌های مشابه می باشد که این روش سال‌ها در علوم مختلف به کار رفته و الگوریتم‌های زیادی در این زمینه طراحی شده است . تحقیقات اخیر خوشه‌بندی به سمت روش های ترکیبی که دارای قابلیت استحکام و دقت بیشتر هستند، هدایت می‌کند. خوشه‌بندی ترکیبی سعی می‌کند ابتدا ...

پایان نامه ارائه مدلی برای شناسایی عوامل اثرگذار و ضریب تاثیر آن ها در سود و زیان بیمه شخص ثالث خودرو شرکتهای بیمه به وسیله روش های داده کاوی مطالعه موردی شرکت سهامی بیمه ایران

مهندسی کامپیوتر ۱۰۰

پایان‌نامه کارشناسی ارشد در رشته‌ی کامپیوتر - مهندسی نرم افزار چکیده بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت ...

پایان نامه پیش بینی بهره کشی و خوشه بندی آسیب پذیری ها به وسیله ی متن کاوی

مهندسی کامپیوتر ۱۰۵

پایان نامهی کارشناسی ارشد در رشتهی مهندسی کامپیوتر- نرمافزار چکیده آسیب پذیری های نرم افزار میتواند منجر به تلفات مالی و اطلاعاتی شود. به علت محدود بودن منابع مالی و انسانی، اولویت دهی به آسیبها بسیار مورد توجه میباشد. پیش از این پژوهش، تعداد زیادی از محققان آسیب پذیریها را براساس دانشهای تجربی و آماری، رده بندی کردهاند. اماگاهی طبیعت متغییر آسیب پذیر یها، فراهم کردن ...

پایان نامه شناسایی مشخصه های مناسب موجود در متن جهت رفع ابهام معنایی

مهندسی کامپیوتر ۸۷

پایان‌نامه‌ی کارشناسی ارشد در رشته‌ی مهندسی کامپیوتر- نرم‌افزار چکیده شناسایی مشخصه های مناسب موجود در متن جهت رفع ابهام معنایی به جرأت میتوان ادعا کرد که عصر حاضر، عصر انفجار اطلاعات است و شاید بتوان زبان را بعنوان مهمترین سد و مانع در انتقال اطلاعات دانست. بنابراین ضرورت بکارگیری ماشین در پردازش و ترجمهی متون تبدیل به نیازی غیر قابل انکار شده است. اما مشکلاتی که بر سر راه ...

پایان نامه ارائه مدلی کارا بر اساس زیرترکیب‌ های استخراج شده از وی‍ژگی جهت تشخیص فعالیت های فیزیکی انسانی

مهندسی کامپیوتر ۱۴۰

پایان‌نامه دکتری در رشته مهندسی کامپیوتر (هوش مصنوعی) چکیده درک و استخراج اطلاعات از تصاویر و فیلم فصل مشترک اکثریت مسایل مربوط به بینایی ماشین است. یافتن قسمتهای اصلی و مفید یک فیلم و مدلسازی کنشهای بین این اجزا از اهداف اصلی آنالیز فیلم به شمار می‌رود. در دهه اخیر تشخیص فعالیت انسانی با استفاده از تصاویر ویدیویی به عنوان یک بحث چالش برانگیز در بینایی ماشین مطرح شده است. از ...

پایان نامه شناسایی تشکل های همپوشان در شبکه های پویا

مهندسی کامپیوتر ۸۲

پایان نامه ی کارشناسی ارشد در رشتهی مهندسی کامپیوتر- هوش مصنوعی چکیده شناسایی تشکل های همپوشان در شبکه های پویا بسیاری از ساختارهای پیچیده طبیعی و اجتماعی را می‌توان به صورت شبکه[1] در نظر گرفت. جاده‌ها، پایگاه‌های اینترنتی، شبکه های اجتماعی، ارتباطات سازمانی، روابط خویشاوندی، تبادل نامه‌های الکترونیک، تماس‌های تلفنی و تراکنش‌های مالی تنها چند نمونه از این شبکه‌ها هستند. ...

ثبت سفارش