مجموعه داده‏ Epinions

 
 

برای دریافت پیکره گرداوری شده که حدود۲ گیگا بایت حجم دارد، لطفا از طریق پیامک یا ایمیل زیر به ما اطلاع دهید تا پس از دریافت آدرس پستی شما، در صورتیکه در تهران هستید با پیک موتوری و در صورتیکه در شهرستان هستید از طریق پست DVD حاوی پیکره را برایتان ارسال نماییم. بخشی از هزینه دریافتی جهت ارسال پستی فایل می باشد…

در ضمن کلیه کدهای کار با پیکره و همچنین کدهای کار با وردنت موجود می باشد و برای دریافت کدها می توانید با ایمیل زیر مکاتبه نمایید.

universitydatainfo@yahoo.com

09359529058

 

دانلود پیکره:

رمز عبور فایل فشرده : ۰۹۳۵۹۵۲۹۰۵۸

یک سیستم توصیه گر به دنبال پیش بینی نرخ کاربر هدف به هر یک از آیتم ها و سپس ارائه ی پیشنهاد آیتم هایی به کاربر هدف است که بالاترین مقدار نرخ محاسبه شده توسط سیستم را دارند. در واقع این نرخ پیش بینی شده نمایان گر تشخیص سیستم از میزان علاقه ای است که کاربر هدف به یک آیتم دارد. حال هر چه این مقدار پیش بینی شده به واقعیت نزدیک تر باشد، تشخیص سیستم و ارائه ی پیشنهاداتش دقیق تر خواهد بود. برای اندازه گیری خطای یک سیستم توصیه گر، به دو گونه عمل می شود: آفلاین و آنلاین.

روش عمده در ارزیابی آنلاین، محاسبه ی میزان رضایت کاربران از ارائه ی پیشنهادات است. به عنوان یک راه اندازه گیری این رضایت، می توان پس از پیش بینی نرخی که کاربر ممکن است به یک آیتم بدهد و ارائه ی پیشنهاد آیتم های با بالاترین مقدار نرخ، به طور مستقیم از کاربر انسانی، میزان نزدیکی این پیشنهادات را با علایق واقعی وی را پرسید و به بیانی دیگر، به کاربران هدف اجازه دهیم تا خودشان سیستم را ارزیابی کنند. هم چنین می توان به طور غیرمستقیم عمل کرد. به بیان دقیق تر، اندازه گیری میزان اشتراک مجموعه  آیتم های پیشنهادی با مجموعه آن هایی که کاربر در آینده نرخ می دهد، راهی غیر مستقیمی در محاسبه ی میزان رضایت کاربر در یک ارزیابی آنلاین می باشد. برای توضیح بیش تر، باید بگوییم که در این روش مجموعه ی پیشنهادی را تشکیل داده و سپس منتظر بازدید و نرخ های جدید کاربر می شویم. با محاسبه ی میزان اشتراک این در مجموعه، میزان ارزیابی نسبتاً دقیقی از سیستم را انجام داد. البته در ارزیابی آنلاین یک سیستم توصیه گر، باید مراقب تغییر سلیقه های کاربران باشیم. این تغییر معمولاً خیلی زیاد نیست و باز هم می توان گفت که ارزیابی آنلاین روشی مناسب در مقایسه ی یک الگوریتم توصیه گر با انواع مشابه می باشد.

به هرحال، یکی از مشکلات عمده ی ارزیابی آنلاین، زمان زیادی است که باید منتظر بود تا کاربران در سیستم ثبت نام کرده، از آیتم ها بازدید کنند و پس از مدتی نیز نرخی به آیتم های بازدیدی دهند. معمولاً زمان این روش آن قدر زیاد می باشد که می توان گفت انتخاب روش ارزیابی آنلاین، برای مقایسه ی یک الگوریتم پیشنهادی تحقیقاتی که در یک پایان نامه ارشد ارائه شده، تصمیم گیری درستی نیست. پس بنابراین ما در جهت ارزیابی الگوریتم پیشنهادی خود، روش آفلاین را انتخاب کرده ایم. منتهی ممکن است سؤال زیر در ابتدا به ذهن خطور نماید:

“علایق واقعی کاربران موجود در مجموعه داده های آفلاین خود را چگونه تشخیص می دهید؟ تا با استفاده از آن بتوانید مقدار صحت پیشنهادات خود را محاسبه کرده و در کل به ارزیابی سیستم خود بپردازید.”

در پاسخ باید گفت که:

برای ارزیابی آفلاین[۱] یک سیستم توصیه گر با استفاده از مجموعه داده ای موجود[۲] [۲] مثل EpinionsAll، نیازی به تشخیص علایق واقعی کاربران مورد ارزیابی نیست. در واقع می توان با پیش بینی درصدی از نرخ های یک کاربر و سپس مقایسه آن با مقادیر واقعی نرخ ها، مقدار خطا  و دقت سیستم توصیه گر را بدست آورد. روند کامل  این نوع ارزیابی در ادامه را توضیح داده شده است.

۱-۱- آزمایشات تجربی آفلاین با استفاده از مجموعه داده های آماده

راه اندازی آزمایشی که در علوم کامپیوتر و عموماً زیرحوزه های مثالی یادگیری ماشین یا استخراج اطلاعات پرکاربرد است، به مجموعه داده هایی گفته می شود که شامل داده های پیشینه ای /مصنوعی و ترکیبی  تعاملات کاربر  باشد.

ایده  اساسی روش مذکور این است که مجموعه ای از پروفایل های کاربران، شامل ترجیحات آن ها مثل نرخ ها و تعاملات خرید و یا پیشینه کلیک های آنها، موجود باشد که بتوان آن را به دو قسمت مجزای آموزش  و آزمون  تقسیم کرد. الگوریتم ها سپس قسمت آموزشی را استفاده می کنند تا پیش بینی ها را در مورد قسمت پنهان آزمونی انجام دهند. مزیت این روش در آن است که می توان عملکرد[۳] الگوریتم های مختلف را با هم مقایسه کرد. و هم چنین قابلیت تنظیمات دلخواه اولیه روی بستر ارزیابی یک الگوریتم خاص، وجود دارد. به عبارت دیگر، برای مثال، می توان جهت ارزیابی الگوریتمی که به سمت حل مشکل شروع آهسته در سیستم های توصیه گر حرکت می کند، داده های آموزشی را طوری انتخاب کرد تا تُنُکی داده ها، و در نتیجه تعداد آیتم ها و یا کاربران با نرخ کم، زیاد باشد. اما به هر حال این خطر احتمالی، برای ارزیابی صحت پیشنهادات یک سیستم توصیه گر، وجود دارد که مجموعه داده های مصنوعی و شبیه سازی شده به سمت الگوریتمی خاص گرایش داشته باشند و در نتیجه با دیگر الگوریتم ها نامنصفانه رفتار کنند.

تُنُکی داده ای در یک مجموعه داده از روی فرمول (۳۸) بدستمی آید. در این فرمول  و  و  به ترتیب به معنی تعداد نرخ ها، تعداد کاربران و تعداد آیتم های موجود در مجموعه داده ی مورد نظر می باشد.

(۳۸)

در بخش بعد، در کنار معرفی مجموعه داده ی مورد استفاده در ارزیابی های خود، به محاسبه ی پراکندگی برای این مجموعه داده خواهیم پرداخت.

 

1-2- مجموعه داده ی مورد استفاده در ارزیابی ها

ما در ارزیابی های آفلاین خود از مجموعه داده ی Epinions استفاده کرده ایم. ما در ابتدا قصد استفاده از مجموعه داده ی جمع آوری شده توسط آقای Paolo Massa[77] را داشتیم. امّا الگوریتم های آیتم محور (در این جا منظور کتاب-محور است) پیشنهادی ما در این پایان نامه از سرموضوعات[۴] کتب هم استفاده می کنند. برای دسترسی به سرموضوعات هر کتاب بایستی ارتباط مجموعه داده ی Epinions با محیط داده های خارج از خود از جمله طبقه بندی موضوعی کتابخانه ی کنگره و آمازون، را برقرار کنیم. بنابراین به شماره کتاب سریال یکتای جهانی[۵] نیاز داشتیم.  از طرفی مجموعه داده ی فوق الذکر، برای کتب شماره ای مستقل و خود تعریف را داراست. در نتیجه ما تصمیم به خزش[۶] دوباره ی سایت Epinions گرفته و در طول پنجاه روز به جمع آوری اطلاعات کاربران و کتاب‎ ها از قسمت کتب سایت Epinions پرداختیم. این مجموعه داده ی جدید مزیت های بسیار زیادی را نسبت به نمونه ی قبلی [۷۷] دارد. معرفی کامل این مجموعه داده و تفاوت های کلیدی مزیت های بسیار نسبت به نمونه ی قبلی، به هم راه کاربردهای متنوع آن در حوزه های گوناگون (ارزیابی الگوریتم های اعتماد، ارزیابی روش های استخراج اطلاعات[۷]، ارزیابی روش های استنتاج موضوع یک کتاب و پردازش برچسب ها و نظرات در مورد یک کتاب، و مهم تر از همه ارزیابی الگوریتم های توصیه گر و پیش بینی نرخ) در ادامه آمده است.

در مجموعه داده ی جمع آوری شده توسط ما چهار جدول به شرح زیر وجود دارد:

  1. جدول کاربران
  2. جدول کتب
  3. جدول نرخ ها
  4. جدول اعتمادهای بین کاربران

جدول پنجمی، با نام فایل ها، نیز وجود دارد که در حال حاضر جهت ارزیابی های علمی کارایی ندارد اما محتوای صفحات سایت Epinions.com می باشد که حین جمع آوری داده ها، پردازش شده اند. هم چنین این جدول صفحات پردازش نشده ی مفیدی را نیز در خود جای داده است که از آن جمله می توان به صفحات نظرهای کاربران “روی نرخ ها و نظرات خوانندگان دیگر یک کتاب”، اشاره کرد. در جدول ۴ ساختار کلی این مجموعه داده نشان داده شده است.

جدول ۴- ساختار مجموعه داده ی جمع آوری شده (EpinionsAll)

جدول Files Info جدول کاربران(user) جدول نرخ ها(userBookRating) جدول کتب جدول اعتمادهای بین کاربرانUsers-Trust
fileID userID ratingID bookID trusted
pageLink Username userID bookISBN trusterUserID
filePath userRegDate bookInfo bookTitle trustedUserID
fileContent userStatus bookInfoType bookReviewsPage trustValue
userLocation Rate Date
  userPage ratingDate
  userMailAddress reviewPage
  reviewRating

 

در جدول ۵ نیز مقایسه ای آماری بین تعداد رکوردهای جداول در مجموعه داده ی جمع آوری شده و فعلی آورده شده است.

جدول ۵- آمار مجموعه داده  Epinions

  EpinionsAll(by Mohsen Abasi)
کاربران ۸۹,۹۲۶
آیتم ها ۵۲,۱۹۴
نرخ ها ۹۳,۷۰۸
اعتماد ها ۵۷۶,۳۲۷

 

از روی مقادیر جدول ۵ این طور معلوم است که:  این مجموعه داده ی جمع آوری شده ی توسط ما در طی انجام این پایان نامه تعداد ۸۹۹۲۶ کاربر، ۵۲۱۹۴ کتاب به هم راه شماره سریال جهانی و مشخصات آن ها، ۹۳۷۰۸ نرخ کاربری روی کتب و ۵۷۶۳۲۷ رابطه ی اعتماد صریح کاربران به یکدیگر را داراست. بنابراین پراکندگی مجموعه داده ی Epinions جمع آوری شده توسط ما، بر طبق فرمول استاندارد ((۳۸، برابراست با: ۰.۹۹۹۹۸۰

چون این عدد نزدیک به یک است، پراکندگی این مجموعه داده بسیار زیاد می باشد و بسیار مناسب برای محک الگوریتم های توصیه گری است که قصد غلبه بر تُنُکی ماتریس نرخ ها را دارند. علاوه بر پراکندگی بسیار داده در این مجموعه، دلیل دیگر انتخاب آن برای ارزیابی، موجود بودن ارتباط بین کاربران می باشد. همان طور که در قبل نیز توضیح داده شد، در سیستم پیشنهادی از روی روابط بین کاربران و شباهت سلایق آن ها به یکدیگر، در واقع با استفاده از اسنادFOAF کاربران، اقدام به تکمیل پروفایل آن ها می شود که با این کار حوزه های بیش تر مورد علاقه شان تشخیص داده می شوند. این روابط بین کاربری در یک شبکه اجتماعی و توسط خود کاربران ایجاد شده است. به دلیل موجود بودن ارتباطات بین کاربران، مجموعه Epinions  یک شبکه اجتماعی نیز می باشد و با استفاده آن می توان تأثیر تکمیل پروفایل کاربران از روی کاربران مشابه مرتبط با آن ها را در افزایش صحت پیشنهادات سیستم مشاهده کرد. کاربران در این شبکه اجتماعی با بازدید نرخ ها و توضیحات دیگر کاربران، روی آیتم هایی که خودشان قبلاً بازبینی کرده اند، اقدام به برقراری ارتباط “اعتماد” از خود به کاربران با نطرات مشابه خود می کنند. به عنوان نمونه فرض کنید که کاربر A پس از خواندن کتابی به آن نرخ ۵ (بالاترین میزان علاقه) را می دهد. این کاربر وقتی با مشاهده نظرات و نرخ کاربر B متوجه می شود که او نیز به همان کتاب یا چندین کتاب مشابه دیگر ابراز علاقه بالا کرده است، به آن کاربر اعتماد کرده و سعی می کند سایر کتبی که کاربر B به آن ها علاقه دارد را نیز بخواند. در واقع کاربر A کاربر B را در نظرات و علاقه ها و روحیات شبیه خودش تشخیص می دهد. بنابراین از اعتماد کاربر A به کاربر B می توان در جهت تکمیل پروفایل A و تشخیص بیش تر علاقه های وی استفاده کرد. در این مجموعه داده تعداد ۵۷۶۳۲۷ روابط اعتماد از نوع صریح وجود دارد.

 

1-3- مجموعه داده ی کتب

این مجموعه داده از سایت آمازون جمع آوری شده است. در آن ۴ جدول به شرح زیر وجود دارد:

v     جدول Amazon Books

o       این جدول شامل اطلاعات کتب موجود در آمازون می باشد. این اطلاعات شامل شماره جهانی استاندارد ISBN کتاب، عنوان، رتبه ی فروش کتاب در آمازون، شماره ISBN کتب مشابه، شماره ID سرموضوعاتی که کتاب به آن ها تعلق دارد، و تعداد Reviewها و نرخ دهی میانگین به این کتاب

v     جدول Amazon Subject_Headings

o       این جدول حاوی اطلاعاتی درباره ی سرموضوعات کتب سایت آمازون می باشد. این اطلاعات شامل نام، شماره ی سرموضوع در سایت آمازون، و سرموضوع پدر (در سلسله مراتب سرموضوعات) می باشد.

v     جدول Amazon Book Subject_Heading

o       این جدول بیان می کند که هر کتاب در چه سرموضوعاتی جای دارد.

v     جدول Amazon Ratings

o       این جدول شامل شماره یکتای مشتری های آمازون، نرخ هایی که به کتب داده اند، تاریخ نرخ دهی و هم چنین تعداد نظراتی که در مورد هر نرخ داده شده است و نظر کلی مشتریان در مورد مفید بودن یا نبودن نرخ مورد نظر

جدول Amazon Books(393560 رکورد) جدول Amazon Subject_Headings(13171 رکورد) جدول Amazon Book Subject_Heading(1440213 رکورد) جدول Amazon Ratings(4591301 رکورد)
bookID shID bookID bookID
ISBN name shID date
Title Number (in Amazon) customer
Sales Rank ParentShID rateValue
similar votes
categories helpful
reviews

 

 

با سلام

برای دریافت پیکره گرداوری شده که حدود۲ گیگا بایت حجم دارد، لطفا از طریق پیامک یا ایمیل زیر به ما اطلاع دهید تا پس از دریافت آدرس پستی شما، در صورتیکه در تهران هستید با پیک موتوری و در صورتیکه در شهرستان هستید از طریق پست DVD حاوی پیکره را برایتان ارسال نماییم. بخشی از هزینه دریافتی جهت ارسال پستی فایل می باشد…

در ضمن کلیه کدهای کار با پیکره و همچنین کدهای کار با وردنت موجود می باشد و برای دریافت کدها می توانید با ایمیل زیر مکاتبه نمایید.

universitydatainfo@yahoo.com

09359529058

رمز عبور فایل فشرده : ۰۹۳۵۹۵۲۹۰۵۸

 

[1]Offline evaluation

[2](Pre-collected / historical) dataset

[3]performance

[4]Subject Headings

[5]International Serial Book Number (ISBN)

[6] Crawl

 

[7]Information Retrieval (IR) 

Comments (1) Posted to ارزیابی سیستم های توصه گر 10/30/2014 Edit

انتشار مقالات اولین کنفرانس پردازش خط و زبان فارسی


مقالات ارائه‌شده در نخستین کنفرانس پردازش خط و زبان فارسی در وب‌گاه همایش‌های علمی دانشگاه سمنان قرار گرفت.

نخستین کنفرانس پردازش خط و زبان فارسی در ۱۵ و ۱۶ شهریورماه ۱۳۹۱ در دانشگاه سمنان برگزار شد.

علاقه‌مندان می‌توانند مقالات این کنفرانس را از طریق پیوند زیر دریافت نمایند:
http://conf.semnan.ac.ir/index.aspx?siteid=49&pageid=3275
 
 مقالات مرتبط با کارهای من نیز از پیوندهای زیر قابل دانلود می باشد:
 
ارائه یک ابزار ارزیابی خودکار خلاصه‏سازهای چکیده‏ای فارسی با بهره‏گیری از شبکه واژگان  
 
طراحی ابزار پارسر زبان فارسی  
 
طراحی یک سیستم توصیه‏گر ترکیبی معنایی با استفاده از تکنیک‏های پردازش زبان طبیعی فارسی  
 
دسته بندی روش های محاسبه میزان تشابه معنایی لغات و جملات فارسی با بهره گیری از شبکه واژگان
 

Comments (3) Posted to ابزار ارزیابی خلاصه ها , ارزیابی سیستم های توصه گر , پردازش متن 04/28/2013 Edit

طراحی یک سیستم توصیه‏گر ترکیبی معنایی با استفاده از تکنیک‏های پردازش زبان طبیعی فارسی


با افزایش سریع اطلاعات، به سیستمی توصیه‏گر که با دادن پیشنهادات مناسب با علایق یک کاربر بر اساس پیشینه ی عملکرد او، وی را از صرف وقت در مرور تمام آیتم‏ها باز دارد، به شدت احساس نیاز می‌شود. سیستم توصیه‏گر با تحلیل رفتار کاربر خود، اقدام به پیشنهاد مناسب‏ترین اقلام به وی می‏نماید. حوزه ی مفاهیم موجود در بسیاری از سیستم‏های توصیه‏گر فعلی، محدود به دانش موجود در خود سیستم بوده و از منابع عظیم دانش خارج از سیستم، مانند وب معنایی و داده‏های پیوندی استفاده نمی‏شود. در این مقاله سیستم توصیه‏گر ترکیبی‏ای معرفی شده است که از مفاهیم و روابط موجود بین آنها در پایگاه‏های خارج از خود استفاده می‏کند. در نتیجه یکی از قسمت‏های اصلی سیستم پیشنهادی، استخراج مفاهیم از آیتم‏ها و رفتار کاربران می‏باشد؛ که این کار با تکنیک‏های پردازش زبان طبیعی مانند ریشه‏یابی کلمات کلیدی آیتم‏ها میسّر می‏باشد. همچنین در سیستم پیشنهادی از نگاشت معنایی ریشه‏های بدست آمده، به شبکه واژگان فردوس‏نت استفاده شده است. با این‏کار به دلیل گسترش معنایی مجموعه کلمات کلیدی و ویژگی‏های آیتم‏ها، صحت توصیه‏ها افزایش خواهد یافت. در پایان نیز با استفاده از حدود 81 هزار کتاب دسته‏بندی شده استخراجی از سایت Acm و میلیو‏ن‏ها نرخی که هزاران کاربر به یک میلیون مقاله/کتاب موجود در مجموعه داده Epinions داده‏اند، نشان داده خواهد شد که مشکل "شروع آهسته" تا حد زیادی قابل حل می‏باشد.

مقدمه
سیستم توصیه‏گر به عنوان یک سیستم ابتکاری که اطلاعات مفید را پیشنهاد می‏دهد و می‏تواند در دامنه‏های گوناگون بکار رود، در نظر گرفته می‏شود [1]. سیستم توصیه‏گر یا سامانه ی پیشنهادگر با تحلیل رفتار کاربر خود، اقدام به پیشنهاد مناسب‏ترین اقلام (داده، اطلاعات، کالا و ... ) به وی می‏نماید.
این گونه سیستم ها در واقع جهت حل مشکلات ناشی از حجم فراوان و رو به رشد اطلاعات ارائه شده است و به کاربر خود کمک می‏کند تا در میان حجم عظیم اطلاعات، سریع تر به هدف خود دست یابد [2]. سیستم‏های توصیه‏گر به کاربرانی که از بین حجم بالای اطلاعات به دنبال نوعی خاص از اطلاعات مرتبط با اولویت‏هایشان هستند، پیشنهادات شخصی شده‏ای را ارائه می‏دهد. این نوع سیستم‏ها با توانایی‏ای که در جمع آوری اطلاعات از رفتار و حرکت کاربران، دسته بندی و تفسیر آنها دارند، امکانی فراهم آورده‏اند که کاربران با صرف زمان و انرژی کمتر به اطلاعات مناسب‏تری دسترسی پیدا کنند.
امروزه سعی در ساخت "سیستمی‏ توصیه‏گر" با درصد خطای کم و سرعت بالا در تمام شرایط به یکی از پرطرفدارترین حوزه‏های تحقیقاتی دانشگاهی تبدیل شده است. به‏طوری‏که از سال 2010 به بعد تعداد 9250 مقاله و تنها در سال 2011 تعداد 4170، در رابطه ی مستقیم یا غیرمستقیم با این موضوع، در کنفرانس‏ها و مجلات گوناگون سراسر دنیا پذیرفته شده‏اند.
در سیستم‏های توصیه‏گر با مقیاس دنیای واقعی به دلیل خرید مقطعی (مانند وسایل الکترونیکی) و یا به طور کلی کثرت تعداد آیتم‏های موجود جهت پیشنهاد، مشتری‏ها نوعاً درصد کمی از آیتم‏ها را نرخ گذاری می‏کنند. این مشکل را پراکندگی  می‏نامیم. این مشکل زمانی رخ خواهد داد که تعداد نرخ‏ها در مقایسه با تعداد آیتم‏ها کوچک باشد [3]. مساله "شروع آهسته"  نیز مشکل دیگری است که می‏توان آن را نوع خاصی از مشکل پراکندگی به حساب آورد. در ابتدای شروع به کار، سیستم تا مدتی نمی‏تواند پاسخ مناسبی ارائه کند؛ زیرا پایگاه دانش آن از تعداد محدودی نمونه ساخته شده است. این مشکل همچنین در هنگام کار با آیتم جدید و یا کاربر جدید نیز پیش می‏آید. برای بسیاری از مسائل ارائه شده، با گذر زمان و استفاده ی مکرر کاربران، پایگاه دانش با استفاده از اطلاعات کاربران تقویت می‏شود ولی در این فاصله ی زمانی، کارایی سیستم ممکن است از سطح قابل قبولی برخوردار نباشد.
 سیستم‏های توصیه‏گر بر اساس تخمین نرخ (صریح و یا ضمنی [4]) و چگونگی پیشنهادات به چهار دسته تقسیم می‏شوند:

توصیه‏گر براساس محتوا
به کاربری که یک کتاب را در گذشته دیده و یا خریده است، کتب با محتوای مشابه را می‏توان پیشنهاد داد. 
توصیه‏گر همبستگی یا اشتراکی
ایده: اگر کاربران علایق یکسانی در گذشته داشته‏اند -برای نمونه، اگر آنها کتاب یکسانی را دیده‏اند یا خریده‏اند- آنها سلیقه‏های مشابهی‏ در آینده خواهند داشت. 
روش دانش‏محور
استفاده از دانش خارج از سیستم در مواردی که نمی‏توان تنها بر پیشینه ی خریدها تکیه کرد.
توصیه‏گر ترکیبی
ایده ی سیستم‏های توصیه‏گر می‏تواند به کاربرانی که در زمینه‏های جستجو، مرتب سازی، دسته‏بندی، پالایش اطلاعات و به اشتراک‏گذاری کار می‏کنند کمک نماید. بنابراین می‏توان با دسته‏بندی آیتم‏ها (در این تحقیق منظور مقالات است) و سپس توصیه ی آیتم‏های دسته ی مورد علاقه ی کاربر، سیستمی توصیه‏گر طراحی نمود.
یکی از مهم‏ترین قسمت‏های سیستم‏های توصیه‏گر محتوایی و یا ترکیبی، واحد خواندن و پردازش ویژگی‏های آیتم‏ها می‏باشد. در سیستم پیشنهادی نیز ابتدا کلمات کلیدی مقالات با استفاده از تکنیک‏های پردازش زبان، ریشه‏یابی شده و سپس با نگاشت آنها به واحدهای معنایی موجود در شبکه ی واژگان فردوس‏نت ، به مجموعه‏ای از واژگان هم‏معنی تبدیل می‏شوند. سیستم توصیه‏گر پیشنهادی را می توان سیستمی هوشمند و معناگرا نامید؛ بدین دلیل که از تکنولوژی‏های وب معنایی مانند داده‏ها و روابط موجود در ابر داده‏های پیوندی باز (قابل دسترس عموم) جهت بهبود درستی پیشنهادات خود استفاده می‏کند.
وب معنایی وبی است که در آن روابط بین داده‏ها مشخص می‏باشد. یعنی با داشتن یک داده می توان به نمونه های مشابه یا مرتبط با آن داده دسترسی داشت. در واقع وب معنایی، وب داده‏ها و یا شبیه یک پایگاه داده ی جهانی است. اولین قدم تحقق آن، قرار دادن داده‏ها و تعریف روابط بین آنها روی وب در شکلی است که ماشین بتواند به طور طبیعی معانی آن را درک نماید. در واقع می-توان گفت وب معنایی، وبی مستقل و جدا نیست و گسترشی از وب کنونی است که در آن به اطلاعات، معنای ساخت یافته‏ای می‏دهند. عبارت داده ی پیوندی  به تلاش‏هایی برای انتشار و اتصال داده‏های ساخت یافته  بر روی وب اشاره دارد. "وب معنایی" هدف یا نتیجه نهایی است. "پیوند زدن داده‏ها" زمینه را برای تحقق این هدف فراهم می‏کند.
در بخش بعد کارهای مرتبط به اجمال معرفی شده‏اند. در بخش سوم، تکنیک‏های پردازش زبان طبیعی بکار رفته در سیستم توصیه‏گر پیشنهادی معرفی گردیده؛ شِمای کلی سیستم در بخش چهارم آمده است. در بخش پایانی نیز روش ارزیابی سیستم پیشنهادی به تفصیل ذکر گردیده است.
کارهای مرتبط
می‏توان گفت که پیدایش اصطلاح "سیستم‏های توصیه‏گر" تقریبا به اواسط دهه 1990 برمی گردد. در آن زمان، محققان بر روی ساختار‏های نرخ‏گذاری، متمرکز شده بودند. از اواسط دهه 90 تا کنون تعداد زیادی سیستم توصیه‏گر برای کمک به کاربران در رسیدن به اطلاعات مورد علاقه شان پیاده سازی شده اند [5]. سیستم GCBR [6] و سیستم GroupLens [7]، توصیه‏گر مقالات و اخبار یوزنت و Bellcore Video Recommender [8] سیستم پیشنهاد فیلم نیز در ادامه طراحی و پیاده سازی شدند.
سیستم پیشنهاد آهنگ [9] که با استفاده از تعاملات کاربر درون شبکه‏های اجتماعی و دیگر داده‏های انتشار یافته درون حوزه داده‏های پیوندی باز، همچنین با بهره گیری از تکنولوژی وب معنایی، استخراج سه‏تایی‏های RDF از وب سایت‏های آهنگ و پرس‏وجوی معنایی روی آنها، پیشنهادات خود را ارائه می‏دهد، نیز یکی از این سیستم‏ها می‏باشد. شیوه پیشنهاددهی جدید گفته شده در [10] ترجیحات دیگر کاربران در سیستم اشتراکی چندرسانه‏ای را بر اساس دانش کشف شده در شبکه اجتماعی چند بعدی(MSN)، فراهم می‏کند. این سیستم، فعالیت‏های کاربران را در لایه های جداگانه‏ی MSN در نظر می‏گیرد. این روند و وزن-دهی شخصی‏ به هر لایه، توصیه‏ها را شخصی می‏کند. علاوه بر این سیستم‏های عملیاتی، تحقیقاتی نیز در زمینه ی ترکیب سیستم‏های توصیه‏گر و ساخت کاراترین سیستم ممکن توسط Balabanovic، Bruke و Nguyen انجام شده است [11].
برخی کارها به دسته‏بندی برچسب‏ های کاربران در شبکه‏های اجتماعی پرداخته‏اند. سیستم توصیه‏گر اجتماعی معرفی شده در [12] به تقسیم برچسب‏ها به چهار دسته می‏پردازد. این سیستم ابتدا فرض می‏کند که مفهوم برچسب، در پایگاه‏های دانشی مثل  Yago[13] موجود است و سپس آن را به معنی مرتبط نگاشت می‏کند. اگر مفهوم برچسب در هیچ پایگاهی موجود نبود، با استفاده از تکنیک‏های پردازش زبان، جداکردن برچسب‏ها و سپس تشخیص نقش برچسب مانند اسم و فعل و غیره، آن را به یک واحد معنایی‏‏ موجود در پایگاه دانش نگاشت و سپس دسته ی معادل آن واحد را بدست می‏آورد.
تکنیک‏های بکار رفته از پردازش زبان طبیعی
برای بهبود معیار بازیابی (Recall) و درستی (Precision) سیستم، باید کلمات کلیدی متعلق به یک ریشه ی زبانی تشخیص داده شوند و یا به عبارت دیگر، ریشه‏یابی یا ریخت‏شناسی شوند. ریخت‏شناسی بخشی از علم پردازش زبان طبیعی است که به بررسی ساختار کلمات و ریشه‏یابی واژگان می‏پردازد. به عمل بیرون آوردن ریشه اصلی یک واژه، ریشه‏یابی (stemming) گویند. ریشه‏یابی باعث بهبود چشمگیر پیشنهادات سیستم می‏شود. برای مثال، "نتایج" و "نتیجه‏ها" یک معنی دارند؛ اما با مقایسه مستقیم توسط ماشین، دو کلمه متفاوت تشخیص داده می‏شوند. با ریشه‏یابی، هر دو به کلمه ی یکسان "نتیجه" تبدیل خواهند شد و میزان شباهت اسناد دربرگیرنده خود به یکدیگر را بالا خواهند برد. پس بهتر است با تبدیل هر دو کلمه به ریشه‏شان، آنها را دو کلمه یکسان در نظر گرفت.
در ریشه یابی کلمات کلیدی، از یک ریشه یاب معنایی بهره گرفته شده است. بدین صورت که فرهنگ لغتی شامل تمامی لغات فارسی تهیه گردیده و در ریشه یابی لغات، حذف پسوندها به ترتیبی خاص صورت پذیرفته و صحت نتیجه ی جاری از طریق معنادار بودن کلمه و وجود آن در فرهنگ لغت، مورد بررسی قرار می گیرد. لغاتی مانند جمع های مکسر جزو استثنائات محسوب می گردند؛ بنابراین فرهنگ لغتی نیز حاوی جمع های مکسر تهیه شده و ریشه ی این لغات مستقیماً بیان می گردد.
پس از مرحله ی یافتن ریشه ی هر لغت، مرحله ی نگاشت کلمه کلیدی به یک واحد معنایی در شبکه ی واژگان فردوس‏نت می‏باشد. نحوه‏ی کار به این صورت است که شبکه واژگان، لغات را در گروه‏های هم‏خانواده قرار می‏دهد. هر کدام از این گروه‏ها شامل لغاتی است که در یک متن می‏توانند به جای یکدیگر استفاده شوند و بیانگر یک مفهوم خاص هستند که به وسیله مفاهیم معنایی و روابط لغوی به یکدیگر مرتبط می‏شوند که نتیجه این کار شبکه‏ای است متشکل از لغات و مفاهیم که از نظر معنایی با یکدیگر ارتباط دارند. بنابراین می‏توان به جستجو در بین لغات یک شبکه واژگان، هم از نظر املایی و هم از نظر معنایی پرداخت.
سیستم توصیه‏گر پیشنهادی
در هر سیستم توصیه‏گری هدف نهایی، تصمیم به توصیه یا عدم توصیه یک آیتم به یک کاربر می‏باشد. سیستم توصیه‏گر پیشنهادی با بررسی تعدادی مقاله ی جدید ورودی، توصیه یا عدم توصیه آنها به کاربر جاری را تصمیم‏گیری می‏کند. به بیان دقیق‏تر این سیستم با بررسی مقالات خوانده شده توسط کاربر و تشخیص دسته ی آنها که مشخص کننده دسته‏های مورد علاقه کاربر می‏باشد؛ پس از تشخیص دسته ی یک مقاله ی جدید، در مورد پیشنهاد به خواندن این مقاله به کاربر تصمیم می‏گیرد.
یکی از ویژگی‏های اصلی هر مقاله، کلمات کلیدی هستند؛ زیرا آنها موضوع اصلی مقاله را بیان می‏کنند. بنابراین با تشکیل برداری از کلمات کلیدی مقالات و مقایسه ی بردار دو مقاله، می‏توان شباهت موضوعی مقالات را تشخیص داد. برای رسیدن به دقت بالاتر بایستی حوزه معنایی کلمات کلیدی مقاله مشخص شوند. بدون این کار دو کلمه کلیدی هم‏خانواده ظاهراً متفاوت، مانند "سیستم پیشنهادکننده" و "سیستم توصیه‏گر"، غیرمتشابه می‏باشند. برای تشخیص حوزه معنایی یک کلمه باید آن را به واحد معنایی مربوطه‏اش نگاشت داد. برای تحقق این امر، استفاده از ریشه کلمه به جای خود آن، نتایج بسیار مناسب‏تری را به‏همراه خواهد داشت. در سیستم توصیه‏گر پیشنهادی با گرفتن کلمات کلیدی هر مقاله و ریشه‏یابی آنها و سپس نگاشت به واحد معنایی موجود در شبکه واژگان فردوس‏نت، در واقع دسته یک مقاله به طور معنایی مشخص می‏شود. با انجام عملیات گفته شده در فوق، مثلاً دو مقاله "سطوح دسترسی در شبکه‏های Ad-Hoc" و "امنیت در شبکه‏های بی‏سیم" (به‏درستی) در یک دسته قرار خواهند گرفت. اما با بررسی صرفاً خود کلمات کلیدی بصورت خام، تشابه بسیار کمتری برای آنها درنظر گرفته خواهد شد که در نتیجه ی آن، به کاربری که یکی را خوانده، دومی از طرف سیستم (به غلط) توصیه نخواهد شد.
عملکرد سیستم توصیه‏گر پیشنهادی متشکل از دو قسمت است: یادگیری و تست. در بخش یادگیری، تعدادی مقاله به عنوان ورودی به سیستم داده شده و حوزه معنایی و تمام کلمات هم‏خانواده کلمات کلیدی آنها، با ثبت دسته‏ی مقاله، درون پایگاه داده ذخیره می‏شوند.
 در بخش تست نیز ورودی، مقاله ی جدیدی است که سیستم می‏خواهد روی توصیه‏کردن یا نکردن آن به کاربر، تصمیم بگیرد. در این بخش، کلمات کلیدی مقاله ی جاری پس از طی مراحل پردازش زبانی و معنایی گفته شده در بخش یادگیری، با کلمات و عبارات هر دسته که در پایگاه داده ذخیره شده‏اند، مقایسه می‏شوند. در این مقایسه، زاویه بین برداری از کلمات کلیدی مقاله جدید با بردار کلمات کلیدی دسته ی موجود در پایگاه داده، با استفاده از شباهت کسینوسی مطابق با فرمول (1) محاسبه می‏شود. با توجه به این نوع شباهت معنایی، هر چه کسینوس زاویه ی بین دو بردار کمتر باشد، آن دو بردار تطابق بیشتری داشته و در نتیجه شباهت بیشتری دارند. 

پس از مقایسه فوق به ازای هر دسته، دسته ی با بیشترین مقدار شباهت به مقاله ی جدید، به عنوان حوزه ی موضوعی آن، تشخیص داده می‏شود. 
پس اگر دسته ی تشخیص داده شده، جزو دسته‏های مورد علاقه کاربر بود (یعنی دسته‏هایی که کاربر سابقه خواندن چندین مقاله ی آنها را دارد)، این مقاله به او برای خواندن پیشنهاد می‏شود. 
ارزیابی سیستم
در سیستم پیشنهادی، تکنولوژی‏های وب معنایی، مانند داده‏های پیوندی، برای حل مشکل "شروع آهسته" و یا به‏طورکلی "پراکندگی داده"  به‏کار می‏روند. بنابراین مجموعه داده‏ای که پراکندگی بسیاری را در ماتریس نرخ‏گذاری کاربر-آیتم خود داشته باشد، محک خوبی برای ارزیابی این نوع سیستم خواهد بود. از طرف دیگر به دلیل موجود نبودن مجموعه داده‏ای مناسب به زبان فارسی، جهت ارزیابی سیستم‏های توصیه‏گر همراه با داده‏ها و ارتباطات بین کاربری در شبکه‏ای اجتماعی،  تصمیم به مونتاژ کردن سیستم پیشنهادی به زبان انگلیسی و ارزیابی آن در بستری به این زبان گرفته شد. به همین دلیل، مجموعه داده Epinions [14] انتخاب شده است. این مجموعه توسط Paolo Massa در یک خزش  تولید شده است و شامل حدود 132هزار کاربر با تعداد 13,668,319 نرخ روی حدود 1,560,144 مقاله/کتاب می‏باشد. بنابراین پراکندگی داده در جدول نرخ‏های کاربر-آیتم طبق فرمول (2) حدود 0.99993 می‏باشد و چون این عدد نزدیک به یک است، پراکندگی این مجموعه داده، بسیار زیاد می‏باشد.
 
در فرمول فوق نماد R بیانگر مجموعه نرخ‏ها، I مجموعه آیتم‏ها و U مجموعه کاربران می‏باشد. نماد || نیز اندازه مجموعه را بیان می‏کند. به‏عنوان نمونه |R| یعنی تعداد نرخ‏ها.
علاوه بر پراکندگی بسیار داده در این مجموعه، دلیل دیگر انتخاب آن برای ارزیابی، موجود بودن ارتباط بین کاربران می‏باشد. همان‏طور که قبلا نیز توضیح داده شد، در سیستم پیشنهادی از روی روابط بین کاربران و شباهت سلایق آنها به یکدیگر، اقدام به تکمیل پروفایل‏ها می‏شود که با این‏کار حوزه‏های بیشتر مورد علاقه کاربران تشخیص داده می‏شوند. این روابط بین کاربری در یک شبکه اجتماعی و توسط خود کاربران ایجاد شده است. به دلیل موجود بودن ارتباطات بین کاربران، مجموعه Epinions  یک شبکه اجتماعی نیز می‏باشد و با استفاده از آن می‏توان تاثیر تکمیل پروفایل کاربران را از روی کاربران مشابه مرتبط با آنها در افزایش صحت پیشنهادات سیستم مشاهده کرد.
کاربران در این شبکه اجتماعی با بازدید نرخ‏ها و توضیحات دیگر کاربران روی آیتم‏هایی که خودشان قبلاً بازبینی کرده‏اند، اقدام به برقراری ارتباط اعتماد از خود به کاربران مشابه خود می‏کنند. به عنوان نمونه فرض کنید که کاربر A پس از خواندن کتابی به آن نرخ 5 (بالاترین میزان علاقه) را می‏دهد. این کاربر وقتی با مشاهده نظرات و نرخ کاربر B متوجه می‏شود که او نیز به همان کتاب یا چندین کتاب مشابه دیگر ابراز علاقه بالا کرده‏ است، به آن کاربر اعتماد کرده و سعی می‏کند سایر کتبی که کاربر B به آنها علاقه دارد را نیز بخواند. در واقع کاربر A کاربر B را در نظرات و علاقه‏ها و روحیات شبیه خودش تشخیص می‏دهد. بنابراین از اعتماد کاربر A به کاربر B می‏توان در جهت تکمیل پروفایل A و تشخیص بیشتر علاقه‏های وی استفاده کرد. در این مجموعه، 841,372 ارتباط بین کاربری (717,667 اعتماد و 123,705 عدم اعتماد) وجود دارد که حدود 85 هزار کاربر این اعتماد/عدم‏اعتماد را دریافت کرده‏اند؛ که به ازای هر یک می‏توان به تکمیل خودکار پروفایل وی از روی علاقه‏های کاربران مورد اعتماد او اقدام کرد و در نتیجه، کتابهایی را (بدرستی) به وی توصیه کرد که مشابه کتب خوانده شده او نباشند اما مورد علاقه ی کاربران مورد اعتماد وی باشند. پس می‏توان گفت که با استفاده از تکنولوژی شبکه‏های اجتماعی و ارتباط بین کاربران، میزان معیار Recall (فرمول 6) بالاتر خواهد رفت و سیستم توصیه‏گر دقیق‏تری را خواهیم داشت. در زیر معیارهایی برای ارزیابی "صحت پیش‏بینی‏ها"ی سیستم در مورد آیتم‏های مورد علاقه کاربران و "صحت دسته‏بندی" آیتم‏ها (به دو دسته آیتم‏های مورد توصیه و عدم توصیه به کاربر) توسط سیستم، بیان خواهند شد.
 
صحت پیش‏بینی‏ها
هنگام ارزیابی توانایی یک سیستم جهت پیش‏بینی علاقه یک کاربر به آیتمی خاص، خطای مطلق میانگین  (فرمول 3) [15] به طور حتم مشهورترین معیار است. در این فرمول، rec(u,i) نرخ پیش‏بینی شده‏ی کاربر u به آیتم i می‏باشد. Testsetu نیز مجموعه آیتم‏های مورد بررسی برای توصیه به کاربر u می‏باشد.

MAE انحراف میانگین بین امتیازهای پیشنهادی محاسبه شده و مقدار نرخ‏های واقعی را محاسبه می‏کند. اما در ارزیابی سیستم پیشنهادی، از این معیار به‏دلیل ضعف‏های آن استفاده نشده است. یکی از مشکلات معیار MAE اینست که همه‏ی خطاها را در حدس نرخ‏ها یکسان وزن‏دهی می‏کند. برای مثال، فرض کنید که مجموعه داده‏ای شامل 100 کاربر است که یکی از آنها 297 نرخ (کاربر سنگین ) و بقیه هرکدام 3 نرخ (کاربران شروع سرد ) داده‏اند. واضح است که روش CF برای "کاربر سنگین" خوب عمل کرده و برای کاربران شروع آهسته ضعیف عمل می‏کند. اما معیار MAE مقدار خطای بالایی را گزارش می‏دهد که این مقدار بالا برای کاربر سنگین اشتباه خواهد بود. در مجموعه داده‏ی Epinions نیز حدود 53 درصد از کاربران کمتر از 5 آیتم را بازبینی و نرخ‏گذاری کرده‏اند. به همین جهت برای ارزیابی صحیح تر، معیار "خطای مطلق میانگین کاربر"  (فرمول 4) [16] انتخاب گردیده است. در این معیار، خطای MAE جداگانه برای هر کاربر محاسبه و سپس میانگین بدست می‏آید. 

صحت دسته‏بندی‏ها
هدف دسته‏بندی آیتم‏ها (به دو دسته‏ی آیتم‏هایی که باید توصیه شوند و آنهایی که نباید ‏توصیه شوند) در مفاهیم توصیه محصولات، تعیین n عدد از مربوط‏ترین آیتم‏ها برای یک کاربر می‏باشد. Precision و Recall دو معیار از شناخته شده‏ترین معیارهای دسته‏بندی می‏باشند؛ البته عموماً برای اندازه‏گیری کیفیت اعمال استخراج اطلاعات استفاده می‏شوند. Precision (فرمول 5 ) بیان می‏کند که از مجموعه پیشنهادات، چند درصد درست هستند و Recall (فرمول 6) نیز بیان می‏کند که چند درصد از آیتم‏های مورد علاقه کاربر به او پیشنهاد شده‏اند. در این دو فرمول، منظور از TrustSet مجموعه‏ای از آیتم‏هاست که باید به کاربر پیشنهاد داده شوند و RecognizedSet نیز مجموعه آیتم‏هایی است که توسط سیستم به کاربر توصیه شده است.  
به علت موازی عمل کردن این معیارها، برای جمع آنها باید میانگین هارمونیکی‏شان (فرمول 7) گرفته شود.

نتیجه‏گیری
استفاده از تکنیک‏های پردازش زبان فارسی باعث بهبود چشم‏گیری در صحت پیشنهادات ارائه شده ی سیستم می‏شود. زیرا به عنوان مثال بکارگیری تکنیک ریشه‏یابی و استفاده از ریشه یک کلمه کلیدی به جای خود آن مقدار شباهت محتوای یک مقاله به علاقه‏های پیشین یک کاربر را افزایش می‏دهد.
علاوه بر این سیستم ما از داده‏های پیوندی موجود در دنیای وب معنایی مانند متن و برچسب‏های کاربران موجود در سایت Amazon و یا توضیح کتب در DBPedia که نسخه معنایی WikiPedia می‏باشد، استفاده می‏کند. استفاده از آنها، باعث گسترش پروفایل و حوزه علاقه‏های کاربر می‏شود. برای نمونه فرض کنید که موضوع "فلسفه" جزو علاقه‏های پیشین یک کاربر ثبت شده است. در داده‏های پیوندی نیز بین دو کلمه "فلسفه" و "صدرالمتاهلین" ارتباطی جزء به کل وجود دارد که این باعث اضافه شدن "صدرالمتاهلین" به لیست علاقه‏های کاربر می‏شود. در نتیجه این بهبود باعث پیشنهاد کتب ارزشمند نوشته "صدرالمتاهلین" به وی خواهد شد.
مشکل سیستم پیشنهادی شاید زمان طولانی ارایه ی یک پیشنهاد به کاربر باشد. این مدت زمان زیاد به خاطر استفاده از دانش موجود در خارج سیستم می‏باشد. این دانش خارجی باید از طریق سرویس‏های اینترنت و پرس‏وجو از SparQL Endpoint هایی که حاوی داده‏های پیوندی مورد نیاز سیستم می‏باشند، بدست آید. در کارهای آتی می‏توان با اضافه نمودن امکان ذخیره داده‏های مورد نیاز، در هنگامی که کاربر از سیستم استفاده نمی‏کند و سپس پردازش آفلاین با سرعت زیاد در هنگام توصیه به کاربر، این زمان را به حداقل رساند.
ضمایم
معیار F_Measure که با نام F_1 نیز بکار برده می‏شود، میانگین هارمونیکی دو معیار Precision و Recall می‏باشد (به طور کلی سه نوع میانگین حسابی، هندسی و هارمونیکی وجود دارد.). این نوع میانگین برای اعضای متقابل، مانند بدست آوردن سرعت متوسط در یک حدفاصل معین می‏باشد. فرمول کلی این میانگین در (8) بیان شده است. n تعداد معیارها و xi نیز مقدار هر معیار می‏باشد.
برای همه نوع داده، از بین سه میانگین بیان شده در فوق، میانگین هارمونیکی، حداقل مقدار و میانگین معمول حسابی، بیشترین مقدار را دارند.

Comments (0) Posted to ارزیابی سیستم های توصه گر 03/19/2013 Edit

زیر سیستم های راهنما و فیلترینگ

 


در چارچوب پیشنهادی مورد نظر ما هر سیستم توصیه گر از دو زیر سیستم تشکیل شده است. در ابتدا به تعریف اولی می پردازیم.
-  زیرسیستم تعاملی عهده دار وظیفه¬ی راهنمایی کاربر است. بنابراین، ما آن را راهنما می نامیم. به عبارت دیگر، راهنما باید پاسخ دهد که هر یک از توصیه ها چه وقت و چگونه باید به کاربر نشان داده شود.
-  زیرسیستم غیر تعاملی عهده دار وظیفه¬ی انتخاب موارد جالب و مفید در میان مقدار زیادی از آنها می باشد. بنابراین، ما آنرا فیلتر می نامیم. به عبارت دیگر، فیلتر باید پاسخ دهد کدام یک از اقلام، نامزد مفید یا جالبی برای پیوستن به آیتم های توصیه شده می باشد.
در اینجا لازم است که استفاده زیرکانه از اصطلاحات "توصیه" و "آیتم توصیه شده" در دو تعریف گذشته را متذکر گردیم. نکته اصلی این است : یک توصیه¬ی کامل شامل اطلاعاتی بیش از یک آیتم ساده توصیه شده می شود. در واقع یک توصیه از دو بخش تشکیل شده است: (الف) آیتمی که توصیه می شود (کدام آیتم؟/ چه مقدار؟) به علاوه (ب) روش و زمینه ای که در آن توصیه گر باید توصیه دهد (چگونگی و زمان توصیه به ترتیب). از این نقطه نظر، هر یک از توصیه ها ممکن است در قالب یک پوشش که آیتم های توصیه شده را لفاف بندی می کنند، نمایش داده شوند (نگاه کنید به شکل 6). همچنین، روند دستیابی به یک توصیه یا روند توصیه می تواند در قالب دو گام سیاستی دیده شود (1) برخی از اقلام از یک مخزن (بزرگ) از آنها (که جواب می دهد چه چیزی توصیه می شود) انتخاب شده است، (2) هر یک از آیتم های جمع آوری شده در یک لفاف باید بسته بندی شوند (پاسخ به چگونگی توصیه) و در یک روش شخصی سازی شده به کاربر نمایش داده شوند (پاسخ به زمان توصیه).

معیارهای سنتی   
اول از همه، ما باید به تفاوت نظر هر یک از دو زیر سیستم تعاملی و غیر تعاملی در حال ساخت معیار توجه نماییم. در واقع، این یک چیز معمولی نمی باشد و معیارهای حال حاضر با این ایده در ذهن ساخته نشده اند. بنابراین، همانطور که ما در بخش 3. 4 معرفی کردیم هر زمان که ما در حال کار با یک سیستم توصیه گر غیر تعاملی هستیم، ما خواهیم گفت که زیرسیستم راهنمای آن کامل است، به طوری که ما می توانیم از ملاحظات این سیستم اجتناب کنیم. در روشی مشابه، در یک سیستم توصیه گر تعاملی از زیرسیستم فیلتر با تعریف آن به طور کامل نیز اجتناب می کنیم.   
مورد اول، در رابطه با یک سیستم توصیه گر غیر تعاملی است. با توجه به این واقعیت که راهنما کامل است، می توان بر روی سودمندی یا علاقه مندی موارد توصیه شده تمرکز نمود. سپس، می توانیم به یک ماتریس درهم ریخته مثل موردی که در قسمت 2. 3 در جدول 2 معرفی گردید برسیم.   
از سوی دیگر، یک سیستم توصیه گر تعاملی را در نظر داشته باشید که هر توصیه¬ی آن به رغم سودمندی یا علاقه مندی نهایی آیتم های در نظر گرفته شده برای توصیه، کاملا موفق است. با این حال، در این مورد خاص، استفاده از ماتریس درهم آمیخته نظیر جدول 2 دشوارتر است. در واقع، تشخیص رفتار خوب یا بد توصیه ای که هرگز نمایش داده نمی¬شود دشوار است (اگر چه غیر ممکن نیست). بنابراین، این سیستم توصیه گر معمولا تنها accuracy و precision را برای توصیه های نمایش داده شده در نظر می گیرد.
به دلایل ذکر شده در بالا، ما باید معیارهای SDMC (نگاه کنید به بخش 2) را برای هر نوع از سیستم های توصیه گر از نظر عناصر رسمی موجود در چارچوب جدید بازنویسی نماییم
 

Comments (3) Posted to ارزیابی سیستم های توصه گر 01/27/2012 Edit

سیستم های توصیه گر تعاملی و غیر تعاملی

 


ما اقدام به توسعه این مفهوم به یک روش استقرایی خواهیم کرد. برای این منظور، ما دو نمونه مشخصه سیستم های توصیه گر تعاملی و غیر تعاملی استفاده کنید.   
دو سیستم که از لحاظ شرایط تعاملی کاملا مخالف یکدیگر هستند عبارتند از WebWatcher  ]20[،]43[  و سیستم Syskill&Webert ]23[،]44[ .
اگر چه هر دوی آنها معمولا با هم در یک رده مشابه با عنوان سیستم های توصیه گر مبتنی بر محتوی قرار می¬گیرند.   
توصیه گرهای مبتنی بر محتوا سعی در پیشنهاد کردن آیتم هایی مشابه به آنچه که در گذشته  برای کاربر مورد نظر، جالب یا مفید بوده است دارند. در نتیجه، آنها برای حل این سوال نیاز به ایجاد یک پروفایل کاربر خواهند داشت. در هر دو مورد، اقلام در نظر گرفته شده لینک وب هستند. در حالت اول، Syskill&Webert پروفایل کاربر خود را به وسیله امتیاز جمع آوری شده (صریح) بدست آمده توسط هر کاربر برای بعضی از صفحات وب بازدید شده است. در مورد دوم، WebWatcher از طریق برجسته کردن به عنوان مثال توصیه¬ی برخی از لینکهای موجود در هر صفحه¬ی نشان داده به هر کاربر، وی را در انجام بررسی هایش کمک می نماید. این روش در اصطلاح علامت گذاری در متن نامیده می شود. در WebWatcher، کاربر می تواند بر روی پیشنهادات کلیک نماید و یا خیر، اما، هر آنچه که انجام شود، به عنوان رفتار کاربر در سیستم ثبت شده و پروفایل مشخصات کاربر به روز رسانی می گردد.
لزوما بایستی بدین موضوع اشاره کنیم که  Syskill&Webert می تواند قبل از اینکه هر گونه توصیه ای رخ دهد، بازخورد کاربران را بدست آورد. در واقع، هیچ چیزی به هیچ وجه برای کاربران ممانعتی در امتیازدهی به اشیاء در برنامه های کاربردی که شامل هیچ سیستم توصیه گری نیستند، ایجاد نمی نماید. و این ممکن است موردی باشد، به عنوان مثال، در برنامه های کاربردی که تنها برای تجزیه و تحلیل داده های کاربر استفاده می شوند.   
به هیچ وجه، WebWatcher را نمی توان مشابه با این مورد در نظر گرفت. در واقع، در این سیستم توصیه گر، داده های جمع آوری شده به شدت به فعالیت های قبلی توصیه گر روی کاربر بستگی دارد. واضح است که فقط توصیه هایی که قبلا به کاربر نشان داده شده است امکان وجود در ادامه خواهند داشت. بنابراین، برای تمایز بین این دو نوع از سیستم های توصیه گر، سیستم های شبیه به WebWatcher را توصیه گرهای تعاملی و مابقی را توصیه گرهای غیر تعاملی می نامیم. توجه داشته باشید که منظور این نیست که توصیه گرهای غیر تعاملی نیازی به تعامل با کاربران ندارند، چرا که هر سیستم تطبیق پذیری نیازمند آن خواهد بود. بلکه، آنچه منظور ماست، این است که در مورد دوم، داده های تعاملی کاربران از سیستمی خارجی که هرگز بخشی از سیستم توصیه گر نیست جمع آوری شده است. به عبارت دیگر، در سیستم های توصیه گر غیر تعاملی، داده های تعاملی کاربران می تواند قبل از تعامل هر کاربر با سیستم توصیه گر، جمع آوری گردد.   
در حال حاضر، یک پرسش مهم مطرح می شود : آیا می توان سیستم های توصیه گر تعاملی و غیر تعاملی را با استفاده از معیارهایی مشابه ارزیابی نمود؟ در نگاه اول هر دو نمونه، Syskill&Webert و WebWatcher توسط همان معیار دقت مورد ارزیابی قرار گرفتند. با این حال، اگر روشی را که آنها در محاسبه¬ی مقادیر خود بکار می برند مرور نماییم ما متوجه خواهیم شد که حتی اگر چه هر دو نام یکسانی دارند، اما معیارها مشابه نیستند (ما مجددا در بخش 4 به این ایده بازخواهیم گشت).
در واقع، در مورد Syskill&Webert هدف ارزیابی این است که " تعیین کند که آیا این امکان برای یادگیری ترجیحات کاربر به دقت وجود دارد؟" ]44[. با این حال که، در مورد WebWatcher هدف ارزیابی این است که "چگونه خوب (دقیق) WebWatcher می تواند یاد بگیرد که به کاربر توصیه نماید؟" ]20[.
 همچنین بایستی مجددا اشاره کنیم که در مورد Syskill&Webert ارزیابی ممکن است با داده های ذخیره شده و استاتیک انجام گردد در حالیکه در مورد دوم داده های تعاملی و پویا مورد نیاز است.
با توجه به موارد گفته شده به نظر می رسد این دو سیستم متفاوت هستند، زیرا آنها دارای اهداف متفاوتی هستند. با این حال، ما ادعا می کنیم که آنها تنها یک هدف مشترک دارند، حتی اگر هر یک از سیستم ها توجه خود را به بخش های متفاوتی از آن معطوف نمایند. بنابراین، در مورد Syskill&Webert توجه خود را بیشتر در بخش دوم هدف مشترک قرار داده است: تعیین ترجیحات کاربر با دقت جهت ارائه¬ی اقلام مفید و جالب به کاربر. گرچه، در مورد WebWatcher، توجه خود را در بخش اول هدف مشترک معطوف نموده است: یاد گیری توصیه به کاربر جهت راهنمایی وی به درستی.   
در نتیجه، ما چارچوبی را در نظر می گیریم که در آن هر سیستم توصیه گر از دو زیرسیستم مختلف تشکیل شده است: یک زیرسیستم تعاملی و یک زیرسیستم غیر تعاملی. هر زیرسیستمی به ترتیب عهده دار زیر اهداف مربوط به خودش خواهد بود: (الف) راهنمایی کاربر و (ب) ارائه¬ی آیتم های مفید و جالب.
معمولا در هر سیستم توصیه گر یکی از دو زیر سیستم فعال تر از دیگری می¬باشد، و کلاس آن (تعاملی و یا غیر تعاملی) به این امر بستگی دارد. در نهایت، توجه کنید که هر کدامیک از دو زیر سیستم فوق به زیر هدف مربوط به خود در حال حاضر نزدیکترند تا نزدیکی کل سیستم توصیه گر به هدف عمومی خود. بخش بعدی به توضیح هر یک از زیرسیستم ها همراه با ذکر جزئیات اختصاص دارد.
 

Comments (2) Posted to ارزیابی سیستم های توصه گر 01/22/2012 Edit

یک چارچوب عمومی برای سیستم های توصیه گر

 

در این بخش ما به توسعه یک چارچوب عمومی برای سیستم های توصیه گر خواهیم پرداخت. بدین دلیل آن را عمومی می¬نامیم که این چارچوب مفروضات دیگری از هدف مشترک سیستم های توصیه گر معرفی نمی نماید. با این حال، به رغم انتزاعی بودن آن، همانطور که در پایان این بخش بررسی خواهد شد، این چارچوب به اندازه کافی نیز خاص میباشد به طوری که می توانیم از آن نتایج ثابت و قابل اطمینانی بدست آوریم. هدف ما دستیابی به یک چارچوب منطقی با اصطلاحات مشترک است. هنگامی که تمامی توصیه گرها از عبارات یکسانی استفاده نمایند، ایجاد معیارهای مشترک آسان تر خواهد بود. به منظور ساخت چنین چارچوبی نمی توان انتظار داشت که با توصیه گرهای فردی کار نماییم. در عوض، ما با مجموعه ای از سیستم های توصیه گر کار خواهیم کرد. در طی این سال ها، طرح های متعددی برای طبقه بندی این سیستم ها بوجود آمده اند. معروف ترین آن شامل طبقه بندی آنها به دو دسته می باشد : فیلترینگ تجمعی و فیلترینگ مبتنی بر محتوا ]42[. علاوه بر این، ترکیبی از این دو نیز وجود دارد ]22[،]36[ .
با وجود محبوبیت آنها، این طبقه بندی بسیار وابسته به نوع الگوریتم استفاده شده توسط سیستم توصیه گر می باشد و سیستم های توصیه گر مناسبی را ممکن است در نظر نگیرد. در واقع، برک مجبور به گسترش این طبقه بندی با اضافه کردن دو گروه بیشتر گردیده است: گروه جمعیت شناختی و گروه مبتنی بر دانش]22[.   
علاوه بر این، این طبقه بندی نیز نیاز به گسترش مجدد در آینده خواهند داشت.
به منظور درک طیف وسیعی از سیستم های توصیه گر در یک طبقه بندی، نخست ما باید بر روی شایع ترین و ضروری ترین ویژگی ها تمرکز نماییم: باز هم، هدف آنها. تمرکز بر روی این هدف، به عنوان اولین بار در بخش 1 مورد توجه قرار گرفت. ممکن است آن را به دو هدف جزئی جداگانه تقسیم نماییم: (الف) راهنمایی، (ب) فیلتر کردن آیتم های مفید و جالب. بخش اول ممکن است اساسا با رفتاری تعاملی، پویا و بسیار موقتی انجام گردد، در حالی که بخش دوم با یک رفتار تا حدودی مخالف انجام گیرد، دائمی تر و دارای تعامل مستقیم کمتر.   
این ما را به معرفی یک طبقه بندی جدید که مبتنی بر آن زیر اهدافی است که یک سیستم توصیه گر خاص بیشتر بر روی آن تمرکز دارد، تشویق می کند. در واقع، در بخش بعد خواهیم دید که رایج ترین سیستم های توصیه گر با ترک تقریبا خودکار یکی از این دو زیر هدف بیشتر تمایل به دیگری دارند. به همین دلیل، به عنوان بخش نخست و اصلی، ما تمام سیستم های توصیه گر ممکن را بسته به اینکه در آن کدامیک از اهداف بیشتر مد نظر قرار گرفته باشد به دو دسته¬¬ی تعاملی و غیر تعاملی به ترتیب طبقه بندی می کنیم.
 

Comments (1) Posted to ارزیابی سیستم های توصه گر 01/18/2012 Edit

بحث مهمی در ارزیابی سیستم های توصیه گر

 

این را نمی توان انکار کرد که نوعی عدم یکنواختی در معیارهای فعلی برای ارزیابی سیستم های توصیه گر وجود دارد که یحتمل به خاطر تعداد زیاد آنها خواهد بود.   
با این حال، ما تلاش خواهیم کرد آنها را بسته به روشی که آنها کمیت رفتار خوب یک سیستم توصیه گر را تعیین می کنند، به یکی از سه دسته طبقه بندی کنیم.   
(1) پیش بینی امتیاز. این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای پیش بینی امتیازی که یک کاربر به یک آیتم خواهد داد قبل از انجام این امتیاز دهی متمرکز شده اند.
(2) پیش بینی رتبه بندی. این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای پیش بینی رتبه ای که یک کاربر بر روی مجموعه ای از اقلام خواهد داد قبل از انجام این رتبه بندی متمرکز شده اند.
(3) ظرفیت تصمیم گیری موفق (SDMC). این معیارها بر روی اندازه گیری ظرفیت سیستم توصیه گر برای ایجاد یک تصمیم گیری (توصیه) موفق متمرکز شده اند.
جهت این طبقه بندی در ذهن، ما باید MAE ( و معیارهای مربوط به آن) را به طبقه اول، معیارهای رتبه بندی را به طبقه دوم، و دقت ( و معیارهای مرتبط با آن) و معیارهای IR را به طبقه سوم تخصیص دهیم.   
اکنون، اگر ما هدف اصلی از سیستم توصیه گر (اعلام شده در ابتدای بخش 1) را ارائه نماییم، مشاهده میکنیم آنچه که طبقه های اول و دوم از معیارها سعی بر اندازه گیری آن دارند را میتوان نوعی از معیارهای بیش از حد دارای جزئیات آن دانست. در واقع، ما نباید مفروضات بیشتری نسبت به آنچه که در واقع لازم دارند، بسازیم. با این حال، هیچ اشاره ای به امتیاز یا رتبه در تعریف هدف یک سیستم توصیه گر وجود ندارد. علاوه بر این، حتی با فرض اینکه توان یک آیتم مفید یک باشد که در اینصورت p(u , i) به اندازه کافی بالا خواهد بود، براستی جای بحث است که ما می توانیم تنها با استفاده از امتیازات کاربران مقدار دقیق تابع p(u , i) را نتیجه بگیریم]41[. در نتیجه، تمایل ما این است که ساخت متریک هایی که فقط هدف واقعی از یک نوع سیستم توصیه گر را اندازه گیری می کنند محدود نماییم که البته بایستی هشیار باشیم که مفروضات ساخته شده باید در سایر سیستم های توصیه گر مناسب از آغاز اندازه گیری قابل تنظیم کردن باشد.   
بنابراین، برای حفظ روشی به اندازه کافی عمومی که هر سیستم توصیه گری با هدف بیان شده¬ی قبلی را در بر بگیرد، به خاطر داشته باشیم که این هدف در مبحث شرایط تصمیم گیری سیستم توصیه گر بیان گردید. بنابراین، معیارهای SDMC به عنوان مناسب ترین گزینه برای این کار به نظر می رسد.
با این حال، توجه داشته باشید که هنگامی که ما به یک توصیه مفید در معیار SDMC اشاره می کنیم، به طور کلی در نظر داریم که یک توصیه موفق، توصیه ای است که در آن آیتم توصیه شده مشابه با علایق واقعی کاربر مورد نظر باشد. به عبارت دیگر، اگر توابع ترجیح باینری کاربران را در نظر بگیریم، توصیه های موفق، آنهایی هستند که در مورد آنها داشته باشیم:    | p(u , i) - P(u , i) | = 0   
در این مرحله، ما می خواهیم دو پیش فرض مهم را که در پشت این باور معروف وجود دارد بیان نماییم:
 (1) فرض اول اینکه یک توصیه موفقیت آمیز است اگر و تنها اگر آیتم توصیه شده، مفید واقع گردد. با این حال، یک هدف توصیه نیز راهنمایی به کاربر می باشد. علاوه بر این، اگر توصیه ای نه "مناسب" و نه به اندازه کافی "جذاب" برای هدایت کاربر به آیتم توصیه شده ارائه گردد، تمامی توصیه ها علی رغم سودمندی آیتم غیر قابل استفاده خواهند بود. به عبارت دیگر، مجزای از تصمیم متداول برای اینکه چه چیزی را توصیه کنیم، نیازمندیم که انتخاب کنیم چه وقت و چگونه توصیه کنیم.
(2) فرض دوم اینکه یک آیتم توصیه شده سودمند است اگر و تنها اگر ترجیحات مربوط به آیتم توصیه شده، منطبق بر ترجیحات کابر هدف واقع گردد. هر چند، این امر همیشه صحیح نیست. به عنوان مثال، بسیاری از سیستم های تجارت الکترونیک را در نظر بگیرید که در آن یک آیتم توصیه شده هر زمان که منجر به تحریک برای انجام یک معامله گردد، مفید است. به طور طبیعی، در مورد دومی می تواند هیچ ارتباطی با ترجیحات کاربر نداشته باشد. در واقع، آن می تواند یک ضرورت و نیاز باشد. بنابراین، سودمندی یک آیتم توصیه شده باید تجدید نظر گردیده و مورد تعمیم قرار گیرد.
بخاطر دلایل ذکر شده در بالا مدعی هستیم "مشخصات بیش از حدی" در معیارهای فعلی برای سیستم های توصیه گر وجود دارد. به عنوان یک راه حل، ما یک چارچوب به اندازه کافی عمومی برای تجزیه ی سیستم های توصیه گر با پیروی از سیاستهای تصریح شده فراهم خواهیم کرد، اما به اندازه کافی خاص که نتایج مهمی از آن حاصل گردد. برای این منظور، ما فرض خواهیم کرد تنها هدف سیستم های توصیه گر راهنمایی کاربران به اشیای جالب و مفید می باشد.
 

Comments (1) Posted to ارزیابی سیستم های توصه گر 01/14/2012 Edit

معیارهای قبلی برای ارزیابی سیستم های توصیه گر

 

هرگاه یک سیستم توصیه گر ارزیابی شده است، معیاری استفاده می شود که بر اساس یک سری فرضیات خاص برای آن ساخته شده است. بنابراین، ما این بخش را به مرور و بررسی رایج ترین معیارها با مشخص کردن مفروضاتی که بر آنها استوار هستند اختصاص خواهیم داد و پر اهمیت ترین آنها را در نظر خواهیم گرفت. برای این منظور، اول از همه، ما شروع به توصیف چارچوب معمول پذیرفته شده در این زمینه برای تعریف فرآیند توصیه عمومی می نماییم.
در این چارچوب فعلی، یک سیستم توصیه گر در سیستم دیگری حاوی تعدادی از آیتم های موجود که توصیه می شوند تعبیه شده است. به منظور آغاز روند توصیه، آیتم های موجود بایستی توسط افراد درجه بندی شوند. در بسیاری از سیستم های توصیه گر این درجه بندی به وضوح فراهم می گردد. در برخی از موارد دیگر، این درجه بندی و ارزیابی از فعل و انفعالات سایر کاربران استنباط می شود و رتبه های ضمنی نامیده می شوند.
پس از آن ، هنگامی که سیستم توصیه گر به اندازه کافی رتبه بندی داشته باشد، این روند می تواند شروع شود. برای هر یک از توصیه ها، تعداد N<=I از اشیاء  توسط توصیه گر  انتخاب شده ، و به کاربر مورد نظر نشان داده می شود. علاوه بر این ، برخی از سیستم های توصیه گر همچنین اشیای محدود شده و برگزیده را جهت نمایش به کاربر در قالب یک لیست مرتب رتبه بندی می کنند. در مرحله بعد، کاربر احتمالا آیتم هایی را که در بالای این لیست ظاهر می گردند وارسی می کند.
در نهایت ، به منظور ارزیابی عملکرد سیستم توصیه گر ، برای هر شیء نشان داده شده به یک کاربر خاص ما باید میزان مطلوبیت و نزدیکی آیتم نشان داده شده را نسبت به ترجیحات کاربر انداره گیری نماییم. علاوه بر این ، در مورد لیست مرتب، ما باید مکان هر آیتم توصیه شده در این لیست را نیز به حساب آورده و تفسیر نماییم. در ادامه ، مرور سریعی بر چگونگی ارزیابی های انجام شده تا به امروز خواهیم داشت.



ملاحظات اولیه
به منظور اندازه گیری میزان نزدیکی پیش بینی ها به ترجیحات واقعی کاربران به طور معمول از یک نمایش عددی استفاده می شود. علاوه بر این ، به دلیل شفافیت بیشتر از علائم یکسانی در ادامه ی بخش جاری استفاده خواهیم کرد. برای این منظور( P(u , i پیش بینی سیستم توصیه گر برای کاربر خاص u و آیتم i و( p(u , i مقدار واقعی ترجیحات کابر تعریف می گردد.
واضح است، تابع( p(u , iهرگز نمی تواند با دقت مطلق آشکار گردد. بنابراین، ارزش این تابع معمولا با استفاده از رتبه بندی های قبلی کاربران تخمین زده می شود. همانطور که در بالا گفته شد این رتبه بندی می تواند به طور صریح یا ضمنی حاصل گردد.
در برخی موارد، هر دو تابع( p(u , i و( P(u , i تنها دو مقدار 1 یا 0 را ارائه می دهند که بدین معنی خواهد بود که آیتم خاص i برای کاربر خاص u به ترتیب مفید یا بی فایده در نظر گرفته شده است. برای این مورد منحصر بفرد، توابع p و P توابع دوتایی نامیده می شوند.
 

Comments (1) Posted to ارزیابی سیستم های توصه گر 01/10/2012 Edit

مقدمه ای بر ارزیابی سیستم های توصیه گر


و اما پس از آشنایی کامل با انواع سیستم های توصیه گر و نحوه¬ی کار آن¬ها به موضوع اصلی یعنی ارزیابی سیستم های توصیه گر خواهیم پرداخت. می دانیم که سیستم های توصیه گر فعلی یک هدف اصلی و روشن را دنبال می نمایند و آن هدایت کاربر به اشیاء و آیتم های مفید، جالب و مورد علاقه ی وی است. بدین ترتیب جهت ارزیابی یک سیستم توصیه گر می¬توان ارزیابی این امر که چه مقدار از این هدف محقق شده است را مد نظر قرار داد.
اگر چه با این تعریف، این سیستم ها طی سالیان اخیر تکامل یافته و رو به رشد هستند ولی به سختی می توان در مورد معیارهای ارزیابی آن ها اظهار نظر کرد. از اولین سیستم های توصیه¬گر تا به امروز، اکثر ارزیابی های تجربی منتشر شده صرفا بر اندازه گیری میزان نزدیکی پیش بینی¬های سیستم توصیه گر با ترجیحات واقعی کاربر متمرکز شده است.
اگر چه به طور کلی، این اندازه گیری ها بر هدف کلی و عمومی سیستم های توصیه گر فوق که در ابتدا بیان شد مطابقت ندارد. علاوه بر این، برخی از معیارها سیستم های توصیه گر را مجبور به پیروی از سیاست های خاصی میکنند که امکانات آنها را محدود می نماید. در واقع، به جای پیگیری هدف مشترکی که برای هر سیستم توصیه گر ادعا می شود، در حال حاضر متأسفانه، یک سری اهداف مبهم و غیرقطعی وجود دارد که عملا توسط معیارهای متنوع فعلی به طور غیر رسمی عرضه می شود.
برای تشریح بیشتر این امر، در چند پاراگراف نقل قول برخی از محققان در این حوزه را خواهیم آورد]20[:
چالش اصلی، انتخاب یک متریک مناسب است که تنوع زیاد معیارهای منتشر شده جهت ارزیابی کمی دقت سیستم های توصیه گر را پوشش داده و همگی آنها را در بر گیرد. این فقدان استاندارد باعث لطمه زدن به پیشرفت دانش مربوط به سیستم توصیه گر مبتنی بر فیلترینگ تجمعی خواهد بود. بدون داشتن معیارهای استانداردی در این زمینه، محققان در زمان ارزیابی سیستمهای خود به معرفی معیارهای جدیدی خواهند پرداخت و بدین ترتیب با تنوع بسیار زیاد معیارهای ارزیابی در حال استفاده، مقایسه¬ی نتایج منتشر شده در یک نشریه با نتایج نشریه ای دیگر بسیار دشوار خواهد بود.
به همین دلیل، بسیار سخت خواهد بود که بتوان این نشریات متنوع را در یک مجموعه منسجم علمی در رابطه با کیفیت الگوریتم های سیستم توصیه گر تجمیع نمود. علاوه بر این، این معیارها محدودیت های خاصی دارند.
محققانی که می خواهند به مقایسه کمی دقت سیستم های توصیه گر مختلف بپردازند نخست باید یک یا چند معیار را انتخاب کنند. در انتخاب یک متریک، محققان با طیف وسیعی از سوالات روبرو هستند. آیا متریک مورد نظر، کارایی سیستم را نسبت به وظایف کاربر که برای آن طراحی شده بود اندازه گیری می نماید؟ آیا نتایج حاصل از انتخاب این متریک با سایر نتایج منتشر شده در سایر کارها در این زمینه قابل مقایسه است؟ آیا مفروضاتی که مبنای یک متریک قرار می گیرد،درست است؟ آیا متریک از حساسیت کافی برای تشخیص تفاوت های واقعی موجود برخوردار می باشد؟ چه مقدار تفاوت بین مقادیر حاصل شده از متریک برای ایجاد یک اختلاف آماری قابل توجه بایستی وجود داشته باشد؟ پاسخ کامل به این پرسش ها هنوز هم به طور کامل در مطبوعات منتشر شده ذکر نگردیده است.
با وجود این مشکلات ، ما نبایستی از هدف نهایی از هر متریک برای سیستم های توصیه گر چشم پوشی نماییم. یک متریک خوب باید ظرفیت محاسبه ی "رفتار خوب" یک سیستم های توصیه گر را دارا بوده و هر زمان که این سیستم ها در محیط های مشابهی (به عنوان مثال مجموعه داده ای از فعل و انفعالات کاربران) ظاهر گشتند، مقادیر مشابهی را تولید نماید.
علاوه بر این ، بایستی تعریف روشنی از معنی "رفتار خوب" ارائه نماییم. در هر صورت، آن باید با هدف واقعی از سیستم توصیه گر عمومی گفته شده که در ابتدا ذکر گردید مطابقت داشته باشد: هدایت کاربر به اشیاء و آیتم های مفید، جالب و مورد علاقه ی وی. لازم به ذکر است که دستیابی به این هدف مستلزم انجام دو وظیفه مختلف می باشد: (الف) تولید پیشنهاداتی که توسط کاربر مورد پذیرش واقع شود. (ب) فیلتر کردن آیتم های مفید و جالب. اولین وظیفه، با یک رفتار خارجی و تعاملی که هر توصیه گر به طور مستقیم به کاربر نشان می دهد به انجام می¬رسد. وظیفه دوم که مرتبط است با ''پیدا کردن آیتم های خوب'' ، با یک رفتار داخلی تر و تعاملی کمتر. با این حال، با وجود تعداد زیاد معیارهای منتشر شده تا به امروز، تعیین این دو وظیفه با هم، به عنوان یک هدف کلی، بر روی آنها بسیار دشوار است. علاوه بر این، جهت گیری یک تحقیق خاص ممکن است بیشتر بخش دوم از هدف را مد نظر قرار دهد، به گونه ای که اغلب هدف بخش اول در نظر گرفته نشود. در پایان این مباحث ما به سمت توسعه یک استاندارد جدید خواهیم رفت به گونه ای که هر دو این اهداف را با یکدیگر محقق سازد.
 

Comments (2) Posted to ارزیابی سیستم های توصه گر 01/08/2012 Edit

مزایای استفاده از سیستم های توصیه گر


واما بد نیست برخی از مهم ترین مزایای استفاده از سیستم های توصیه گر را در این قسمت ذکر نماییم:
- مبتنی بر بودن بر اطلاعات زنده و واقعی: مهمترین مزیت سیستم‌های پیشنهاد دهنده این است که بر اساس فعالیت کاربران و گردآوری رفتار و سلایق آن‌ها عمل می‌کند. به این ترتیب پیشنهاد آن‌ها بر اساس حدس و گمان نمی‌باشد.
- عالی برای اکتشاف فضاهای جدید: با استفاده از سیستم‌های پیشنهاد دهنده می‌توانید به فیلم‌ها، تصاویر و خلاصه کلام مطالبی دست یابید که در حالت عادی شاید هرگز به ‌آن‌ها نمی‌رسیدید. به این ترتیب افق کاربری شما در وب گسترش می‌یابد و به جای اتلاف وقت و انرژی برای جستجوی کور و تصادفی در جستجوگرهای وب، وقت خود را صرف استفاده مفید از مطالب جدید خواهید کرد.
- تنظیم شده با خصوصیت‌های فردی شما: شما توصیه دوستان نزدیک و اعضای خانواده خود را به خاطر شناخت عمیقی که از شما دارند جدی می‌گیرید. چرا شما به نظر آن‌ها اعتماد می‌کنید؟ چون نظر آن‌ها مبتنی بر شناختی است که از شما دارند. به همین ترتیب می‌توانید به پیشنهاد سیستم‌هایی که از خلق و خوی شما آگاهی نسبی بیشتری دارند اطمینان بیشتری داشته باشید. این در حالی است که در وب‌ 1.0 پیشنهادات به صورت تصادفی و در غالب تبلیغات کور به شما ارائه می‌شد که طبیعتا با ضریب اطمینان بسیار پایینی از سوی شما مواجه می‌شد.
- همیشه به روز و جدید بمانید: با استفاده از «هوش جمعی» که چکیده رفتار هزاران کاربر مانند خود شماست، می‌توانید از جدیدترین و داغ‌ترین اتفاقات در زمینه‌های مورد علاقه‌تان با خبر بمانید.
- کاهش هزینه نگهداری سازمانی: در سیستم‌های پیشنهاد دهنده، با توجه به این‌که کاربران اطلاعات را بر اساس سلایق خود شکل می‌دهند، دستکاری و مدیریت اطلاعات وب‌گاه و به‌روزرسانی آن توسط خود کاربران انجام می‌شود. به این ترتیب هزینه نگهداری و سازماندهی وب‌گاه در مقایسه با وب‌گاه‌های سنتی بسیار کمتر است.

Comments (0) Posted to ارزیابی سیستم های توصه گر 01/03/2012 Edit

انواع سیستم‌های توصیه‌گر


سیستم‌های توصیه‌گر به طور کلی به سه دسته¬ی اصلی تقسیم می‌شوند.]7[ در رایج‌ترین تقسیم‌بندی، آنها را به سه گروه ۱.محتوا محور ۲.دانش محور و ۳. فیلترینگ تجمعی، تقسیم می‌کنند، که البته گونه چهارمی تحت عنوان Hybrid RS هم برای آنها قائل می‌شوند.
یک رویکرد به سیستم‌های توصیه‌گر، استفاده از الگوریتم‌های CF یا فیلترینگ تجمعی است.(نگاه کنید به شکل 1) در این رویکرد به جای استفاده از محتوای (Content) اقلام، از نظرات و رتبه‌بندی‌های انجام شده توسط کاربران برای ارائه پیشنهاد، استفاده می‌شود. لازم به ذکر است که به طور کلی سیستم های مبتنی بر فیلترینگ نیز خود به دو دسته¬ی کاربر محور و کالا محور تقسیم می شوند. همچنین در یک دسته بندی دیگر نیز الگوریتم های CF به دو نوع اصلی مبتنی بر حافظه یا مبتنی بر هیوریستیک و مبتنی بر مدل تقسیم بندی می شوند.
و اما در روش محتوا محور، اقلام پیشنهادی، به این دلیل که با اقلامی که کاربر فعال (کاربری که قرار است به او توصیه کنیم) نسبت به آنها ابراز علاقه کرده ‌است شباهت‌هایی دارند، به کاربر توصیه می‌شوند ولی در CF، لیست اقلام پیشنهادی، بر اساس این اصل که، کاربرانی، مشابه کاربر فعال، از آنها رضایت داشته‌اند تهیه می‌شود. از این رو واضح است که در روش محتوا محور، تمرکز بر روی یافتن شباهت بین اقلام بوده، در حالی که در CF، تمرکز روی یافتن شباهت بین کاربران است؛ بدین ترتیب که پیشنهادات در CF، بر اساس تشابه رفتاری کاربر فعال با کاربران دیگر صورت می‌گیرد و نه بر اساس تشابه ویژگی کالاهای پیشنهادی با ویژگی‌های کالاهای مورد علاقه وی (کاربر فعال). 
اما گونة سوم این سیستم‌ها را با نام سیستم‌های دانش محور می‌شناسند. این سیستم‌ها براساس ادراکی که از نیازهای مشتری و ویژگی‌های کالاها پیدا کرده‌اند، توصیه‌هایی را ارائه می‌دهند. به عبارتی در این گونه از سیستم‌های توصیه‌گر، مواد اولیه مورد استفاده برای تولید لیستی از پیشنهادها، دانش سیستم در مورد مشتری و کالا است. سیستم‌های دانش محور از متدهای مختلفی که برای تحلیل دانش، قابل استفاده هستند بهره می‌برند که متدهای رایج در الگوریتم‌های ژنتیک، فازی، شبکه‌های عصبی و ... از جمله آنهاست. همچنین، در این گونه سیستم‌ها از درخت‌های تصمیم، استدلال نمونه‌محور و ... نیز می‌توان استفاده کرد. یکی از رایج‌ترین متدهای تحلیل دانش درسیستم‌های توصیه‌گر دانش محور ،CBR یا روش استدلال نمونه‌محور است.

گونه چهارم، سیستم‌های ترکیبی هستند. طراحان این نوع سیستم‌ها دو یا چند گونه از انواع سه‌گانه مذکور را غالبا به دو منظور با هم ترکیب می‌کنند؛ ۱- افزایش عملکرد سیستم ۲- کاهش اثر نقاط ضعفی که آن سیستم‌ها وقتی به تنهایی به کار گرفته شوند، دارند. از میان سه روش موجود (CF و CB و KB)، غالباً روش CF یک پای ثابت این ترکیبات است.
 
 

Comments (1) Posted to ارزیابی سیستم های توصه گر 12/30/2011 Edit

اصطلاحات و تعاریف در ارزیابی سیستم های توصیه گر


برای درک مفهوم سیستم توصیه‌گر، مفاهیم چهارگانه و ابتدایی زیر را بررسی کنیم.
در سیستم‌های توصیه گر به کاربری که توصیه جاری در سیستم، برای وی در حال پردازش و آماده شدن است، کاربر فعال یا کاربر هدف می‌گویند.
الگوریتم‌های به کار رفته در این سیستم‌ها، از ماتریسی به نام ماتریس رتبه‌ها استفاده می‌کنند؛ اصطلاحات رایج برای این ماتریس Rating Database و Preference Database نیز هستند.
از فعل مصرف کردن در سیستم‌های توصیه‌گر، زمانی استفاده می‌کنند که کاربر توصیه ارائه شده را می‌پذیرد. به عبارتی وقتی کاربری پیشنهادی را که توسط سیستم به وی شده می‌پذیرد، می‌گوییم کاربر آن پیشنهاد را مصرف کرده، این پذیرش می‌تواند به شکل‌های مختلفی باشد، مثلاً کاربر، کتاب پیشنهادی را می‌خرد، سایت پیشنهادی را مرور می‌کند و یا به شرکت خدماتی ای که به او پیشنهاد شده مراجعه می‌کند. ساختار ماتریس رتبه‌ها بدین گونه‌است که در آن، هر سطر ماتریس نمایانگر یک کاربر و هر ستون آن معرف یک آیتم خاص است.
حال با مفهوم تابع سودمندی آشنا خواهیم شد که قصد داریم به کمک آن یک مدل کلی ریاضی از سیستم‌های توصیه‌گر را نیز ارائه دهیم. در واقع یک سیستم توصیه‌گر را می‌توان با این نگاشت همسان دانست و مدل کرد: u:C * S − > R
فرض کنید C مجموعه تمامی کاربران و S مجموعه اقلام در دسترس باشند. تابعی را که میزان مفید و متناسب بودن کالای c برای کاربر s را محاسبه می‌کند با u نشان می‌دهیم، که در آن R مجموعه‌ای است کاملاً مرتب (براساس میزان اهمیت) . هرکدام از عناصر S را می‌توان با مجموعه‌ای از خصوصیات، مشخص کرد. برای مثال، محصولی مثل فیلم را می‌توان با مشخصه‌هایی چون عنوان فیلم، کارگردان، طول زمانی فیلم، تاریخ تولید و ... ثبت کرد. همچنین عناصر مجموعه C را نیز می‌توان بر اساس ویژگی‌های مثل سن، جنسیت و ... ثبت کرد. (باید توجه داشت که u روی تمام فضای مجموعه آغازین S×C تعریف شده نیست؛ از این رو باید برون‌یابی شود.)
 
 

Comments (0) Posted to ارزیابی سیستم های توصه گر 12/26/2011 Edit

مقدمه ای بر سیستم های توصیه گر




وب، محیطی وسیع، متنوع و پویا است که کاربران متعدد اسناد خود را در آن منتشر می کنند. وب طی یک فرآیند آشفته و غیر متمرکز رشد می کند و این روند منجر به تولید حجم وسیعی از مستندات متصل به یکدیگر گشته است که از هیچ گونه سازماندهی منطقی برخوردار نیستند. با توجه به حجم وسیع اطلاعات در وب، مدیریت آن با ابزارهای سنتی تقریبا غیر ممکن است و ابزارها و روش هایی نو برای مدیریت آن مورد نیاز است.
برای حل این مشکل، شخصی کردن وب به یک پدیده محبوب به منظور سفارشی کردن محیط های وب تبدیل شده است. هدف از سیستم های شخصی ساز فراهم کردن نیازهای کاربران، بدون اینکه به طور صریح آن ها را بیان کنند یا نشان بدهند، می باشد.[1] شخصی سازی وب مجمو عه ای از عملیات است که تجربه ی وب را برای یک کاربر خاص یا مجموعه ای از کابران سازماندهی می کند.[2] 
همان طور که ذکر گردید حجم فراوان و روبه رشد اطلاعات بر روی وب و اینترنت، فرآیند تصمیم‌گیری و انتخاب اطلاعات، داده و یا کالاهای مورد نیاز را، برای بسیاری از کاربران وب دشوار کرده‌است. این موضوع، خود انگیزه‌ای شد تا محققین را وادار به پیداکردن راه‌حلی برای رویارویی با این مشکل اساسی عصر جدید که با عنوان سرریز داده‌ها شناخته می‌شود کند. برای رویارویی با این مسئله تاکنون دو رویکرد مطرح شده‌اند، اولین رویکردی که به کار گرفته شد استفاده از دو مفهوم بازیابی اطلاعات و تصفیه‌سازی اطلاعات بود. عمده محدودیتی که این دو مفهوم در ارائه پیشنهادات دارند، این است که برخلاف توصیه‌گرهای انسانی (مثل دوستان، اعضای خانواده و ...)، این دو روش قادر به تشخیص و تفکیک اقلام با کیفیت و بی کیفیت، در ارائه پیشنهاد برای یک موضوع یا کالا، نیستند. مشکل مذکور، موجب شد تا رویکرد دومی تحت عنوان سیستم توصیه‌گر پدید آید. این سیستم‌های جدید، مشکل سیستم‌های موجود در رویکرد اولیه را حل کرده‌اند.
سیستم های توصیه گر به عنوان نمونه ای از سیستم های پشتیبانی تصمیم یا تصمیم یار شناخته می شوند که در دهه ی 90 میلادی به عنوان یک شاخه ی مستقل پا به عرصه ی تحقیق و پژوهش گشودند. از این سیستم ها به عنوان یکی از راه حل های رویارویی با مساله ی سربار اطلاعات در وب یاد می شود. اگر چه دامنه ی کاربرد استفاده از سیستم های توصیه گر بسیار گسترده می باشد ولی کاربرد آن در زمینه تجارت الکترونیک بیشتر به چشم می آید. از یک سو کسب و کارهای فعال در زمینه-ی تجارت الکترونیک برای جذب مشتری بیشتر در بازار پر رقابت مذکور نیازمند این سیستم ها هستند و از سوی دیگر مشتری نیازمند یاری رسانی در خیل عظیم و رو به رشد کالا و به همان نسبت اطلاعات مربوط به آنها است تا بتواند از میان تعداد گزینه های پیش رو مناسب ترین آنها را برگزیند. [3]
سیستم های توصیه گر عمده ترین فناوری بازیابی شخصی سازی شده ی اطلاعات هستند که غالبا به دو شکل عمل می کنند [4]: (1) پیش بینی اینکه آیا یک کالای خاص مورد علاقه یک کاربر (مشتری) خاص هست یا خیر؟ (2) پیش بینی دسته ای کالا که احتمالا مورد پسند یک کابر قرار خواهد گرفت. به این ترتیب سیستم های توصیه گر از یک سو موجب جلب رضایت مشتری و از سوی دیگر افزایش فروش خواهند  شد. [5]
 
 
 
[1]  B. Mobasher, R. Cooley, J. Srivastava, "Automatic Personalization Based on Web Usage Mining", Communications of the ACM, Vol. 43, No.  8, 2000 .    

[2] B. Mobasher, H. Dai, T. Luo, M. Nakagawa, "Effective personalization based on association rule discovery from web usage data", Proceedings  of the 3rd ACM Workshop on Web Information and Data Management, 2001 . 

[3] Felfering A., Friedrich G., and Schmidt-Thieme L.,  "Recommender systems,"  IEEE Intelligent systems,  vol.  22, pp. 18-21, 2007.

[4] Cornelis C., Lu J., Guo X., and Zhang G., "One-and-only  item recommendation with fuzzy logic techniques,"  Information sciences, vol. doi:10.1016/j.ins.2007.07.001,  2007.

[5] Li Y., Lu L., and Xuefeng L., "A hybrid collaborative  filtering method for multiple-interests and multiplecontent recommendation in E-Commerce,"  Expert  systems with applications, vol. 28, pp. 67-77, 2005.
 

Comments (0) Posted to ارزیابی سیستم های توصه گر 12/22/2011 Edit

معیارهای ارزیابی سیستم های توصیه گر چیست؟


سیستم های توصیه گر با بهره گیری از تکنیک های آماری و تکنیک های کشف دانش به منظور توصیه محصولات به کاربران و کاهش مشکلات ناشی از حجم زیاد داده ها به کار گرفته می شوند. ارزیابی کیفیت سیستم های توصیه گر به یک مسئله مهم برای انتخاب بهترین الگوریتم های یادگیری تبدیل شده است.
مقایسه ی بین سیستم های توصیه گر نیازمند بکارگیری یک روش استاندارد و قابل قبول برای ارزیابی آنها می باشد. با این وجود، در حال حاضر، ارزیابی سیستم های توصیه گر با روش¬هایی غالبا ناسازگار با یکدیگر صورت می گیرد. مشکل اصلی عمدتا به دلیل فقدان یک چارچوب مشترک برای سیستم های توصیه گر است، یک چارچوب به اندازه کافی عمومی به طوری که طیف وسیعی از سیستم های توصیه گر تا به امروز را شامل گردد و به اندازه کافی خاص و معین به طوری که نتایج ثابت و قابل اطمینانی را بدست دهد. در این مستند، معیارهای موجود برای ارزیابی سیستم های توصیه گر را معرفی و تشریح نموده و در پایان چارچوبی ارائه خواهد گردید که اقدام به استخراج ویژگی های اساسی سیستم های توصیه گر می نماید. در این چارچوب، اساسی ترین ویژگی هر سیستم توصیه گر، هدف سیستم توصیه گر در نظر گرفته شده است.
لازم به ذکر است که سیستم های توصیه گر بعنوان برنامه هایی کاربردی با اهداف اساسی زیر در نظر گرفته می شوند. سیستم های توصیه گر باید : (الف) انتخاب کنند که کدامیک (از آیتم ها) باید به کاربر نشان داده شود و (ب) تصمیم بگیرد در چه زمانی و چگونه توصیه ها به نمایش درآیند.
در این مستند خواهید دید که یک متریک جدید به طور طبیعی از بکارگیری این چارچوب پدیدار می گردد. در نهایت، با مقایسه خواص این متریک جدید با متریک های سنتی نتیجه خواهیم گرفت که ممکن است بتوان طیف وسیعی از سیستم های توصیه گر را با این متریک واحد ارزیابی نمود.

Comments (4) Posted to ارزیابی سیستم های توصه گر 12/18/2011 Edit

ارزیابی سیستم های توصیه گر


سلام به تمام خوانندگان و دنبال کنندگان وبلاگ

من از این به بعد برای درس سیستم های تصمیم یار جناب دکتر کاهانی بر روی موضوع Evaluation Metrics for  Recommendation Systems کار خواهم کرد و مطالب وبلاگ از این به بعد بیشتر  به سمت وسوی این موضوع میل خواهد کرد.

به مرور زمان مطالب گردآوری شده و نتایج  بدست آمده در رابطه با این موضوع در وبلاگ انتشار داده خواهد شد.

پیروز باشید و سربلند

Comments (3) Posted to ارزیابی سیستم های توصه گر 12/13/2011 Edit


درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds