تعدیل و تفسیر نظرات یک کاربر، از طریق محاسبه میانگین وزنی تجارب حاصل از نظرات وی میباشد به عنوان مثال زمانیکه کاربر امتیاز ۵ را در خصوص یک آیتم از کاربر دریافت می کند با توجه به تجارب گذشته میداند که در ۷ موردی که از کاربر امتیاز ۵ را دریافت نموده است در ۴ مورد آن نظر خودش اندکی کمتر از ۵ بوده است در نتیجه کاربر امتیاز ۵ کاربر را به ۴٫۴۳ تفسیر مینماید که این امر در جدول فوق قابل مشاهده میباشد. مطالب فوق را در قالب فرمول زیر می توان بیان نمود:
(۲۹)
برای امتیاز بیان شده توسط یک کاربر که سوابق تاریخی از سایر نظرات وی در دست نیست، تفسیر و تعدیل نظر وی معادل همان امتیاز خواهد بود. تحقیقات گذشته در این خصوص نشان داده است که بکارگیری مکانیزم تعدیل و تفسیر نظرات افراد، می تواند باعث بهبود چشمگیر دقت و کاهش خطا گردد[۸۱].
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
به جهت بهبود دقت و کاهش خطای مدل توسعه یافته TrustWalker نیز، سعی شده است تا مکانیزم تعدیل و تفسیر نظرات کاربران بکار گرفته شود و در پیاده سازی مدل جدید این امر صورت پذیرد که در فصل آینده نتیجه آزمایشات انجام پذیرفته و نتایج حاصل از آن ارائه میگردد.
۴-۳-۵- محاسبه دقیق مقدار اعتماد یا امتیاز رابطه میان دو کاربر
در مدل TrustWalker مقدار رابطه اعتماد میان کاربران به صورت مقدار ۱ یا ۰ در نظر گرفته شده است که مقدار ۱ بیانگر وجود اعتماد و مقدار ۰ نشان دهنده عدم وجود اعتماد میان دو کاربر میباشد و با توجه به این مطلب که پیمایش شبکه و انتخاب تصادفی کاربران بر اساس مقدار رابطه اعتماد میان ایشان صورت میگیرد لذا در صورتیکه بتوان مقدار دقیق اعتماد را به صورت اعشاری و بر اساس یک فرمول مشخص محاسبه نمود میتوان دقت کلی مدل را افزایش داد. با در نظر گرفتن این مطلب، کاربرانی که از مقدار اعتماد بالاتری برخوردار باشند دارای احتمال بیشتری برای انتخاب در پیمایش تصادفی شبکه میباشند بنابراین نظرات ایشان می تواند تاثیر بیشتری بر روی نتایج کلی داشته باشد. محاسبه مقدار اعتماد میان دو کاربر به صورت اعشاری و در محدوده ]۱,۰[ با تفسیر دنیای واقعی رابطه اعتماد نیز رابطه معنایی مستقیمی دارد چرا که در دنیای واقعی نیز رابطه اعتماد میان افراد به صورت مطلق نیست، بلکه به صورت فازی و در یک محدوده بیان میگردد و اعتماد افراد به یکدیگر به صورت نسبی مطرح می شود.
با توجه به مطالب فوق و براساس نظرات پیشین دو کاربر در خصوص آیتمهای مشترک، میتوان اختلاف امتیازات ایشان در خصوص آیتمهای مشترک را اساس محاسبه اعتماد میان این دو کاربر در نظر گرفت. مطابق فرمولهای شماره ۲ و ۳ بیان شده در [۸۱] و با توجه به مطلب فوق می توان برای محاسبه اعتماد میان دو کاربر u و v از فرمول زیر کمک گرفت.
(۳۰)
در فرمول فوق مجموعه آیتمهایی میباشد که مشترکا توسط دو کاربر u و v امتیاز داده شده اند و هر دو کاربر در خصوص این آیتمها دارای نظر میباشند. و به ترتیب امتیاز کاربر u به آیتم i و امتیاز کاربر v به آیتم i میباشد. عدد ۵ در مخرج کسر موجود نیز به دلیل محدوده امتیازات ]۵,۱[ می باشد.
با توجه به فرمول شماره ۳۰، این نکته قابل ذکر است که هرچه اختلاف نظر دو کاربر در خصوص آیتمهای مشترک کمتر باشد باعث افزایش خطی میزان اعتماد میان ایشان و هرچه این اختلاف بیشتر باشد باعث کاهش خطی میزان اعتماد میان ایشان میگردد.
در این تحقیق به جهت سادگی از فرمول فوق برای محاسبه اعتماد میان کاربران استفاده شده است در حالیکه میتوان از فرمولهای غیر خطی که روند تغییر میزان اعتماد را، نسبت به میزان اختلاف امتیازات دو کاربر به یک آیتم خاص را با دقت بالاتری نشان می دهند بهره جست یا می توان با توجه به سوابق نظرات کاربران، از الگوریتمهای یاد گیرنده برای محاسبه و پیش بینی میزان اعتماد دو کاربر به یکدیگر استفاده نمود .
نکته قابل ذکر این است که در این فرمول از تشابه امتیازات و نظرات کاربران در خصوص آیتمهای مشترک، میزان اعتماد محاسبه میگردد در حالیکه در دنیای واقعی، ممکن است میزان اعتماد میان افراد رابطه خاصی به نظرات مشترک ایشان نداشته باشد. این فرمول برای مجموعه دادههایی همانند movielens که کاربران آن حداقل به ۲۰ فیلم امتیاز دادهاند و دارای سوابق تاریخی مناسبی میباشند به صورت قابل قبولی عمل مینماید اما برای انجام آزمایشات با مجموعه داده epinions که دارای نقص و کمبود اطلاعات بسیار بالا میباشد و همچنین اهمیت عدم حذف رابطه اعتماد میان کاربران که به صراحت توسط ایشان بیان شده است، تنها برای تعیین میزان دقیق رابطه اعتماد میان ایشان و بر اساس تشابه نظرات، از فرمول فوق استفاده شده است.
۴-۳-۶- محاسبه ترکیبی امتیاز رابطه میان کاربران
سیستمهای توصیهگر مبتنی بر اعتماد، با در نظر گرفتن رابطه اعتماد، این امکان را برای کاربران خود فراهم کرده اند که بتوانند لیست همسایگان مد نظر خود را راسا انتخاب نمایند اما در مقابل، درصد قابل ملاحظهای از کاربرانی وجود دارد که به آیتمهای بسیاری امتیاز داده اند و میتوانند منابع مفید اطلاعاتی باشند اما به دلیل عدم انتخاب همسایگان خویش و عدم اتصال به شبکه اعتماد، سیستمهای توصیهگر مبتنی بر اعتماد قادر نخواهند بود توصیه و پیشنهادی به ایشان ارائه نمایند لذا برای حل این مسئله می توان از تکنیکهای ترکیبی، همانند ترکیب تکنیک پالایش گروهی مبتنی بر کاربر[۸۲] و تکنیکهای مبتنی بر اعتماد بهره جست که این ترکیب نهایتا به بهبود درصد پوشش منتج خواهد شد.
روش پالایش گروهی مبتنی بر کاربر بر اساس تشابه نظرات کاربران با یکدیگر استوار است که در این تحقیق برای محاسبه آن از فرمول پیرسون (فرمول شماره ۱) استفاده شده است. ارتباط میان مقوله اعتماد و تشابه کاربران اولین بار در [۸۳], [۸۴] مطرح شده است اما در [۴] نویسنده، ۵ استراتژی مختلف، برای محاسبه امتیاز رابطه میان دو کاربر u و v را بر اساس ترکیبهای مختلف تکنیکهای مبتنی بر تشابه کاربران و مبتنی بر اعتماد بیان مینماید که در ادامه به توضیح آنها پرداخته می شود.
وزن دار[۹۹] : در این حالت ترکیب تشابه کاربران و اعتماد میان ایشان بر اساس یک وزن از پیش تعریف شده محاسبه میگردد .
(۳۱)
مخلوط[۱۰۰] : در این حالت ترکیب مورد نظر با در نظر گرفتن ماکزیمم تشابه میان کاربران و اعتماد میان ایشان در نظر گرفته می شود .
(۳۲)
احتمالی[۱۰۱] : این استراتژی همسایگانی را که هم مشابه کاربر مبدا و هم مورد اعتماد وی باشند را به نسبت همسایگانی که تنها مشابه یا تنها مورد اعتماد کاربر مبدا میباشند را ترجیح و در اولویت قرار میدهد.