۴-۱ خصوصیات روش پیشنهادی
همانطور که در فصل قبل اشاره شد ما تصمیم داریم با بهره گرفتن از روش TOPSIS که جزء یکی از مدلهای تصمیمگیری چند شاخصه(MADM) است مدلمان را پیاده سازی کنیم. این تکنیک از جمله روشهای جبرانی در (MADM) میباشد و منظور از جبرانی بودن این است که مبادله بین شاخصها مجاز است یعنی به طور مثال ضعف یک شاخص ممکن است توسط امتیاز شاخص دیگر جبران شود.
فلسفه کلی این روش این است که با بهره گرفتن از صفحات موجود دو صفحه فرضی تعریف میشود، یکی از صفحات مجموعهای از بهترین مقادیر مشاهده شده در ماتریس تصمیمگیری است. این صفحه را اصطلاحاً ایدهآل مثبت (بهترین حالت ممکن)مینامیم. ضمن اینکه یک صفحهی فرضی دیگر تعریف میشود که شامل بدترین حالتهای ممکن است، این صفحه ایدهآل منفی نام دارد. معیار محاسبه نمرات این روش بدین صورت است که صفحات تا حد امکان به گزینه (صفحه) ایدهآل نزدیک و از گزینه(صفحه) ایدهآل منفی دور باشد. معیارها نیز میتوانند دارای ماهیت مثبت و منفی باشند و همچنین واحد اندازه گیری آنها میتواند متفاوت باشد.
ما در این رساله روشی ارائه شده که به ازای هر پرسوجوی مشخص که ممکن است توسط تعداد زیادی از کاربران وارد شود ۵ مورد از بازخوردهای (مثبت و منفی) کاربران را بر روی لیست نتایج جستجو جمع آوری نموده و با بهره گرفتن از یکی از روشهای تصمیمگیری چندشاخصه رتبه هر سند را محاسبه کرده و اسناد را رتبهبندی کنیم. و در فواصل زمانی مشخص و با بهره گرفتن از بازخوردهای بعدی کاربران که دوباره جمع آوری میشود آن رتبهبندیها را به روز رسانی میکنیم. پنج مورد از بازخوردهای کاربران که به عنوان ۵ شاخص (که ۴ مورد اول ویژگی مثبت و مورد آخر یک ویژگی منفی است.) برای ارزیابی اسناد(صفحات وب) در نظر گرفته میشوند به قرار زیر است:
( اینجا فقط تکه ای از متن پایان نامه درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
Open click (تعداد دفعاتی که هر سایت مورد دستیابی قرار میگیرد.)
Dwell time (مدت زمانی که کاربران در هر سند زمان گذرانده اند که بر اساس ساعت در نظر گرفته میشود.)
Download (تعداد دانلودهایی که در هر صفحه رخ میدهد.)
Plus click (مجموعهای از کلیکهای مثبت که در هر صفحه رخ میدهد و مشخص کننده رضایت کاربر از انتخاب آن صفحه میباشد. مانند کلیک چپ و راست و کلیک بر روی لینکهای موجود در صفحه و غیره )
Negative click (مجموعهای از کلیکهای منفی که نشان دهنده عدم رضایت کاربران از انتخاب آن سند میباشد، مانند کلیک back , close)
از آنجایی که دادههای مورد نیاز برای تست این روش شامل اطلاعات محرمانه بوده و فقط در اختیار صاحبان موتورهای جستجو میباشد و دسترسی افراد عادی به آنها غیر ممکن است. متأسفانه هیچگونه راهی برای دستیابی به این دیتاست نبود. از طرفی اگر شخصاً میخواستم اقدام به جمع آوری داده کنیم نیاز به طراحی یک موتور جستجو و قرار دادن تعداد بسیار زیادی صفحه و ایندکس کردن و بعد رتبهبندی آن سندها بود و بعد از آماده کردن این موتور جستجو باید تعداد زیادی کامپیوتر (حداقل ۱۰۰تا) را در یک محل قرار داده و یک شبکه محلی ایجاد میکردیم و این موتور جستجوی جدید را بر روی آن قرار میدادیم و از تعداد زیادی از افراد میخواستیم که از این موتور جستجو استفاده کنند و query های دلخواهشان را وارد کرده و شروع به مرور لیست نتایج کنند و ما بازخورد رفتار آنها بر روی لیست نتایج را از لاگ موتور جستجو گرفته و شروع به رتبهبندی مجدد صفحات کنیم و به ازای یک مدت زمان مشخص این رتبهبندی را به روز کنیم. که برای بدست آوردن داده به این طریق نه امکانات لازم و نه افراد کافی داشتیم به همین دلیل این راه به نظر رسید که شبیهسازی انجام شود و رفتار سیستم و کاربر را شبیهسازی کنیم.
۴-۲ توصیف شبیهسازی مدل پیشنهادی
با بهره گرفتن از نسخه ۲۰۱۱ برنامه مطلب مدل پیشنهادی شبیهسازی شده است. برنامه به این شکل شبیهسازی میشود که در ابتدا سه ورودی مشخص را از کاربران میگیرد که این ورودیها به ترتیب عبارتند از:
تعداد کاربرانی که یک پرس وجو واحد را وارد میکنند.
تعداد دفعاتی که مجدداً بازخوردها از کاربران گرفته و یک رتبهبندی جدید صورت بگیرد و به عبارتی رتبهبندی صفحات به روز شوند.
تعداد صفحات یا سایتها به ازای یک پرس وجو خاص که قرار است با توجه به بازخورد کاربر و با بهره گرفتن از روش TOPSIS رتبهبندی شود.
در مرحله بعد ماتریس تصمیمگیری D ایجاد میشود و ۵ مورد از بازخورد کاربران شامل (open click, dwelltime, download, plus click, negative click) بر روی صفحات وب با بهره گرفتن از توزیع یکنواخت وارد میشود.
ماکزیمم کلیک مثبت برای هر کاربر ۲۰ و حداقل صفر میباشد.
ماکزیمم تعداد دانلودها برای هر ویزیت ۱۵ عدد میباشد.
ماکزیمم زمانی که یک کاربر یک سایت را ویزیت میکند ۳ ساعت و حداقل ۵ دقیقه میباشد.
از آنجایی که مقیاسهای اندازه گیری به ازای شاخصهای گوناگون متفاوت است. به منظور قابل مقایسه شدن مقیاسهای مختلف باید مقادیر بی مقیاس شوند که ما در اینجا از بین انواع مختلف روشهای موجود از روش بی مقیاس کردن با بهره گرفتن از نرم(که در فصل قبل کاملاً توضیح داده شده) استفاده کرده و بدین طریق دادهها را نرمال میکنیم.
در مرحله بعد با بهره گرفتن از روش آنتروپی اهمیت نسبی از شاخصهای موجود را بدست میآوریم.
و با بهره گرفتن از مقادیر λ که توسط خودمان مشخص میشود وزنهای بدست آمده از روش آنتروپی را تعدیل میکنیم.
lambda=[0.2 . 0.3 . 0.1 . 0.2 . 0.2]
در مرحله بعد ماتریس بی مقیاس وزینV از ضرب ماتریس ND (که امتیازات شاخصها در آن بی مقیاس شده) در Wn*n (ماتریسی قطری که از روش آنتروپی محاسبه شده است) بدست میآید. در مرحله بعدی راه حل ایدهآل و ایدهآل منفی مشخص شده و فاصله هر صفحه از ایدهآل مثبت و منفی با بهره گرفتن از روش اقلیدسی محاسبه میشود.
و در نهایت نزدیکی نسبی هر کدام از صفحات به راه حل ایدهآل محاسبه میشود و رتبه هر صفحه مشخص شده و صفحات به ترتیب صعودی مرتب میشود.
کد نوشته شده برای TOPSIS:
function = topsis( data ,sgn, w)
%UNTITLED2 Summary of this function goes here
% Detailed explanation goes here
= size(data);
Nd = data ./ repmat(sqrt(sum(data .^2)),r,1);
W=diag(w);
V=Nd * W;
AP=zeros(1,c);
AN=zeros(1,c);
for i=1:c
if sgn(i)
AP(i)=max(V(:,i));
AN(i)=min(V(:,i));
else
AP(i)=min(V(:,i));
AN(i)=max(V(:,i));
end
end
dp=sqrt(sum((V-repmat(AP,r,1)).^2,2));