وبلاگ شخصی ملیحه حریری

این وبلاگ برای درج گزارشات درس موتورهای جستجو و وب کاوی طراحی شده است

توضیحاتی پیرامون پروژه

9523430050 | 31 January, 2017 11:01

1.    به دلیل اماده نبودن داده ها ی مربوط به فکاتور زمان از داده های تصادفی بین 0و1 استفاده شد اما قسمت مربوط به خواندن فایل داده های مربوط به ان در کد درنظر گرفته شده که کامنت شده است

2.    برای محاسبه رتبه صفحات  مقدار d=0.85 درنظر گرفتیم

3.    درجه خروجی هر لینک ورودی در لیست allDeg قرار گرفته است

4. مقدار اولیه رنک صفحات یک است که در یک آرایه Pr قرار گرفته ویک لیست دیگر به نام PR1 برای کپی رنک صفحات مرحله قبل در نظر گرفته شده است که ابتدا دارای مقادیر صفر است.


Normal 0 false false false EN-US X-NONE AR-SA

پیشرفت پروژه

9523430050 | 31 January, 2017 10:47

کدpage rank اصلی همراه با فاکتور زمان با موفقیت اجرا شده است که مشروح ان به این صورت است که در این برنامه که با زبان جاوا نوشته شده است ابتدا داده های کراول از یک فایل تکست با دستوراتی خوانده می شود و در لیست ذیخره می گردد سپس با توجه به لیست ulr های اصلی که در mainlist ذخیره شده است و لیست ulr هایی که در این لیست اصلی قرار دادر درجه خروجی inlinkها محاسبه می شود تا برای محاسبه رنک صفحات اصلی استفاده شود به این صورت که مجموع (رنک هز inlink تقسیم بر درجه خروجی همان inlink )شده و در فاکتور زمان و damping factor ضرب می شود و با 1-d جمع می شود و رنک هر صفحه به این صورت محاسبه می شود این مراحل به صورت بازگشتی تا 5 مرحله ادامه می یابد تا رنک هر صفحه در یک محدوده ثابت بماند یا تغییرات کمی داشته باشد 
مرحله پایانی تست رنک هر صفحه است که با موفقیت در حال انجام می باشد و گزارش پروپزال در موعد مقرر در سایت درس اپلود می شود
 
 

درج روودی های کراول شده در فایل تکست به فایل اکسل

9523430050 | 25 January, 2017 23:07

ورودی های دریافت شده از گروه کراولر با کدنویسی دز محیط جاوا از یک فایل متنی نامرتب تبدیل به یک فایل اکسل مرتب مربوط به هر لینک با لینک های ورودی آن شد . ابتدا بررسی میشود که گره جاری http است یا from url که با گذاشتن یک شرط در برنامه و بررسی نوع آن محل قرار گیری هر لینک و لینک های ارحاع به آن در سطر و ستون های ماتریس مشخص می شود قدم بعدی ساخت گراف با استفاده از این فایل اکسل است.