23 November, 2016 10:46
ترجمه ی مقاله: مدل پارتیشن بندی معکوس شاخص مبتنی بر واژگان برای پردازش پرس و جوهای توزیع شده ی کارآمد
Categories : Search Engine and Web Mining(0) Comment | (0) Trackbacks
در یک سیستم بازیابی متن توزیع شده با معماری shared-nothing ، پرس و جوها در سرتاسر یک شاخص بازیابی که در میان تعدادی از سرویس دهنده های شاخص تقسیم شده اند، پردازش می شوند. در عمل، یک شاخص یا به صورت سند و یا به صورت واژه تقسیم می شود. این انتخاب به ویژگی های زیرساخت های سخت افزاری، توزیع ترافیک پرس و جو و محدودیت هایی مانند در دسترس بودن و کارایی بستگی دارد. در پردازش پرس و جو در یک سیستم بازیابی که یک سیستم پارتیشن بندی شاخص بر اساس واژه را اتخاذ می کند، سربار ارتباطی بالا با توجه به انتقال مقادیر زیادی از داده از سرورهای شاخص، یک تنگنای عملکرد اصلی را که مقیاس پذیری کل سیستم بازیابی توزیع شده را به صورت تدریجی خراب می کند، شکل می دهد. در این کار برای کاهش این مشکل، ما یک مدل جدید برای بازیابی پارتیشن بندی شاخص ارایه می دهیم که متکی بر پارتیشن بندی ابرگراف است. در مدل ارایه شده، مستندات شاخص در دسترس به طور همزمان بر اساس الگوهای دسترسی شاخص که از لاگ های پرس و جوهای قبلی استخراج شده اند، معین شده اند. هدف این مدل به حداقل رساندن سربار ارتباطات است که بر اساس پرس و جوهای آینده به وجود می آیند. این درحالی است که همزمان تعادل بار محاسباتی در میان سرویس دهنده های شاخص حفظ می شود. ما عملکرد مدل ارایه شده را از طریق آزمایش های گسترده با استفاده از یک مجموعه متن زندگی واقعی و یک نمونه پرس و جوی جستجو ارزیابی کرده ایم. نتایج ما نشان می دهد که عملکرد قابل توجهی می تواند نسبت به استراتژی پارتیشن بندی شاخص مبتنی بر واژه به دست آید. با این حال در اغلب موارد کارایی پارتیشن بندی بر اساس سند پایین تر است.
منبع: مقاله ی A Term-Based Inverted Index Partitioning Model for Efficient Distributed Query Processing