مقاله  The Anatomy of a Large-Scale Hypertextual Web Search Engine
 
خلاصه:

در این مقاله، گوگل، یک نمونه از یک موتور جستجو بزرگ در مقیاس بزرگ را ارائه می دهد که از ساختار موجود در ابرمتن استفاده زیادی می کند. گوگل برای خزش کردن و نمایه‌سازی وب به طور موثر طراحی شده و نتایج جستجوی بسیار رضایت بخش بیشتری نسبت به سیستم های موجود تولید می کند. نمونه اولیه با یک پایگاه داده متن کامل و ابرلینک با حداقل 24 میلیون صفحه در http://google.stanford.edu/ در دسترس است. مهندسی موتور جستجو یک کار چالش برانگیز است. موتورهای جستجو ده ها تا صدها میلیون صفحه وب را که شامل تعداد قابل ملاحظه‌ای از اصطلاحات متمایز است نمایه می کنند. آنها هر روز ده ها میلیون پرس و جو را پاسخ می دهند. علیرغم اهمیت موتورهای جستجو در مقیاس وسیع در وب، تحقیقات کمی در مورد آنها صورت گرفته است. علاوه بر این، با توجه به پیشرفت سریع تکنولوژی و گسترش وب، ایجاد موتور جستجو در وب امروز بسیار متفاوت از سه سال پیش است. این مقاله یک توصیف عمیق از موتور جستجوی مقیاس بزرگ وب ما را ارائه می دهد. به استثنای مشکلات مقیاس تکنیک های جستجوی سنتی به داده های بزرگ، چالش های فنی جدیدی در ارتباط با استفاده از اطلاعات اضافی در hypertext برای تولید نتایج جستجوی بهتر وجود دارد. این مقاله به این سوال از نحوه ساخت یک سیستم مقیاس بزرگ عملی می پردازد که می تواند اطلاعات اضافی موجود در ابرمتن را مورد بهره برداری قرار دهد. همچنین ما به مشکل مقابله موثر با مجموعه های ابرمتن کنترل نشده نگاه می کنیم، جایی که هر کسی می تواند چیزی را که می خواهد منتشر کند.

 مقاله اصلی :

 The Anatomy of a Large-Scale Hypertextual Web Search Engine- english

لینک ترجمه مقاله:

The Anatomy of a Large-Scale Hypertextual Web Search Engine- farsi