امروزه اهميت موتور هاي جستجوگر وب بر کسي پوشيده نيست. شايد تصور دنياي امروزي وب، بدون موتورهاي جستجو بسيار سخت و پيچيده باشد. موتورهاي جستجوی وب معمولا درخواست کاربران را در قالب يکسري کليد واژه دريافت مي نمايد و با بررسي اسناد ، صفحات و اطلاعات موجود در پايگاه هاي اطلاع رساني بر روي وب نتايج را در قالب آدرس‌هاي دسترسي به آن پايگاه ها، رتبه بندي نموده و به کاربر درخواست کننده ارائه مي‌نمايد.

مشکلات وب امروزي  و موتورجستجوها

وب در عين حال که به عنوان يکي از پايه هاي زندگي امروزي مطرح مي باشد و تصور نبودن آن براي خيلي افراد بسيار سخت و غير ممکن است در عين حال مشکلات زيادي دارد که بعضا با نمونه اي از  اين مشکلات برخورد کرده ايم و اگر خيلي به وب و اينترنت آشنا باشيم ممکن است راه‌هايي براي دور زدن اين مشکلات پيدا نماييم. نمونه اي از اين مشکلات در زير آمده است:

عدم درک متقابل بين انسان و ماشين

کامپيوتر ها معني و مفهوم آن چيزي که انسان مي فهمد را درک نمي کنند. مثال کلاسيک جستجوي متن ذيل در موتور جستجو و بررسي خروجي هايي است که توسط آن ارائه مي شود:

My mouse is broken. I need a new one

مشخص است اين مثال از نظر منطقي داراي اشکالاتي هست ولي به عنوان يک نمونه کلاسيک بسيار گوياست. از نظر کلي موتور جستجوي معمولي هيچ تصوري بر روي اينکه معني مورد نظر ما از mouse يک موش است يا يک موس نخواهد داشت. از اين رو براي ما ممکن است نتايج يک معني و يا در نهايت هر دو معني کلمه را بصورت ترکيبي بياورد. مشخص است در صورت تعميم اين موضوع خواهيم ديد اين مشکل کار جستجو در وب امروزي را بسيار دشوار مي کند و کاربران بايد درصد زيادي از نتايج اشتباه را تحمل نمايند چون درک متقابلي بين موتور جستجو و انسانها وجود ندارد

فقر دانش

مشکل بعدي که وجود دارد اين است که اطلاعات زيادي بر روي وب وجود دارد اما ما نمي توانيم با موتور جستجوهاي فعلي به آن دست پيدا کنيم و اين جمله معروف که :

ما در حالي فقر دانش داريم که در اطلاعات غرق شده ايم.

اطلاعات زيادي در وب وجود دارد که به دليل تفاوت و تنوع ساختاري بصورت همزمان و کنار هم قابل استفاده نيستند. براي توضيح بيشتر در اين موضوع مثالي را بررسي نماييم. فرض کنيد فردي مي خواهد براي ادامه تحصيل به يکي از کشورهاي خارج برورد البته با شرايطي که در ادامه آورده مي شود.

در ابتدا اين فرد مي خواهد که دانشگاهي معتبر ادامه تحصيل بدهد. رشته خاصي را مد نظر دارد که مي بايست آن دانشگاه اين رشته تحصيلي را داشته باشد و همچنين در موضوعي خاص علاقمند است کار نمايد که در نتيجه بايد استادي هم در آن دانشگاه وجود داشته

باشد که در اين موضوع  خاص کار کرده باشد. در کنار اين موارد شرايط و محدوديت هاي ديگري هم وجود دارد. اين فرد مي خواهد کشور مقصد ترجيحا مسلمان باشند و هزينه هاي جاري آن کشور نيز مهم و تا سطح خاصي باشد. ضمنا با توجه به بيماري خاصي که دارد و توصيه هاي پزشکي مي بايست کشور مقصد داراي آب و هواي با رطوبت بالا يا باراني باشد و البته با توجه به امنيت مسيرهاي رفت و برگشت علاقمند است از خطوط پروازي خاصي استفاده نمايد و ...

مي بينيد که تمامي اين اطلاعات بر روي اينترنت وجود دارد! اما آيا شما مي توانيد با يک جستجو و يا به راحتي بصورت همزمان به اين اطلاعات دسترسي داشته باشيد و يا اينکه مي بايست ابتدا به سايت مرجعي براي دريافت رتبه دانشگاه برويد و سپس تک تک سايت هاي دانشگاه ها را سر بزنيد تا ببينيد اين رشته تحصيلي را دارد؟ خوب سپس به صفحات اساتيد اين دانشگاه ها برويد آيا در موضوع مورد نظر شما کار مي نمايند؟ و تازه اين اول راه است موضوعات مسلمان بودن کشور، آب و هوا و ....

مشخص است براي اين جستجو اولا بايد يکي يکي سايت ها را جلو برويم و ضمنا حالت اول عمق را براي طي تمامي حالت ها تا رسيدن به شرايط مورد نظر طي نماييم. البته در بدترين حالت شما ممکن است به نتيجه اي نرسيد و مجبور شويد دوباره و با حذف يکي از محدوديت ها و شرايط جستجو را تکرار نماييد. که تصور اين موضوع بعضا سخت مي شود.

عدم لحاظ هم خانواده ها و ترکيبات کلمات

در حال حاضر به دليل جستجوي کليد واژه اي در وب امروزي ما نتايج شامل ترکيبات مختف کلمات يک عبارت را داريم که مي تواند کار را سخت نمايد. البته کلمات هم معني نيز در اين جستجو لحاظ نمي گردد. به عنوان مثال جستجوي متن ذيل در موتور جستجو را بررسي مي نماييم:

Blue Car With Red Doors

همانطور که مي بينيد نتايج در دسته هاي مختلف در خروجي وجود دارند البته با اين توضيح که نتيجه مورد نياز ما ماشين آبي با درب قرمز است.

  • ماشين آبي با درب قرمز
  • ماشين قرمز با درب آبي
  • درب منزل آبي و ماشين قرمز
  • درب منزل قرمز و ماشين آبي
  • ....

 اما اگر دقت کنيم علاوه بر نمايش تعداد زيادي از اطلاعات که مورد نظر ما نيست از جانب موتور جستجو ارائه مي شود، تعدادي از اطلاعات که مورد نياز ما هم هست نمايش نمي يابد. در اين مثال علاوه بر ماشين آبي با درب قرمز نتایج حاصل از کلمات هم معنی نمایش نمی یابد و اين خروجي از طريق وب امروزي قابل اسخراج نمي باشد.

وب معنايي Semantic Web

مجموعه اي از داده ها داشته باشيم که اين داده ها بصورتي در دسترس قرار بگيرند که هم براي انسان و هم براي ماشين قابل فهم باشند. به عبارت ديگر درک متقابلي بين انسان و ماشين بر روي مفاهيم بوجود بيايد. در حال حاضر کامپيوترها بيشتر وظيفه Present را دارند و اين درحالي است که در صورت درک متقابل دريچه جديدي با انبوهي از امکانات به روي ما باز مي گردد.

براي تعميم الگوريتم ها و روشهاي جستجوي وب اسناد به وب معنايي چندين بازبيني در فازهاي مختلف موتور جستجو لازم است. از جمله در فاز ايندکس گذاري که بايد ايندکس ها بر اساس هر المان RDF و هر ترکيب خاصي از آنها قابليت جستجو داشته باشند. در فاز رتبه بندي هم چون زمينه و نوع لينک ارتباطي بين منابع مهم است بنابراين الگوريتم هاي رتبه بندي وب اسناد بايد مورد بازبيني کامل قرار گيرند.

نتيجه گيري

امروزه حجم قابل توجه از داده هاي RDF روي وب توليد شده و ميزان اين داده ها روز به روز افزايش مي يابد و موتورهاي جستجو دروازه هاي ورود به وب معنايي هستند. وب معنايي بر روي وب امروزي بنا مي شود و قرار نيست همه چيز را تغيير بدهد. از اين رو مي توانيم وب معنايي را مکمل وب امروزي بدانيم.

بنابراين دنياي آينده وب با تغييرات فوق الذکر بسيار راحت تر و در دسترس تر خواهد بود و در نتيجه با فرض همين اطلاعات وب امروزي ما مي توانيم بسيار ساده تر به اطلاعات دسترسي داشته باشيم.

منبع اصلی : wtlab.um.ac.ir