فناوری‌های وب معنایی و جایگاه آن‌ها در داده‌کاوی

Published on 07/08,2014

وب سنتی دارای معایب زیادی است؛ از جمله اینکه واحد های داده‌ای در آن اسناد هستند و این اسناد از طریق ابرمتن[1]به یکدیگر پیوند خورده اند، اما این پیوند‌ها حاوی هیچگونه معنی و مفهومی نیستند و صرفاً ارتباط بین اسناد را نشان می دهند. از جهتی این اسناد تنها شامل متون غیر ساخت یافته می باشند که تنها توسط انسان قابل فهم هستند و در نتیجه موتور های جستجو گر به دلیل حجم بالای اسناد قادر به پردازش زبان طبیعی موجود در این اسناد نیستند؛ لذا از مکانیزم‌هایی مانند رتبه دهی بر اساس تعداد پیوند هایی که به یک سند داده شده اند[2] و میزان همخوانی موجود بین کلماتی که مورد جستجو قرار گرفته‌اند و تعداد تکرار این کلمات در آن سند، اسناد را رتبه بندی می‌کنند. علاوه بر معایب ذکر شده برای وب سنتی و موتور های جستجوی مبتنی بر آن، می توان این مورد را نیز اضافه نمود که خروجی این موتورهای جستجو تعداد زیادی صفحه است، به این معنا که اگر کاربر به دنبال جواب پرسشی باشد، بهترین حالت برای این موتور های جستجو، ارائه صفحه‌ای مرتبط با آن پرسش است که شاید جوابی نیز برای آن ذکر نشده باشد.

با ظهور وب معنایی[3]، بسیاری از مفاهیم تغییر پیدا کردند. در این تکنولوژی واحد های داده‌ای، خود داده ها هستند، به این صورت که داده ها توسط یک هستان شناسی[4] مرتبط با آن زمینه توصیف می شوند.پس از توصیف تمامی داده‌های موجود، امکان پرس و جو از داده ها با زبان طبیعی وجود دارد.



[1]Hyperlink

[2]Page Rank

[3]Semantic Web

[4]Ontology

 


http://fumblog.um.ac.ir/trackback.php?id=8779

فناوری‌های وب معنایی و جایگاه آن‌ها در داده‌کاوی

 

ارسال نظر
Info

توجه: از ارسال پيام هاي خصوصي در حالت لاگين براي نويسنده وبلاگ اجتناب نماييد.
در صورتی که در فرم ارسال نظر، نام شما توسط سیستم شناسایی شده باشد(در حالت لاگین) نظر شما بلافاصله منتشر خواهد شد.


در غیر اینصورت نظر شما پس از تایید توسط مالک وبلاگ منتشر خواهد شد.

 authimage