فناوري‌هاي وب معنايي


سناريوهاي ذكر شده در بخش 1.2 علمي تخيلي نيستند. براي دستيابي به آنها نيازي به پيشرفت علمي انقلابي نيست. مي‌توان به صورت منطقي ادعا نمود كه چالش در پذيرش فناوري و مهندسي است و نه از لحاظ علمي: راه‌حل‌هاي جزئي براي همه بخش‌هاي مهم مساله وجود دارد. در حال حاضر بيشترين احتياجات در زمينه‌هاي مجتمع‌سازي، استاندارد كردن، توسعه ابزار و تطبيق كاربران است. اما البته پيشرفت بيشتر فناوري، به وب معنايي پيشرفته‌تري به نسبت آنچه امروزه قابل دستيابي است، منجر مي‌شود.
در بخش‌هاي آتي به چند فناوري ضروري براي دستيابي به عملكردهاي ذكر شده اشاره مي‌نماييم.
1.3.1 ابر داده صريح  
در حال حاضر محتواي وب براي خوانندگان انسان شكل گرفته است تا براي برنامه ها. HTML زبان غالبي است كه صفحات وب با آن (به طور مستقيم يا با استفاده از ابزار) نوشته مي‌شوند. بخشي از يك صفحه وب معمول متعلق به يك درمانگر ممكن است به صورت زير باشد:
<h1>Agilitas Physiotherapy Centre</h1>
Welcome to the Agilitas Physiotherapy Centre home page.
Do you feel pain? Have you had an injury? Let our staff
Lisa Davenport, Kelly Townsend (our lovely secretary)
and Steve Matthews take care of your body and soul.
<h2>Consultation hours</h2>
Mon 11am - 7pm<br>
Tue 11am - 7pm<br>
Wed 3pm - 7pm<br>
Thu 11am - 7pm<br>
Fri 11am - 3pm<p>
But note that we do not offer consultation
during the weeks of the
<a href=". . .">State Of Origin</a> games.
براي انسان‌ها اطلاعات به صورت رضايت‌بخشي ارائه شده است، اما ماشين‌ها مشكلات خود را خواهند داشت. جستجوهاي مبتني بر كلمه كليدي، كلمات physiotherapy و consultation hours را تشخيص مي‌دهند. و حتي يك عامل هوشمند ممكن است قادر به تشخيص پرسنل مركز باشد. اما در تشخيص درمانگرها از منشي دچار مشكل خواهد شد و حتي در يافتن ساعات واقعي مشاوره مشكلش حادتر مي‌گردد. (براي اين كار نياز است تا پيوند State Of Origin games را دنبال كند تا زمان برگزاري آنها را بيابد.)
رويكرد وب معنايي براي حل اينگونه مسائل توسعه عامل‌هاي ابرهوشمند نيست. در عوض پيشنهاد مي‌كند از سمت صفحه وب به مشكل حمله شود. اگر HTML با زبان مناسب‌تري جايگزين گردد، صفحات وب مي‌توانند محتواي خود را با خود حمل كنند. آنها علاوه بر شمول اطلاعات فرمت كه به ايجاد يك سند براي مخاطبان انسان كمك مي‌كند، داراي اطلاعاتي در مورد محتوايشان نيز مي‌باشند. در مثال ما ممكن است اطلاعاتي همانند آنچه در ادامه آمده وجود داشته باشد: 
<company>
<treatmentOffered>Physiotherapy</treatmentOffered>
<companyName>Agilitas Physiotherapy Centre</companyName>
<staff>
<therapist>Lisa Davenport</therapist>
<therapist>Steve Matthews</therapist>
<secretary>Kelly Townsend</secretary>
</staff>
</company>
اين ارائه به مراتب آسانتر توسط ماشين‌ها قابل پردازش است. لغت ابرداده به چنين اطلاعاتي ارجاع داده مي‌شود: داده‌هايي درباره داده‌ها. ابرداده بخش معناي داده‌ها را در خود دارد، كلمه معنا در وب معنايي از اينجا ناشي شده است.
در سناريوهاي نمونه ما در بخش 1.2 به نظر مي‌رسيد موانعي در برابر دسترسي به اطلاعات صفحات وب از قبيل جزئيات درمان، برنامه‌هاي زماني و قرار ملاقات‌ها، قيمت‌ها و توصيف محصولات، وجود ندارد. به نظر مي‌رسد تمام اطلاعات مي‌توانند بطور مستقيم از محتواي وب موجود بازيابي شود. اما همانطور كه شرح داده مي‌شود، اين اتفاق با استفاده از دستكاري داده مبتني بر متن رخ نمي‌دهد بلكه با سودبري از ابرداده قابل پردازش براي ماشين صورت مي‌گيرد.
با توجه به توسعه كنوني در صفحات وب، كاربران نيازي به مهارت در زمينه علوم كامپيوتر براي ايجاد صفحات وب ندارند و مي‌تواننداز طريق ابزاري بدين هدف نايل آيند. هنوز اين سوال مطرح است كه چرا كاربران بايد به اينگونه مسائل اهميت دهند و چرا بايد به خاطر زبان‌هاي وب معنايي HTML را رها كنند. شايد اگر موقعيت امروزي را با دوران آغازي وب مقايسه كنيم، بتوانيم پاسخي خوشبينانه به اين سوال دهيم. كاربران ابتدايي HTML را برگزيدند زيرا به صورت يك استاندارد درآمده بود و فوايدي از آن انتظار مي‌رفت كه متناسب با پذيرندگان ابتدايي بود. ديگران با توجه به ظهور ابزارهاي بهتر و بيشتر به سمت آن رفتند و به زودي HTML تبديل به استاندارد پذيرفته شده جهاني شد.
به طور مشابه، در حال حاضر پذيرش سريع XML را مشاهده مي‌كنيم. XML اولين قدم مهم است، هرچند براي درك ديد وب معنايي كافي نيست. كاربران ابتدايي، احتمالا برخي سازمان‌هاي بزرگي كه به مديريت دانش و تجارت الكترونيك B2B  علاقمندند، XML و RDF را به عنوان استانداردهاي W3C مرتبط با وب معنايي كنوني مي‌پذيرند. و اين شتاب به فروشندگان ابزار و كاربران برگزيننده فناوري بيشتر و بيشتر منجر مي‌گردد. 
اين يك گام قطعي در سرگذشت وب معنايي خواهد بود، اما همچنان يك چالش است. همانطور كه اشاره شد بزرگترين چالش كنوني يك چالش علمي نيست بلكه پذيرش فناوري است.
1.3.2 هستان شناسی
واژه هستان شناسی از فلسفه سرچشمه گرفته است. در این زمینه، از آن به عنوان نام یک زیر رشته استفاده می‌گردد، به عبارت دیگر، مطالعه ماهیت وجود (ترجمه تحت اللفظی از Oντoλoγiα کلمه یونانی) ، شاخه ای از متافیزیک است که در رابطه با شناسایی انواع چیزهایی که در واقع وجود داشته  و چگونگی توضیح آنها ، می باشد. به عنوان مثال مشاهده آنکه جهان از اشیاء خاصی ساخته شده است که می تواند به کلاس های انتزاعی، بر اساس خواص مشترک تعهد هستی‌شناسی معمولی، دسته بندی شود.
با این حال ، در سال های اخیر ، هستی‌شناسی یکی از کلماتی است که بوسیله علوم کامپیوتر ربوده شده است و یک معنای ویژه فنی پیدا کرده است که بسیار متفاوت با معنای اصلی آن است. در حال حاضر ما برای اهداف خود از واژه "يك هستی‌شناسی " بجای هستی‌شناسی صحبت می‌کنیم، ما از تعریف T. R. Gruber’s  که بعدها توسط R. Studer  دوباره تعریف شده است استفاده می‌کنیم:هستی‌شناسی بیانی صریح و رسمی از ویژگی های مفاهیم است.
به طور کلی، هستی‌شناسی یک حوزه از سخن را بطور رسمی توصیف می‌کند. . به طور معمول ، هستی شناسی شامل یک لیست محدود از اصطلاحات و روابط بین آنهاست. این اصطلاحات، مفاهیم مهم(کلاس‌هایی از اشیا)را  در یک دامنه، مشخص می‌کند. به عنوان مثال ، در محیط دانشگاه ، کارکنان ، دانش آموزان ، دوره ها ، سالن سخنرانی ، و رشته های برخی از مفاهیم مهم است.
روابط به طور معمول شامل سلسله مراتب کلاس ها است. یک سلسله مراتب مشخص می‌کند کلاسc زیر کلاسی از کلاس *c است  اگر هر جسم در c در *c نیز گنجانده شده باشد. به عنوان مثال ، تمام اعضای هیات علمی عضو كاركنان هستند. شکل 1.1 سلسسله مراتب حوزه دانشگاه را نشان می‌دهد.
به غیر از روابط زیر کلاسی، هستی‌شناسی ممکن است شامل اطلاعات زیر باشد:
خصوصیات(x می‌آموزد به y )،
محدودیت های مقدار( تنها اعضای هیات علمی می‌توانند تدریس کنند)،
عدم ارتباط وضعيت‌ها (هيات علمي و كاركنان عمومي غير مرتبط هستند)
خصوصيات روابط منطقي بین اشيا(هر دانشكده حداقل بايد ده عضو هيات علمي داشته باشد)
هستي شناسي در زمينه وب، فهم مشتركي از يك زمينه ارائه مي‌دهد. چنین درک مشترکي برای غلبه بر تفاوت در اصطلاحات لازم است. كاربرد كد زيپ ممكن است مشابه ديگر كاربرد كد در ناحيه باشد. مشكل ديگر اين است كه دو كاربرد ممكن است از يك اصطلاح مشترك با معاني متفاوت استفاده كنند. در دانشگاه الف ممكن است درس به يك رتبه(مانند علوم كامپيوتر) اشاره كند در حالي كه در دانشگاه ب به يك شئ واحد(cs 101) اشاره مي‌كند. چنين مشكلاتي مي‌تواند با نگاشت اصطلاحات خاص به يك هستي‌شناسي مشترك و يا تعريف يك نگاشت مشترك بين هستي‌شناسي‌ها مرتفع گردد. در هر حال مي‌توان به راحتي مشاهده نمود كه هستي‌شناسي از معاني به صورت قابل تفسيري حمايت مي‌كند.
هستي‌شناسي براي سازمان‌دهي و مسيريابي وب سايت‌ها مفيد است. امروزه بسياري از وب سايت‌ها در سمت چپ صفحات خود سلسله مراتب مفاهيم سطح بالاي اصطلاحات خود را به نمايش مي‌گذارند. كاربر ممكن است يكي از آنها را كليك كند تا بتواند زير دسته‌هاي آن را گسترش دهد.
همچنین ، هستی شناسی برای بهبود دقت جستجوهای وب مفيد است. موتورهای جستجو می توانند به دنبال صفحه‌اي بگردند كه در هستي‌شناسي خود به طور دقيق به مفاهيم اشاره مي‌كنند يه جاي اينكه در تمام صفحات، كه لغات به صورت كلي مبهم اتفاق مي افتند،  بگردند. بدين ترتيب مي‌توان بر تفاوت  اصطلاحات بين وب سايت‌ها و جستجوها غلبه كرد.
علاوه بر اين، جستجوهاي وب مي‌توانند از قابلیت تعميم دادن/خصوصي ساختن اطلاعات استفاده كنند. اگر يك جستجو در يافتن هر گونه صفحات مرتبط شكست بخورد، موتور جستجو ممكن است يك جستجوي عمومي‌تر را به كاربر پيشنهاد دهد. حتي ممكن است موتورهاي جستجو، چنين جستجوهايي را به طور پيش گستر، به منظور كاهش زمان واكنش در مورد قبول پيشنهاد، توسط كاربر اجرا كند. يا اگر پاسخ‌هاي زيادي يافت شد، موتور جستجو ممكن است موارد خاصي را به كاربر پيشنهاد دهد.
در هوش مصنوعي سابقه طولاني از گسترش و استفاده از زبان هستي‌شناسي وجود دارد.  اين اساس پژوهش‌هاي وب معنايي است. در حال حاضر مهمترين زبان‌هاي هستي‌شناسي در وب به شرح زير مي‌باشند:
RDF يك مدل داد‌ه‌اي  براي اشيا (منابع) و روابط بين آنهاست؛ كه مفاهيم ساده‌اي براي اين مدل داده‌اي فراهم مي‌كند؛ اين مدل داده‌اي مي‌تواند به وسيله XML syntax نمايش داده شود.
RDF Shema يك زبان توصيف لغوي براي تشريح ويژگي‌ها و كلاس‌هاي منابع RDF، همراه با مفاهيمي براي عمومي‌سازي سلسله مراتب آن ويژگي‌ها و كلاس‌ها است.
Owl يك  زبان توصيف لغوي قويتر براي تشريح ويژگي‌ها و كلاس‌ها است، از قبيل روابط بين كلاس‌ها (مانند" "disjointnes )، cardinality (مثلا "دقيقا يك";)، برابري، انواع غني‌تري از ويژگي‌ها، خصوصيات ويژگي‌ها(به عنوان مثال "تقارن";) و كلاس‌هاي شمارش شده.

Comments (1) Posted to وب معناگرا چیست؟ 04/05/2013 Edit

مدیریت دانش


موارد مورد بحث در زمینه مدیریت دانش، کسب، دسترسی و نگهداری از دانش در یک سازمان است. مدیریت دانش به عنوان یک فعالیت کلیدی در تجارت‌های بزرگ مطرح می‌شود زیرا به دانش درونی به عنوان سرمایه عقلانی می‌نگرند که به وسیله آن می‌توان به بهره‌وری بیشتر دست یافت، ارزش جدید ایجاد نمود و رقابت‌ها را افزایش داد. مدیریت دانش برای سازمان‌های بین‌المللی با بخش‌های پراکنده از لحاظ جغرافیایی دارای اهمیت خاصی است.
اکثر اطلاعات در حال حاضر با ساختار ضعیفی موجود است مانند متن، صدا و ویدئو. از دید مدیریت دانش، فناوری امروز از محدودیت‌هایی در زمینه‌های زیر رنج می‌برد:
جستجوی اطلاعات. شرکت‌ها معمولا وابسته به موتورهای جستجوی مبتنی بر کلمه کلیدی هستند که محدودیت‌های آنها به طور خلاصه ذکر شد.
استخراج اطلاعات. وقت و تلاش انسانی برای مرور سندهای بازیابی شده برای استخراج اطلاعات مرتبط مورد نیاز است. عامل‌های هوشمند کنونی قادر به انجام چنین کاری در حد رضایت‌بخش نمی‌باشند.
نگهداری اطلاعات. در حال حاضر مشکلاتی از قبیل ناسازگاری در واژگان و خطا در حذف اطلاعات منسوخ وجود دارند.
کشف اطلاعات. دانش جدیدی که به طور ضمنی در پایگاه داده شرکت‌ها وجود دارد با استفاده از داده کاوی استخراج می‌شود. هرچند این کار هنوز برای مجموعه سندهای توزیع شده و دارای ساختار ضعیف مشکل است. 
دسترسي به اطلاعات. اغلب دلخواه است كه دسترسي به اطلاعات مشخصي براي گروه‌هاي مشخصي از كارمندان محدود گردد. "ديد‌ها" كه اطلاعات مشخصي را پنهان مي‌كنند، از ديد پايگاه‌داده‌ها شناخته مي‌شوند ولي از طريق اينترنت (يا از طريق وب) به سختي قابل شناسايي هستند.
هدف وب معنايي اجازه به سيستم‌هاي مديريت دانش پيشرفته‌تري است:
دانش در فضاهاي مفهومي مطابق با معنايش سازمان‌دهي خواهد شد.
ابزارهاي اتوماتيك نگهداري را از طريق بررسي ناسازگاري‌ها و استخراج دانش جديد پشتيباني مي‌نمايند.
جستجوي مبتني بر كلمه كليدي با پاسخ به پرس‌و‌جو جايگزين مي‌شود: دانش درخواست شده بازيابي، استخراج و به طرز كاربر‌پسندانه‌اي ارائه مي‌شود.
پاسخ به پرس‌و‌جو بر روي چندين سند پشتيباني خواهد شد.
تعيين افرادي كه قابليت دسترسي به بخش‌هاي مشخصي از اطلاعات (حتي بخش‌هايي از سندها) را دارند، امكان‌پذير خواهد بود.
1.2.2 تجارت الكترونيك تجارت به مصرف‌كننده
تجارت الكترونيك تجارت-به-مصرف‌كننده (B2C) تجربه تجاري غالب كاربران وب است. يك سناريوي معمول شامل بازديد كاربر از يك يا چند فروشگاه آنلاين، مرور پيشنهادات آنها، انتخاب و سفارش محصولات مي‌باشد.
به طور ايده‌آل، يك كاربر اطلاعاتي درباره قيمت‌ها، شرايط (همچون طريقه دسترسي) همه فروشگاه‌هاي آنلاين يا حداقل همه فروشگاه‌هاي اصلي جمع‌آوري كرده و سپس بهترين پيشنهاد را انتخاب مي‌كند. اما مرور دستي براي عمل در اين مقياس بسيار زمانبر است. به طور معمول كاربر تنها از يك يا چند فروشگاه قبل از تصميم‌گيري بازديد مي‌نمايد.
براي بهبود اين وضعيت، ابزارهايي براي خريد در وب به شكل ربات‌هاي خريد وجود دارند. عامل‌هايي نرم‌افزاري كه از چندين فروشگاه بازديد مي‌كنند، اطلاعات قيمت و محصول را استخراج مي‌نمايند و يك خلاصه فروش گرد‌آوري مي‌كنند. عملكرد آنها توسط لفافه‌ها فراهم مي‌گردد. برنامه‌هايي كه اطلاعات را از يك فروشگاه آنلاين استخراج مي‌نمايند. يك لفافه براي هر فروشگاه ايجاد مي‌شود. اين رويكرد از چندين مانع رنج مي‌برد.
اطلاعات از سايت فروشگاه آنلاين از طريق جستجو كلمه كليدي و ديگر معاني از تحليل لغوي، استخراج مي‌گردد. اين فرآيند از فرضياتي درباره تقريب قسمت‌هاي مشخصي از اطلاعات استفاده مي‌برد. (به عنوان مثال  قيمت با كلمه قيمت و علامت $ كه قبل و بعد از يك عدد مثبت مي‌آيد مشخص مي‌گردد.) اين رويكرد تخميني مستعد اشتباه مي‌باشد و ضمانتي وجود ندارد كه كار كند. به دليل اين مشكلات تنها اطلاعات محدود شده اي استخراج مي‌گردد.  به عنوان مثال مخارج حمل و نقل، زمان‌هاي تحويل، محدوديت در كشور مقصد، سطح امنيت و سياست‌هاي خصوصي‌سازي معمولا استخراج نمي‌شوند.اما تمام اين فاكتورها ممكن است براي تصميم‌گيري كاربر ضروري باشد. به علاوه برنامه‌نويسي لفافه‌ها زمانبر است و تغييرات در تجهيزات فروشگاه آنلاين نيازمند دوباره برنامه‌نويسي هزينه‌بري است. 
وب معنايي به توسعه عامل‌هاي نرم‌افزاري اجازه مي‌دهدكه بتواند اطلاعات محصول وشرايط سرويس را تفسير كند:
قيمت گذاري و اطلاعات محصول به صورت صحيح استخراج شده وسياست‌هاي خصوصي‌سازي و تحويل تفسير شده و با نيازمندي‌هاي كاربر مقايسه مي‌شود.
اطلاعات اضافي در رابطه با اعتبار فروشگاه‌هاي آنلاين از ساير منابع مانند سازمان‌هاي رتبه‌بندي مستقل يا شركت‌هاي مصرف كننده، بازيابي مي‌گردد. 
برنامه‌نويسي سطح پايين لفافه‌ها كامل خواهد شد.
عامل‌هاي خريد خبره‌تر قادر خواهند بود مذاكرات اتوماتيكي را از طرف خريدار با عامل‌هاي فروشگاه هدايت كنند.
1.2.3 تجارت الكترونيك تجارت-به-تجارت
اكثر كاربران با تجارت الكترونيك B2C با بخش تجاري وب در ارتباطند اما بزرگترين وعده اقتصادي تمام فناوري‌هاي آنلاين بر اساس تجارت الكترونيك تجارت-به-تجارت (B2B) استوار است.
تجارت‌هاي سنتي با استفاده از رويكرد تبادل داده الكترونيكي (EDI) داده‌هاي خود را مبادله مي‌كردند. هرچند اين فناوري پيچيده است و تنها افراد خبره آن را درك مي‌كنند. برنامه‌نويسي و نگهداري آن مشكل بوده و مستعد خطا مي‌باشد. هر ارتباط B2B نيازمند برنامه‌نويسي جداگانه است بنابراين چنين ارتباطاتي هزينه‌برند. EDI يك فناوري ايزوله بوده و داده‌هاي مبادله شده نمي‌توانند به آساني با ديگر برنامه‌هاي تجاري مجتمع گردند.
اينترنت يك زيرساخت ايده‌آل براي ارتباط تجارت-به-تجارت به نظر مي‌رسد. شركت‌ها به طور رو به افزايشي به دنبال راه‌حل‌هاي مبتني بر اينترنت بوده و مدل‌هاي تجاري جديدي چون پرتال‌هاي B2B پديد آمده‌اند. هنوز تجارت الكترونيك B2B با كمبود استانداردها مواجه است. HTML (زبان نشانه‌گذاري ابرمتن) براي پشتيباني فعاليت‌هاي ذكر شده بطور موثر، بسيار ضعيف است: هيچ گونه ساختار يا معنايي از اطلاعات فراهم نمي‌آورد. استاندارد جديد XML يك پيشرفت بزرگ است اما هنوز تنها در مواردي كه يك توافق اولويت بر روي واژگاني كه مورد استفاده قرار مي‌گيرند و معاني آنها وجود دارد، ارتباطات را پشتيباني مي‌كند.
درك وب معنايي به شركت‌ها اجازه خواهد داد كه مشاركتشان را بدون سربار زياد آغاز نمايند. تفاوت‌ها در واژگان با استفاده از استاندارد مدل‌هاي دامنه مجرد حل خواهد شد و داده‌ها با استفاده از سرويس‌هاي انتقال مبادله مي‌شود. مزايده، مذاكرات و پيش‌نويس قراردادها به صورت اتوماتيك (يا نيمه اتوماتيك) توسط عامل‌هاي نرم افزاري صورت مي‌گيرد.
1.2.4 ويكي‌ها
در حال حاضر استفاده از WWW توسط ابزار‌هايي كه مشاركت فعال كاربران وب را فعال مي‌كند، گسترش يافته است. برخي اين توسعه را انقلابي معرفي كرده و آن را وب 2 نام داده اند.
بخشي از اين مسير شامل ويكي‌ها مي‌شود. ويكي‌ها مجموعه‌هايي از صفحات وب هستند كه به كاربران اجازه مي‌دهند از طريق يك واسط  مرورگر محتوايي را (معمولا متن ساختار يافته و پيوندهاي ابر متن) بيافزايند. سيستم‌هاي ويكي به ايجاد دانش مشاركتي كمك مي‌كند زيرا آنها آزادي تقريبا كاملي براي افزودن و تغيير اطلاعات بدون مالكيت محتوا، محدوديت‌هاي دسترسي يا گردش كار‌هاي قطعي، به كاربران مي‌دهند. سيستم‌هاي ويكي براي اهداف مختلفي بكار مي‌روند. از جمله:
توسعه بدنه‌هاي دانش در يك كوشش جمعي با همكاري رده وسيعي از كاربران. شناخته‌شده‌ترين نتيجه ويكي‌پدياي همه منظوره مي‌باشد.
مديريت دانش يك فعاليت يا يك پروژه. مانند طوفان فكري، تبادل ايده‌ها، فعاليت‌هاي همكارانه و تبادل ركوردهاي جلسات.
درحالي كه هنوز زود است كه درباره ضعف‌ها و محدوديت‌هاي اين فناوري صحبت كنيم،  سيستم‌هاي ويكي به طور قطعي مي‌توانند از استفاده از فناوري‌هاي معنايي فايده برند.  ايده اصلي اين است كه ساختاري ذاتي از يك ويكي  به وسيله پيوند بين صفحات ايجاد شود كه براي ماشين‌هايي كه در پشت هدايت محض قرار دارند، در دسترس باشد. اين كار مي‌تواند با غني‌سازي متن ساختاريافته و ابرپيوندهاي طبقه‌بندي نشده با حاشيه نويسي معنايي ارجاع كننده به مدل دانش زيرين گرفته شده از ويكي، انجام شود. براي مثال ابرپيوند از Knossos به Heraklion مي‌تواند با اطلاعاتي كه در آن قرار دارد مشروح شود. اين اطلاعات مي‌تواند براي ارائه مختص به محتوا از صفحات، پرس‌و‌جوهاي پيشرفته و تصديق سازگاري بكار رود.
1.2.5 عامل‌هاي شخصي: يك سناريوي آينده
سناريويي كه در ادامه مي‌آيد عملكردهايي را كه قابليت‌ پياده‌سازي بر پايه فناوري‌هاي وب معنايي دارند، نشان مي‌دهد.
مايكل به تازگي تصادف رانندگي كوچكي داشته است و دردي در گردن خود احساس مي‌كند. اولين پزشك معالج او يك سري جلسات فيزيودرماني پيشنهاد نمود. مايكل از عامل وب معنايي خود خواست تا برخي امكان‌ها را بررسي كند.
عامل جزئيات فيزيودرماني پيشنهادشده را از عامل دكتر بازيابي كرده و ليستي از درمانگرهاي موجود در شركت بيمه درماني مايكل را بدست آورد. عامل مراكزي را كه در شعاع ده كيلومتري از دفتر كار يا خانه مايكل قرار دارند، بررسي نموده و اعتبار آنها را بر اساس سرويس‌هاي رتبه بندي مورد اطمينان بدست آورد. سپس تلاش كرد ساعات ملاقات موجود را با تقويم مايكل تطبيق دهد. در عرض چند دقيقه عامل دو پيشنهاد ارائه داد. متاسفانه مايكل هيچكدام را نپسنديد. يكي از درمانگرها ساعات ملاقاتي در دو هفته آينده پيشنهاد كرده بود و براي ديگري مايكل مجبور مي‌شد در ساعت شلوغي رانندگي كند. بنابراين مايكل زمان‌هاي خاص‌تري تنظيم نموده و از عامل خواست تا كارش را دوباره انجام دهد.
چند دقيقه بعد عامل با يك جايگزين بازگشت: درمانگري با اعتبار بالا كه ساعات ملاقات موجود او در طي دو روز آينده بود. اگرچه تعدادي مشكل كوچك وجود داشت. برخي قرارهاي كاري كم اهميت مايكل بايد دوباره برنامه‌ريزي مي‌شد. عامل پيشنهاد داد كه در صورت تصويب راه حل مقدمات را آماده كند. همچنين درمانگر در ليست سايت بيمه نبود زيرا بيش از پوشش بيمه دستمزد دريافت مي‌كرد. عامل نام او را از يك ليست مستقل از درمانگرها يافته بود و چك كرده بود كه مايكل بر اساس سياست بيمه مي‌تواند از حداكثر پوشش بيمه استفاده كند. او همچنين با عامل درمانگر در رابطه با تخفيفي ويژه مذاكره كرده بود. درمانگر به تازگي تصميم گرفته بود كه بيش از ميانگين دستمزد دريافت نمايد و مشتاق به يافتن مريض‌هاي جديد بود.
مايكل پيشنهاد را پذيرفت چون تنها نياز بود چند دلار بيشتر بپردازد. اگرچه از آنجايي كه عامل وب معنايي را چند روز پيش نصب كرده بود، توضيحاتي در رابطه با برخي از اظهارات او خواست. از قبيل: چگونگي بدست آمدن اعتبار درمانگر، دليل ضرورت تغيير ساعت برخي قرارهاي كاري مايكل و چگونگي صورت گرفتن مذاكره در رابطه با قيمت. عامل اطلاعات متناسب را ارائه نمود.
مايكل رضايتمند بود. قرار بود عامل وب معنايي جديد او، زندگي پرمشغله اش را آسان‌تر كند. از عامل خواست تا تمام مراحل ضروري جهت اتمام كار را انجام دهد. 

Comments (0) Posted to وب معناگرا چیست؟ 03/30/2013 Edit

ماموريت وب معنايي


وب جهان گستر طريقه ارتباطات مردم با يكديگر و همچنين مسير تجارت را دچار تغيير و تحول كرده است. و در مركز انقلابي قرار گرفته است كه اكنون در حال تبديل جهان توسعه يافته به يك اقتصاد دانشي، يا به صورت كلي تر، به يك جامعه دانشي مي‌باشد.
اين توسعه نحوه انديشيدن در مورد كامپيوتر را نيز تغيير داده است. در ابتدا كامپيوترها براي محاسبات عددي به كار مي‌رفتند. در حال حاضر استفاده عمده از آنها جهت پردازش اطلاعات، برنامه‌هاي كاربردي معمول شامل سيستم‌هاي پايگاه‌داده‌اي، پردازش متن و بازي‌ها مي‌باشد. امروزه تمركز ديد نسبت به كامپيوتر‌ها به عنوان نقاط ورودي در حال تحول به سمت بزرگراه‌هاي اطلاعاتي است. 
اكثريت محتواي وب امروزي براي مصرف انسان مناسب است. حتي محتوايي كه به صورت اتوماتيك از پايگاه‌داده‌ها توليد شده است، معمولا بدون نياز به اطلاعات ساختاري اصلي موجود در پايگاه‌داده قابل ارائه است. مصارف عمده از وب در حال حاضر شامل جستجو در اطلاعات توسط مردم و استفاده از آن، جستجو جهت در تماس بودن با ديگر افراد، مرور كاتالوگ‌هايي از فروشگاه‌هاي آنلاين و سفارش محصولات با پر كردن فرم‌ها و مشاهده اجناس بزرگسالان مي شود.
اين فعاليت‌ها به طور مشخص به نحو احسن توسط ابزار نرم افزاري پشتيباني نشده‌اند. جدا از وجود پيوند‌هايي كه در بين سندها ارتباط برقرار مي‌كنند، ابزارهاي بسيار ضروري، ارزشمند و اصلي براي اين كار موتورهاي جستجو مي باشد.
موتورهاي جستجوي مبتني بر كلمه كليدي همچون Yahoo و Google ابزارهاي اصلي براي استفاده از وب امروزي است. واضح است كه وب نمي توانست به موفقيت عظيم كنوني بدوني موتورهاي جستجو دست يابد. اگرچه مشكلاتي جدي در رابطه با استفاده از آنها وجود دارد:
فراخواني بالا، دقت پايين. حتي اگر صفحات مرتبط اصلي بازيابي شود، استفاده كمي از صفحات اصلي مي توان نمود. تعداد خيلي زياد مي تواند به بدي تعداد خيلي كم باشد.
فراخواني كم يا صفر. اغلب اتفاق مي‌افتد كه هيچ پاسخ مرتبطي براي پرس‌و‌جو خود دريافت نمي‌كنيم، يا صفحات مربوط و مهم بازيابي نمي‌شود. هر چند با وجود موتورهاي جستجوي كنوني، فراخواني اندك كمتر رخ مي‌دهد ولي همچنان اتفاق مي‌افتد.
نتايج بسيار حساس به واژگانند. اغلب كلمات كليدي ابتدايي ما به نتايج دلخواه منجر نمي‌شود، در اين صورت سندهاي مرتبط داراي كلمات متفاوت با پرس‌و‌جو خواهد بود. اين مساله باعث نارضايتي مي‌شود زيرا پرس‌و‌جو‌ها با معناي مشابه بايد پاسخ هاي همانند بازگردانند.
هر كدام از نتايج تنها يك صفحه وب هستند. اگر به اطلاعاتي كه در سندهاي مختلف پخش شده‌اند نياز داشته باشيم، ابتدا بايد چندين پرس‌و‌جو براي جمع آوري سندهاي مرتبط ارسال كنيم و سپس به صورت دستي اطلاعات جزئي را استخراج كرده و به هم متصل كنيم.
جالب است كه بر خلاف پيشرفت‌هايي كه در فناوري موتور جستجو صورت گرفته است، اين مشكلات همچنان باقي مانده‌اند. به نظر مي رسد كه حجم محتواي وب از پيشرفت فناوري پيشي گرفته است.
هرچند حتي اگر يك جستجو موفقيت آميز باشد، خود فرد است كه بايد سندهاي انتخاب شده را كند تا اطلاعاتي كه به دنبال آن است استخراج گردد. بدين صورت تضمين قطعي براي بازيابي اطلاعات، اين فعاليت بسيار زمانبر، وجود ندارد. بنابراين اصطلاح بازيابي اطلاعات، كه در رابطه با موتورهاي جستجو به كار مي رود، تا حدي گمراه كننده است. مكان يابنده مي‌تواند اصطلاح مناسب‌تري باشد. علاوه بر اين نتايج جستجوها در وب براي ساير ابزارهاي نرم‌افزاری آماده و قابل دستیابی نمی‌باشد. موتورهاي جستجو اغلب برنامه‌های ایزوله‌ای هستند.
در حال حاضر مانع اصلی برای فراهم آوردن پشتیبانی بهتر از کاربران وب این است که معنای محتوای وب برای ماشین قابل دسترسی نیست. البته ابزاری وجود دارند که متن‌ها را بازیابی می‌کنند، آنها را به بخش‌هایی تقسیم می‌کنند، املای آنها را چک می‌نمایند و تعداد کلمات آنها را می‌شمارند. اما هنگامی که زمان تفسیر جملات و استخراج اطلاعات مفید برای کاربران فرا می‌رسد، قابلیت‌های نرم‌افزار کنونی بسیار محدودند. به سادگی معلوم است که تشخیص دو جمله زیر از یکدیگر دشوار می‌باشد.
من استاد علوم کامپیوتر هستم.
ممکن است فکر کنید من استاد کامپیوتر هستم.
موقعیت کنونی چگونه با استفاده از پردازش متن قابل بهبود است؟ یک راه حل این است که از محتوا به گونه‌ای که امروزه ارائه می‌شود استفاده کرده و تکنیک‌های خبره بر پایه هوش مصنوعی و زبان‌شناسی محاسباتی، توسعه رو به رشدی یابد. این رویکرد تا کنون برای مدتی دنبال شده‌است، اما برخلاف برخی پیشرفت‌ها محقق شدن آن بسیار دور می‌نماید.
یک رویکرد جایگزین، ارائه محتوای وب به شکلی است که به آسانی قابل پردازش توسط ماشین  باشد و به گونه‌ای از تکنیک‌های هوشمند استفاده گردد که بتوان از این طرز ارائه سود برد. ما به این طرح تحول وب به عنوان ابتکار وب معنایی ارجاع می‌کنیم. لازم است بدانیم که وب معنایی بزرگراه اطلاعاتی جهانی جدیدی موازی با وب جهان‌گستر موجود نخواهد بود. در عوض بتدریج وب موجود را دربرمی‌گیرد.
وب معنایی توسط کنسرسیوم وب جهان‌گستر (W3C)، یک موسسه بین‌‌المللی استانداردسازی برای وب انتشار یافت. ایده وب معنایی توسط تیم برنرز لی آغاز شد. همان شخصی که در اواخر دهه 1980 میلادی وب جهان‌گستر را ابداع نمود. او از این ابتکار انتظار درک دید اصلی او به وب و دیدی که در آن مفهوم اطلاعات نقش بسیار مهم‌تری نسبت به وب امروزی را ایفا می‌کند، دارد. 
توسعه وب معنایی شتاب صنعتی زیادی داشته و دولت‌ها سرمایه گذاری‌های زیادی در این زمینه انجام داده‌اند. دولت ایالات متحده پروژه زبان نشانه‌گذاری عامل DARPA (DAML) را برپا‌نموده است و همچنین وب معنایی در میان خطوط عمل کلیدی برنامه کاری ششم اتحاد اروپا قرار دارد.

Comments (0) Posted to وب معناگرا چیست؟ 03/25/2013 Edit

WEB3 چیست؟



«وب 3» اصطلاحی است که برای اشاره به وب آینده به کار میرود. پس از آنکه اصطلاح وب 2 برای تکامل اخیر وب رواج یافت، بسیاری از متخصصین ،روزنامه نگاران و رهبران فن، اصطلاح وب 3 را بکار بردند تا فرضیاتی درباره موج آینده تغییرات اینترنت مطرح کنند.
نظرات پیرامون مرحله بعدی سیر تکاملی وب، بسیار متفاوت است، برخی معتقدند؛ پدیدار شدن تکنولوژی وب مفهومیراه وب را تغییر خواهد داد و آنرا به سوی هوش مصنوعی خواهد برد. دیگر نظریه پردازان اظهار میکنند که وب 3 افزایش سرعت اینترنت، اپلیکیشن های تحت وب، یا پیشرفت گرافیکی رایانه، نقش کلیدی را در سیر تکاملی وب بازی خواهد کرد.
نظرات رهبران فن:
تیم برنزلی ـ مخترع وب ـ در ماه می سال 2006 گفت:
مردم مدام میپرسند وب 3 چیست؟ من فکر میکنم وقتی شما تعداد زیادی کاغذ کالک را روی هم میگذارید همه چیز ناهموار و چین خورده شده، مبهم به نظر میرسد. وب 2 و دسترسی به وب مفهومی، سراسر حجم عظیم اطلاعات را یکپارچه میکند، شما دسترسی غیر قابل باوری به منابع اطلاعاتی خواهید داشت.
در ماه می سال 2006 از اریک اسمیت ـ مدیر گوگل ـ خواسته شد تا وب 2 و وب 3* را تعریف کند. او پاسخ داد:
… اگر بخواهید که حدس بزنم که وب 3 چه خواهد بود، خواهم گفت که «وب 3» راهی متفاوت در ساخت اپلیکیشن ها است. پیش بینی من این است که «وب 3» در نهایت در قالب اپلیکیشن هایی تحقق می یابد که تکه ای از یکدیگرند. شماری از ویژگی های آنها از این قرار است: اپلیکیشن ها نسبتا کوچک ، اطلاعات توده ای ، اپلیکیشن ها روی هر وسیله ای اعم از پی سی یا تلفن همراه قابل اجرا، اپلیکیشن ها بسیار سریع و بسیار قابل کاستومایز و اپلیکیشن ها توزیعی خواهند بود، بصورت لفظ به لفظ؛ با شبکه های اجتماع، با ایمیل. شما به فروشگاه نمیروید تا آنها را بخرید… آنها نوع بسیار متفاوتی از اپلیکیشن ها خواهند بود که ما هرگز در محاسباتمان ندیده ایم.
در نوامبر سال 2006، جری یانگ ـ بنیانگذار و رئیس یاهو ـ گفت:
وب 2 خوب مستند شده و درباره آن سخن گفته اند، نیروی اینترنت با امکاناتی که در مرحله شبکه میتوان انجام داد به نقطه بحرانی رسیده است، ما همچنین از چهار سال قبل شاهد ابزارهای قدرتمند هستیم، همچنین راه های قدرتمند تعامل با شبکه را نه تنها در سخت افزار مانند کنسول های بازی و ابزارهای همراه، بلکه حتی در شاخه نرم افزار مشاهده میکنیم، شما لازم نیست که متخصص کامپیوتر باشید تا یک برنامه ایجاد کنید. ما میبینیم که توسعه بزرگ در وب 2 و وب 3، توسط مانیفست صورت میگیرد، یک اشتراک حقیقی میانی … تمایز میان حرفه ای، نیمه حرفه ای، و مصرف کننده گان محو میشود. ایجاد یک شبکه، تجارت و اپلیکیشن ها را نتیجه میدهد.
رید هاستینگس ـ بنیانگذار و مدیر Netflix ـ فرمول ساده تری برای تعریف مراحل وب دارد:
وب 1 دیال آپ بود، با 50 کیلوبایت پهنای باند، وب 2 با 1 مگابایت پهنای باند میانگین، و وب 3 با 10 مگابایت پهنای باند ثابت خواهد بود. بگونه ای که وب کاملا ویدئویی خواهد بود، آن هنگام آرزوی وب 3 تحقق خواهد یافت.
نوآوری هایی که با «وب 3» پیوند خورده اند:
اپلیکیشن های مبتنی بر وب و دسکتاپ؛
تکنولوژی وب 3 همچون نرم افزار های هوشمند که از داده های مفهومی استفاده میکنند. اندازه کوچک با چندین شرکت برای اینکه از کار با داده ها بهره وری بیشتر و موثرتری داشت. در هر صورت در سالهای اخیر عموماً روی تکنولوژی وب مفهومی تمرکز بیشتری میباشد.
منازعات پیرامون وب 3: (منازعات قابل توجه پیرامون چیستی اصطلاح وب 3 و تعریف شایسته آن)
تبدیل وب 3 به یک دیتابیس:
اولین قدم بسوی وب 3 ظهور «داده وب» است، ساختاری که اسناد در وب منتشر میشوند. فرمت های قابل استفاده، قابل کنترل و قابل جستجو همچون RDF، ICDL و microformats. رشد اخیر تکنولوژی SPARQL استانداردی برای زبان جستجو و API یی برای جستجوی سراسر RDF، دیتابیسی توزیعی روی وب فراهم کرده است. داده وب مرحله جدیدی از داده های یکپارچه و اپلیکیشن های مشارکتی را فعال کرده و داده ها را قابل دستیابی باز و قابل پیوند همچون صفحات وب ساخته است. داده وب اولین قدم از راهی است که بسوی وب کاملا مفهومی میرود. در مرحله داده وب، تمرکز بیشتر بر روی تبدیل فرمت داده های در دسترس به RDF میباشد. وب مفهومی کامل، مرحله ای از وب است که تمام پهنای داده های فرمت شده و سنتی که قالب بندی نشده اند یا محتواهای نیمه فرمت شده، (همچون صفحات وب، اسناد و مانند آن) باید در دسترس RDF و OWL که فرمتهای مفهومی میباشند قرار گیرد. اجزای تمپلت وبسایت هاباید قابل استفاده مجری وب 3 باشد تا بیشتر بتواند اطلاعات جامعی درباره محتوای سازمان یافته وبسایتها بدست آورد.
سیر تکاملی بسوی هوش مصنوعی:
همچنین وب 3 مسیر تکاملی وب را که به هوش مصنوعی منتهی میشود توصیف میکند، مسیری که وب را به شکل یک شبه انسان تبدیل میکند. برخی شکاکان معتقدند که این تصوری دست نیافتنی است. در هر صورت کمپانی هایی همچون آی بی ام و گوگل در حال تکمیل تکنولوژی های جدیدی هستند که اطلاعات شگفت انگیزی بدست می آورد مانند پیش بینی موسیقی از طریق اطلاعاتی که روی وبسایستهای موزیک موجود است. اینجا همچنین بر روی اینکه نیرویی که وب 3 را به حرکت در خواهد آورد مناقشه است؛ آیا سیستم های باهوش خواهند بود یا هوشمندی از یک نوع سازمان دهی بیشتر پدیدار خواهد شد. از سلسله ای از هوشمندی انسانها، چنانکه از راه فیلترینگ جمعیسرویسهایی همچون خوشمزه، فلیکر و دیگگ که مفاهیم را استخراج میکنند و وب موجود و واکنش انسان ها نسبت به آنرا تنظیم میکنند.
وب مفهومی و SOA:
در رابطه با مدیریت هوش مصنوعی، وب 3 میتواند تحقق و توسعه وب مفهومی باشد، تحقیقات علمی در جهت گسترش نرم افزار برای استدلال بر مبنای منطق تعریفی و عوامل هوشمند پیش میرود. بنابراین اپلیکیشن ها میتوانند عملیات استدلال منطقی را با استفاده از مجموعه قوانین منطق انجام داده و ارتباط میان مفهوم و داده روی وب را بیان کند.
سرامانا میترا دیدگاه با این دیدگاه که وب مفهومی ماهیت نسل بعدی اینترنت خواهد بود مخالف است، او فرمولی برای کپسول وب 3 ارائه میدهد.
وب 3 همچنین با همگرایی معماری جهتدار سرویس ها و وب مفهومی پیوند خورده است.
وب 3، «اینترنت سرویس ها» نیز نامیده میشود، غیر از قسمت قابل خواندن انسانی وب، سرویسهایی در دسترس SOA ماشین خواهد بود که میتوانند به سطح بالاتری از سرویس ها، ترکیب و هماهنگی دهند.
حرکت تکاملی بسوی سه بعدی
احتمال دیگر برای وب 3 این است که مسیر سه بعدی را طی کند، که توسط کنسرسیوم وب سه بعدی پشتیبانی میشود. این ممکن است وب را به یک دوره فضای سه بعدی وارد کند. مفهومی که به آینده ی *Second Life مرتبط میباشد. این ممکن است با استفاده از فضای به اشتراک گذاشته شده سه بعدی راه جدیدی برای ارتباط و مشارکت باز کند.
وب اجرایی چند لایه
وب 1 فقط قابل خواندن بود، وب با تولید محتوا همراه بود و با آنچه که سایت ارائه میکرد سازمان می یافت.
اما وب 2 بصورت «خواندنی ـ نوشتنی» توسعه یافت و کاربران نقش فعالی به عهده گرفتند.
وب 3 میتواند این مرحله را با اجازه دادن به انسانها برای تغییرات در سایت و منابع آن بیشتر ادامه دهد. با نمای رشد ثابت قدرت رایانه، این غیر قابل باور نیست که نسل بعدی سایت ها مجهز به منابعی شوند که کد مشارکتی کاربران بر روی آنها اجرا شود.
«وب اجرایی» میتواند اپلیکیشن های آنلاین را در همه توابع پلتفرم هایی که منتقل میکند در یک اینترفیس واحد … ترکیب کند.
تکنولوژی مشارکتی مقادیر
مفهوم وب 3 شامل مفهومی از وب است که «دنیای واقعی» را وب با احساس بازسازی میکند. وب 3 به این معنا پایان حلقه ی یکپارچه سازی تکنولوژی ها برای شبکه های دیجیتال است و پردازش، هضم و غیر قابل تجرید ساختن «دنیای واقعی» نوین است. در این معنا وب 3 بیولوژیکال، دیجیتال آنالوگ وبی خواهد بود که در آنجا اطلاعات از مجموعه ای از مقادیر دیجیتال آمیخته با حواس ساخته میشوند و بوسیله میانجی های آنالوگ به دنیای واقعی پیوند خورده اند.
پیشنهاد توسعه تعریف:
نوا اسپیواک وب 3 را بعنوان سومین دهه وب (2020-2010) تعریف میکند، دوره ای که تعداد زیادی از تکنولوژی های بزرگ تکمیلی همزمان به مرحله جدیدی از کمال خواهند رسید. از جمله؛
دگرگونی شکل وب به شبکه اپلیکیشن ها و محتواهای جداگانه که یکپارچه و قابل مشارکت میشوند.
اتصالات همه جا حاضر، پذیرش پهنای باند، اینترنت همراه و ابزارهای همراه در دسترس خواهند بود.
محاسبات شبکه ای، نرم افزار بعنوان مدلهای سرویس تجاری، سرویس های وب قابل مشارکت، محاسبات توزیع شده،محاسبات شبکه ای و محاسبات توده ای
تکنولوژی های باز، API ها و پرتکل های باز، قالبهای داده ای باز، نرم افزارهایی با پلتفرم متن باز و داده های باز (مانندCreative Commons و Open Data License)شناسه باز، OpenID، اعتبار باز، شناسه و اطلاعات شخصی قابل انتقال
وب هوشمند، وب مفهومی تکنولوژی هایی همچون RDF، OWL ،SWRL ،SPARQL ،GRDDL پلتفرم اپلیکیشن های مفهومی …
دیتابیس های توزیعی، دیتابیس های سراسر جهان (فعال شده با تکنولوژی وب مفهومی)
و برنامه های هوشمند، پردازش زبان طبیعی، فراگیری ماشین، استدلال ماشین، عوامل خودگردان.
 
با تشکر از مهدی سالخورده 

Comments (0) Posted to وب معناگرا چیست؟ 03/23/2013 Edit

آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی مشهد‬ برگزار می کند


 
سومین دوره سالانه کارگاه های آموزشی آزمایشگاه تخصصی فناوری وب دانشگاه فردوسی مشهد‬ 
 
Web Technology Lab
 
پیرامون موضوعات: 
وب معنایی
پردازش زبان طبیعی
داده های پیوندی
ابزارهای کاربردی
5 لغایت 9 آذر ماه 1390 
 
امکان ثبت نام در روز برگزاری کلاس ها در محل برگزاری کارگاه ها نیز امکان پذیر می باشد. 
 
برای کسب اطلاعات بیشتر، لینک زیر را مطالعه کنید.
 
مطالعه جزئیات کارگاه ها
 
 

Comments (0) Posted to وب معناگرا چیست؟ 11/25/2011 Edit

WEB3 چیست؟ ( از دیدگاه مهندس سالخورده حقیقی)


 «وب 3» اصطلاحی است که برای اشاره به وب آینده به کار میرود. پس از آنکه اصطلاح وب 2 برای تکامل اخیر وب رواج یافت، بسیاری ازمتخصصین ،روزنامه نگاران و رهبران فن، اصطلاح وب 3 را بکار بردند تا فرضیاتیدرباره موج آینده تغییرات اینترنت مطرح کنند.

نظراتپیرامون مرحله بعدی سیر تکاملی وب، بسیار متفاوت است، برخی معتقدند؛ پدیدار شدنتکنولوژی وب مفهومی راه وب راتغییر خواهد داد و آنرا به سوی هوش مصنوعی خواهد برد.دیگر نظریه پردازان اظهار میکنند که وب 3 افزایش سرعت اینترنت، اپلیکیشن های تحت وب، یا پیشرفت گرافیکی رایانه، نقش کلیدی را در سیر تکاملی وب بازی خواهد کرد.

نظرات رهبران فن:
تیم برنزلی ـ مخترع وبـ در ماه می سال 2006 گفت:
مردم مداممیپرسند وب 3 چیست؟ من فکر میکنم وقتی شما تعداد زیادی کاغذ کالک را روی هممیگذارید همه چیز ناهموار و چین خورده شده، مبهم به نظر میرسد. وب 2 و دسترسی بهوب مفهومی، سراسر حجم عظیم اطلاعات را یکپارچه میکند، شما دسترسی غیر قابل باوریبه منابع اطلاعاتی خواهید داشت.
در ماه میسال 2006 از اریک اسمیت ـ مدیر گوگل ـ خواسته شدتا وب 2 و وب 3* را تعریف کند. او پاسخ داد:
اگر بخواهیدکه حدس بزنم که وب 3 چه خواهدبود، خواهم گفت که «وب 3» راهی متفاوت در ساخت اپلیکیشن ها است. پیش بینی من ایناست که «وب 3» در نهایت در قالب اپلیکیشن هایی تحقق می یابد که تکه ای ازیکدیگرند. شماری از ویژگی های آنها از این قرار است: اپلیکیشن ها نسبتا کوچک ،اطلاعات توده ای ، اپلیکیشن ها روی هر وسیله ای اعم از پی سی یا تلفن همراه قابلاجرا، اپلیکیشن ها بسیار سریع و بسیار قابل کاستومایز و اپلیکیشن ها توزیعی خواهندبود، بصورت لفظ به لفظ؛ با شبکه های اجتماع، با ایمیل. شما به فروشگاه نمیروید تاآنها را بخرید آنها نوع بسیار متفاوتی از اپلیکیشن هاخواهند بود که ما هرگز در محاسباتمان ندیده ایم.
در نوامبرسال 2006، جری یانگ ـ بنیانگذار و رئیس یاهو ـ گفت:
وب 2 خوبمستند شده و درباره آن سخن گفته اند، نیروی اینترنت با امکاناتی که در مرحله شبکهمیتوان انجام داد به نقطه بحرانی رسیده است، ما همچنین از چهار سال قبل شاهدابزارهای قدرتمند هستیم، همچنین راه های قدرتمند تعامل با شبکه را نه تنها در سختافزار مانند کنسول های بازی و ابزارهای همراه، بلکه حتی در شاخه نرم افزار مشاهدهمیکنیم، شما لازم نیست که متخصص کامپیوتر باشید تا یک برنامه ایجاد کنید. مامیبینیم که توسعه بزرگ در وب 2 و وب 3، توسط مانیفست صورت میگیرد، یک اشتراک حقیقیمیانی تمایز میان حرفه ای، نیمه حرفه ای، ومصرف کننده گان محو میشود. ایجاد یک شبکه، تجارت و اپلیکیشن ها را نتیجه میدهد.
رید هاستینگس 
ـ بنیانگذار و مدیر Netflix ـ فرمول ساده تری برای تعریف مراحل وبدارد:
وب 1 دیالآپ بود، با 50 کیلوبایت پهنای باند، وب 2 با 1 مگابایت پهنای باند میانگین، و وب 3با 10 مگابایت پهنای باند ثابت خواهد بود. بگونه ای که وب کاملا ویدئویی خواهدبود، آن هنگام آرزوی وب 3 تحقق خواهدیافت.

نوآوری هایی که با «وب 3» پیوند خورده اند:
اپلیکیشن های مبتنی بر وب و دسکتاپ؛
تکنولوژی وب3 همچون نرم افزار های هوشمند که از داده های مفهومی استفاده میکنند. اندازه کوچکبا چندین شرکت برای اینکه از کار با داده ها بهره وری بیشتر و موثرتری داشت. در هرصورت در سالهای اخیر عموماً روی تکنولوژی وب مفهومی تمرکز بیشتری میباشد.

منازعات پیرامون وب 3: (منازعاتقابل توجه پیرامون چیستی اصطلاح وب 3 و تعریف شایسته آن)

تبدیل وب 3 به یک دیتابیس:
اولین قدمبسوی وب 3 ظهور «داده وب» است، ساختاری که اسناد در وب منتشر میشوند. فرمت های قابلاستفاده، قابل کنترل و قابل جستجو همچون RDF، ICDL و microformats. رشد اخیر تکنولوژی SPARQL استانداردی برای زبان جستجو و API یی برای جستجوی سراسر RDF، دیتابیسی توزیعی روی وب فراهم کرده است. داده وبمرحله جدیدی از داده های یکپارچه و اپلیکیشن های مشارکتی را فعال کرده و داده هارا قابل دستیابی باز و قابل پیوند همچون صفحات وب ساخته است. داده وب اولین قدم ازراهی است که بسوی وب کاملا مفهومی میرود. در مرحله داده وب، تمرکز بیشتر بر روی تبدیلفرمت داده های در دسترس به RDF میباشد. وبمفهومی کامل، مرحله ای از وب است که تمام پهنای داده های فرمت شده و سنتی که قالببندی نشده اند یا محتواهای نیمه فرمت شده، (همچون صفحات وب، اسناد و مانند آن)باید در دسترس RDF و OWL که فرمتهایمفهومی میباشند قرار گیرداجزای تمپلتوبسایت هاباید قابل استفاده مجری وب 3 باشد تا بیشتر بتواند اطلاعات جامعیدرباره محتوای سازمان یافته وبسایتها بدست آورد.

سیر تکاملی بسوی هوش مصنوعی:
همچنین وب 3مسیر تکاملی وب را که به هوش مصنوعی منتهی میشودتوصیف میکند، مسیری که وب را به شکل یک شبه انسان تبدیل میکند. برخی شکاکانمعتقدند که این تصوری دست نیافتنی است. در هر صورت کمپانی هایی همچون آی بی ام و گوگل در حالتکمیل تکنولوژی های جدیدی هستند که اطلاعات شگفت انگیزی بدست می آورد مانند پیشبینی موسیقی از طریق اطلاعاتی که روی وبسایستهای موزیک موجود است. اینجا همچنین برروی اینکه نیرویی که وب 3 را به حرکتدر خواهد آورد مناقشه است؛ آیا سیستم های باهوش خواهند بود یا هوشمندی از یک نوعسازمان دهی بیشتر پدیدار خواهد شد. از سلسله ای از هوشمندی انسانها، چنانکه از راه فیلترینگجمعیسرویسهایی همچون خوشمزه، فلیکر و 

Comments (1) Posted to وب معناگرا چیست؟ 11/15/2010 Edit

جزئیات بیشتری از وب معنایی

وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. مقاله به اجمال به توصیف پنج سطح وب معنایی می پردازد شامل: 1) آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)؛ 2) فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.){تعریف نوع سند(دی.ان.اس.)}/ فرانمای چارچوب وصیف منبع (آر.دی.اف)؛ 3) واژگان- هستی شناسی؛ 4)قواعد- منطق و برهان؛ 5)امنیت- اطمینان. مقاله با این نتیجه خاتمه می یابد که بایستی وب سایت های خود را به عنوان جزئی از یک کل در نظر بگیریم، نه در انزوا از دیگر سایت ها.


کليد واژه ها :وب معنایی


 

مقدمه

 


در حالیکه به نظر می رسد با فروکش کردن موج دات کام ها {سایت های تجاری.م.} ، بخشی از انقلاب اینترنت خاتمه یافته است، انقلاب خاموش دیگری در وب در حال وقوع است. وب تا کنون درمسیر تولید، ورود، ذخیره و نمایش اطلاعات موفق بوده است، اما بازیابی و پردازش هنوز به عنوان یک مشکل باقی است.


 

موج اول پیشرفت وب شامل ارائه حداکثر اطلاعات ممکن به شکلی بود که بتواند به صورت مستقیم در قالب زبان نشانه گذاری فرامتن (HTML)برای مخاطب نمایش داده شود. بانک های اطلاعاتی هر روز بیش از پیش تلاش می کنند اطلاعات را به شکلی تولید نمایند که قبل از نمایش برای کاربر، توسط دیگر رایانه ها قابل خواندن و پردازش باشد. آنها برای برچسب گذاری داده ها، به جای HTML از زبان نشانه گذاری توسعه پذیر (XML) بهره می برند و برخی از آنها به منظور استاندارد سازی قالب محتوا به نحوی که صرف نظر از کاربرد نهایی، توسط رایانه ها نیز قابل خواندن باشد به استفاده از چارچوب توصیف سند (RDF) روی آورده اند.

 


 

در موج جدید پیشرفت تلاش می شود تا هر شیی اطلاعاتی موجود در جهان اطلاعات به واسطه موضوع، محل، پدیدآورنده، تاریخ و دیگر ویژگی هایش توصیف شود. این نوع اطلاعات پیشتر تنها در یک بانک اطلاعاتی ذخیره می شد اما اکنون ممکن است در یک سند ذخیره شود.

 


وجه تمایز میان یک پیشینه در یک پایگاه اطلاعاتی و یک سند هر روز کم رنگ تر می شود. اطلاعات ممکن است در ابربرچسب (Metatag) ها در راس یک صفحه HTML قرار گیرد یا یک سند کامل ممکن است با استفاده از XML با بخش های مفصل نظیر عنوان، چکیده، روش ها، و نتایج کدگذاری شود.


 

این موج تازه پیشرفت را "وب معنایی"( Semantic web) می نامند. وب معنایی شیوه ای است برای ایجاد یک وب که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. این امر ممکن است از بازیابی اسناد گرفته تا جمع بندی عناصر برنامه ای مختلف برای خلق یک نرم افزار کاربردی را دربر گیرد. تیم برنرزلی (Tim Berners-Lee) {ابداع کننده وب معنایی.م.}عقاید خود را درباره این امکانات در { http://www.w3.org/2000/talks/1206-xml2k-tbl }مطرح کرده است.

 


 

وب معنایی شامل پنج سطح است:

 


1.  آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URI) ،

2.  فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (XML Schema) {تعریف نوع سند(DTD) }/ فرانمای چاچوب توصیف منبع (RDF Schema) ،

 

3.  واژگان- هستی شناسی،

 

4.  قواعد- منطق و برهان،

 

5. امنیت- اطمینان.

 

 

 

در حالیکه بسیاری از این عناصر پیشاپیش پیرامون وب وجودداشته اند، فناوری هایی که امکان بکارگیری منسجم آنها را فراهم می کند به تازگی عرضه شده اند. محدودیت های اصلی این رهیافت بیشتر از عوامل انسانی نشأت می گیرد تا از فناوری.

 

 

آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)

 

 

نقطه آغاز برای اطلاعات وب، آدرس منحصر به فرد آن است- اما آیا واقعاً منحصر به فرد است؟ ما با مکان نماهای متحدالشکل منبع (URL) به عنوان شیوه توصیف محل ها آشنا هستیم اما با ایجاد تغییر در اسامی حوزه ها و بسته شدن سایت ها، نشانگرهای منحصر به فرددیگری اتخاذ می شوند نظیر نشانگر دیجیتالی شئی (DOI) یا یو.آر.ال ثابت (برای جزئیات بیشتر نگاه کنید به http://www.purl.org. )راه حل های گوناگونی وجود دارد، این موارد را می توان به صورت کلی تر به عنوان URI ها توصیف کرد که این مزیت رادارند که اگر آدرس وب نهایی تغییر کند، URI  هنوز به محلی اشاره می کند که نهایتاً به محل اصلی منبع منتهی می شود.


 

فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.)/ فرانمای چاچوب توصیف منبع (آر.دی.اف)

 


 

زبان نشانه گذاری توسعه پذیر قبلاً در مقاله دیگری توصیف شده است(1). تولید برونداد در قالب XML ازیک بانک اطلاعاتی چه به عنوان یک صفحه وب ثابت یا یک نتیجه جستجوی پویا امر بسیار ساده ایست. این برونداد می تواند توسط یک برنامه کاربردی دیگر مورد استفاده قرر گیرد و امکان تبادل، ترکیب یا پردازش داده ها را فراهم نماید (برای جزئیات نگاه کنید به http://www.xml.org.

 


 

XML شیوه ای برای برچسب گذاری داده هاست. با این حال نیازمند یک فرانما (طرح) برای اعتبار بخشی به محتوای برچسب (Tag) هایی است که هر جزء از داده ها را توصیف می کنند. پدیدآورنده، عنوان و سال ممکن است به عنوان برچسب در سندی که توسط یک فرانما یا تعریف نوع سند (DTD) توصیف شده است درج شوند. زبان نشانه گذاری توسعه بین المللی (IDML) می تواند مثال خوبی باشد (برای اطلاعات بیشتر نگاه کنید به http://www.idmlinitiative.org/).)

 


مادامیکه به سمت یک نظام خودکار که در آن رایانه ها داده ها را تعبیر می کنند پیش می رویم، لازم است برچسب هایی برای کنترل پردازش داده ها و اطمینان از استاندارد سازی محتوا وجود داشته باشد؛ این همان جایی است که آر.دی.اف اهمیت می یابد. آر.دی.اف یک استاندارد است که گاه برای تبادل داده میان بانک های اطلاعاتی مورد استفاده قرار می گیرد.


یکی دیگر ازسیستم های کدگذاری که برای کمک به تبادل محتوا به زبان های مختلف ایجاد شده است، Unicode است. یونی کد استانداردی است برای مشخص نمودن حروفی که خارج از مجموعه کدهای ASCII قرار دارند. یونی کد یک استاندارد جهانی برای نمایش حروف و علائم فراهم نموده و تبادل ساده آنها با دیگر برنامه های کاربردی را بدون بروز اشکال در مورد حروف دارای اکسان (علائم صوتی) میسر می نماید (برای جزئیات بیشتر نگاه کنید به http://www.unicode.org/.)


 

واژگان- هستی شناسی

 


 

این مبحث، هم به واژگان رایانه نظیر واژگان مورد استفاده برای خدمت دهنده های اینترنت جهت برقراری ارتباط و تبادل اطلاعات ارتباط می یابد و هم به مفاهیمی که گروه های فعال درحوزه های موضوعی مختلف جهت تعریف حوزه موضوعی شان بکار می برند.. هر دو مورد برای اطمینان از بازیابی و نمایش اسناد یا داده های مرتبط در هنگام جستجوی کاربر به زبان طبیعی ضرورت دارند. مراحل دخیل دراین امر نه تنها شامل عبارت جستجوی ارسال شده به بانک های اطلاعاتی مختلف جهت دریافت پاسخ می شود بلکه اهمیت برقراری پیوند میان واژگان در زبان ها و رشته های مختلف را نیز دربر می گیرد.

 


قواعد- منطق و برهان

 

 

قواعدی که رایانه با اتکا به آنها به بازیابی داده ها از طیفی از منابع می پردازد در واقع همان Script ها و برنامه های نرم افزاری هستند. برخی بر این باورند که این قواعد بایستی به مرحله ای از تکامل برسند که به صورت خودکار به عنوان مثال افزایش دستمزد ها را در یک شرکت بر مبنای برآورد فروش یا تولید در اینترانت آن شرکت کنترل کنند؛ اما شاید هم در جهان علمی، اعتبار، برگرفته از گزارش ها یا نوشته های افراداست نه رایانه.

 

 

امنیت- اطمینان

 

در حالت واقعی، اگر چه ایده یک وب یکپارچه ممکن است جذاب به نظر برسد، اما هر روز بیش از پیش با محدودسازی وب از طریق ایجاد رمز عبور برای وب سایت ها مواجه می شویم. اطلاعات به طور معمول میان یک گروه از شرکت ها یا یک کنسرسیوم از سازمان ها به اشتراک گذاشته می شود. تجربه شخصی من این است که در مورد همکاری با سازمان های وابسته به سازمان ملل و بانک جهانی، اگر قرار باشد آنها با گردآوری انبوه اطلاعات یک نظام مرکزی تدارک ببینند، تردید وجود دارد. جایی که یک تعاونی یا کنسرسیوم از سازمان ها پیرامون امنیت یا نفع مشترک گرد هم می آیند، رهیافت اشتراک داده ها موفق تر است. فناوری های جدید شیوه هایی جهت وصول اطمینان از تضمین امنیت اطلاعات فراهم می کنند. به طبع، دراین صورت کاربر نیز اطمینان و اعتماد بیشتری به داده ها و نظام پیدا می کند. در نتیجه نهایتاً با مجموعه ای از وب ها مواجه خواهیم بود که از اطمینان لازم برای کاربردهای مختلف توسط گروه های متفاوت برخوردار هستند. این شبکه ها نسبت به نظام های موجود که مبتنی بر یک سازمان فراهم کننده محتوا هستند، خدمات بهتری می توانند ارائه کنند.

 

 


وب معنایی چگونه بر نظام شما اثر می گذارد؟


همه گروه های فراهم کننده اطلاعات روی وب پیشاپیش با انتخاب ابربرچسب های بکار رفته در صفحات وب خود، به نحوی در ایجاد نوعی وب معنایی مشارکت کرده اند. با انتخاب برچسب ها، به عنوان نمونه برچسب های پیشنهادی Alta Vista یا Dublin Core (http://www.purl.org/dc/) شیوه هایی جهت توصیف پدید آورنده، عنوان وموضوع یک سند فراهم می شود. انتخاب کلیدواژه موضوعی احتمالاً مشکل تر است. اگر در یک شرکت کشاورزی کار می کنید ممکن است به عنوان مثال از AGRIS یا CAB Thesaurus یا سیاهه کلید واژگان خاص خودتان استفاده کنید.

 


 

ممکن در حال استفاده از یک بانک اطلاعاتی برای ایجاد وب سایت خود باشید. دراین صورت احتمالاً با ایکس.ام.ال به عنوان شیوه ای جهت ارسال داده ها به دیگران و دریافت داده ها از دیگر منابع به منظور درونداد دسته ای داده ها آشنا باشید. وقتی این موارد پیچیده تر می شوند، ممکن است از نرم افرارهای کاربردی ای استفاده کنید که معرّف لایه های منطق و برهان در وب معنایی هستند. به عنوان مثال ممکن است تنها پذیرای دروندادی باشید که با معیارهای خاصی مطابقت داشته باشد، به یک موضوع خاص مربوط باشد و به دوره زمانی خاصی محدود شود.

 



بسیاری از وب سایت های موجود دارای حوزه های امن متکی بر رمز عبور هستند اما مشکل توسعه وب سایت ها، به ایجاد اطمینان هنگام همکاری با سایر فراهم کنندگان اطلاعات جهت ایجاد خدمات مشترک و یا همکاری با کاربران جهت ارائه خدمات برمی گردد.


روشن است مادامی که وب معنایی تا قبل از رسیدن به دیدگاه های مطرح شده توسط افرادی چون تیم برنرزلی همچنان به تکامل خود ادامه می دهد، ما بایستی وب سایت های خود را جزئی از یک کل در نظر بگیریم و نه درانزوا از دیگر سایت ها. با توجه به این ایده، ارزش آن را دارد که توجه خود را معطوف شیوه ایجاد وب سایت ها کرده و با بهره گیری از فناوری های نوین به همکاری با دیگران جهت تدارک خدمات روی آوریم.

 



* Addison, C. (2001), “the Semantic Web”, Information development, 17(2), pp. 83-84.


 

مآخذ:

 


1. Addison, C. (1999), “Extensible Markup Language”, Information development, 15(3), pp. 153-154


نکته: جهت مطالعه بیشتر در مورد وب معنایی به زبان فارسی وآشنایی بیشتر با برخی اصطلاحات بکاررفته در این مقاله رجوع کنید به: جمالی مهموئی، حمید رضا "وب معنایی: راهکاری رو به توسعه..."، اطلاع شناسی، ج.1، شماره.2 (1382 پاییز(


 


معادل انگلیسی واژه های متن:

برهان = Proof

 

تعریف نوع سند = Document Type Definition: DTD

 

زبان نشانه گذاری توسعه بین المللی = International Development Markup Language: IDML

 

زبان نشانه گذاری توسعه پذیر = eXtensible Markup Language: XML

 

زبان نشانه گذاری فرامتنی = HyperText Markup Language: HTML

 

فرانمای چاچوب توصیف منبع = Rresource Description Framework Schema

 

فرانمای زبان نشانه گذاری توسعه پذیر = (XML Schema)

 

مکان نماهای متحدالشکل منبع = Uniform Resource Locator: URL

 

مکان نماهای متحدالشکل منبع ثابت = Uniform Resource Locator: PURL Permanent

 

نشانگر دیجیتالی شئی = Digital Object Identifier: DOI

 

نشانگر متحدالشکل منبع = Uniform Resource Indicator: URI

 

هستی شناسی = Ontology

 

 

Comments (1) Posted to وب معناگرا چیست؟ 10/29/2010 Edit

Semantic Web یا Data Web یا وب3 یا همون وب معنایی

اول از همه یهتعریف کوچکی از نسخه های قبلی وب داشته باشیم.
وب 1 که همون
World Wide Web اولیه خودمون بود که سیستم فقط تک کاربره بود و یااصلآ داینامیک نبود که بعد ها تبدیل به داینامیک هم شد.
وب 2 که با ظهور تکنولوژی
Ajax (تو پرانتز) که خیلی ها هم فکر میکنن به خاطر هیمن Ajax بهش میگن وب 2ولی نه به خاطر به وجود آمدن سیستم های اشتراک کاربری مثل ویکی پدیا یا یوتیوپ بهاین نام مشهور شد
وب 3 تو این نسخه که به
Semantic Web (همون وب معنایی) معروفه تلاش محققان و صاجبنظران براینه که محتوای وب سایتها طوری نوشته بشن که علاوه بر انسان برای ماشین هم قابلدرک باشه.
همانطور که میدونید امروزه اکثر کاربرای اینترنتی برای پیدا کردن سوالات خود
Search enginها کمک بگیرند.
ولی با تمام هزینه هایی که برای موتور های جستجو می شود ولی باز هم نتایج ایده آلنشده و صفحاتی برای کاربر نشان داده میشود که اصلآ ربطی به کوئری که او میخواهدندارد.

 حالا لازم میدونم یه گزارشمختصر بدم از وب معنایی که این روزا خیلی تو بورسه و کلا هم خیلی سنش زیاد نیست.وب به رغم موفقیت‌زیادش در انتشار اطلاعات تو یه زمینه متاسفانه تا حالا به موفقیتقابل توجهی دست پیدا نکرده و اونم اینکه نقش کامپیوترا تو این فرایند انتشاراطلاعات فقط ابزاریه و اونم در حد ساده و غیر معنایی. کامپیوتر هیچ شهودی نداره ازاینکه این اطلاعات چی هستن و اصولا بر مبنای یه سری الگوریتم نسبتا کور عمل میکنه.اعمالی مثل کلاسترینگ یا دسته بندی و غیره هم کمک خاصی به این موضوع نمیکنن.کامپیوتر و برنامه‌ها باید نقش فعال‌تری ایفا کنن و بتونن اطلاعات رو تفسیر کنن ویا اینکه از اونها نتیجه‌گیری‌های جدیدی به عمل بیارن که لازم به دخالت انساننباشه.

مشکلاساسی از اونجا میاد که کامپیوترها با معنا سروکار ندارن وبیشتر به ارتباطات صفحاتو ساختار گیر میدن تا معنای مستتر در صفحات وب و این مخالف فرایند انسانیه که بهمعنا اهمیت بیشتر میده. دلیل اینکه به وب معنایی نیاز هست هم تا حدی واضحه . اول اینکهالگوریتم‌هایی که در رشته‌های مختلف وجود دارن وابسته به دامنة خاصی هستن و جاهایدیگه کار نمی‌کنن و ما میخوایم به یه الگوریتم یا فرایند نسبتا یکنواخت دست پیداکنیم که تو حوزة معنا کار کنه یه چیزی شبیه به مفهوم پروتکل که نمونه‌ش همین httpیا پروتکل‌هایدیگه‌س که بصورت یکنواخت و همه‌جا فهم عمل میکنن و دوم هم اینکه اصولا این مکانیسمو مفهوم وب معنایی شدیدا به کمک کاربرا میاد و میتونه قسمت اعظم کار و زحمت اونا ویا شاید زحمت‌هایی که هیچوقت امکانات انسانی از پسش بر نمیان رو انجام بده مثلاینکه 100 ژورنال رو بخونه و مقالة مورد نظر ما رو پیدا کنه و یا اینکه از خوندنیه سری از اونا و سرزدن به کلی سایت و صفحه بتونه به نتایجی برسه که کار ما روشدیدا ساده کنه.

تیمبرنرز-لی این اصطلاح وب معنایی رو بعنوان افزایش  یک منطقبرای وب بکار برد و ابداع کرد. و هدفش هم این بود که تمامی پتانسیل وب رو بااستفاده از متاداده‌هایی که میتونن برا ماشین قابل فهم باشن ، استخراج کنه.

میبینینچقدر این ایده و مفهوم میتونه زندگی رو راحت کنه و یا شاید امکاناتی رو بوجودبیاره که قبلا خوابشم نمی‌دیدیم؟ حالا اومدن و فکر کردن که برای تحقق این رویا چهکاری میتونیم انجام بدیم و ایدة متاداده یا metadata که چیزیشبیه tagهستش اولین ابزاریه که به ذهن میرسه. مسئلة اول اینه که یه syntax مورد قبولهمه برای نمایش این متاداده فراهم کنیم که این کار رو سازمان W3C انجام داده که همون کنسرسیوم WWWهستش. دو زبان استانداردی که معرفی شدن عبارتن از RDF- Resource Description Format  و   OWL  که همون WebOntology Languageهستش و یا DAML+OIL و SHOE که بازمورد استفاده قرار میگیرن. حالا لازمه که محافل علمی و صنعت از این دو استانداردحمایت کنن که حمایت‌ها و هماهنگ‌سازی‌ها شروع شدن. زبونایی که گفتم کلی چیزای دیگهلازم دارن مثلا زبونی برای گرفتن Query که در مورد RDF اسمش هست RQL.

مسئلةاساسی تر با داشتن نحو زبان‌ها داشتن فرهنگ لغاتیه که بشه باهاش صحبت کرد و اینالبته از یه حوزه به حوزة دیگه کاملا متفاوته و اصطلاحا این فرهنگ لغات و واژگانرو Ontology میگن. حالا اینکه این آنتولوژی‌هااز کجا میان به چند صورت ممکنه. صورت اول اینه که یه سری آدم متتخصص تو هر رشتهبشینن و زحمتشو بکشن که خیلی شبیه کاریه که یاهو اوائل انجام میداد و خوب محدودیتداره و نمیشه این حجم عظیم دانش رو بصورت دستی زحمتشو کشید. روش دیگر استفاده ازالگوریتم‌های مناسب روی توده‌های عظیم متنی یا corpusها هستش و استفاده از یادگیری ماشین و روشهای آماری و خلاصه هر روشی که بهذهنتون میرسه(میتونین مقاله بدین اینجا).  استفادهاز منطق در این وب بصورت وسیعی انجام میشه و قاعدتا منطق مرتبةاول و توسیع‌های اونو یا شبکه‌های معنایی و معادل فرمال اونها یعنی Description Logic  نقش عمده‌ای دارن و بد نیست به زبانی مثل Event Calculusاشاره کنم که به نظر من پتانسیل‌های بسیار وسیعی تو این حوزه و مدل کردندانش common sense داره.

استفادهاز منطق در وب معنایی منحصر به منطق کلاسیک و monotonicنیست و در واقع نیاز به فرمالیسم‌های nonmonotonicو Default Reasoning هست که با فرایند استنتاج انسانیهمخوان باشن و در واقع tolterance بالایی داشته باشن . از اینفرمالیسم‌های معروف میتونم به Circumscription و Default Logic یا model preference  آقای Shoham اشاره کنم که در واقع تعمیمی ازهمون Circumscription‌هستش و یا Negationas failureکه در برنامه‌سازی منطق بکار میره و بنیاد پرولوگه. فرمالیسم‌ها بصورت خامنمیتونن بکار برن چون خیلی سریع از حل سناریوهایی مثل Yale Shooting problem  و یا StolenCar Scenario در میمونن و نیاز به کلی ریزه‌کاریو دقت فرمال و ریاضی دارن(اینجاش یه کم تخصصی شد ببخشین)

 

وب معناییساختار لایه‌ای داره که یه شکل خیلی معروف داره و به کیک معروفه (خودتون بگردینمیتونین تو اینترنت پیداش کنین.)


حالا اینجا یکی از مسائل مهم و موردتحقیق اینه که شما بتونین بین آنتولوژی‌هایمختلف برا یه حوزه نگاشت‌هایی پیدا کنین که اونا رو به هم بنگارین و یکنواخت کنینکه اصطلاحا به این مسئلة خیلی مهم میگن
Ontologymapping Problem.میبینین اینجا کلی کار برا انجام دادن هست که نمونه‌ش میتونیم به استخراجآنتولوژی با استفاده از NLP از توده‌های متنی و یا گفتاریه و..... و آخر سر هم اینکه باز باید تاکید کنیم که باید بتونیم وب فعلی بدون متادادهرو با وب معنایی و قابل فهم و استنتاج برای ماشین ترکیب کنیم که میبینین چقدر بهمکانیزم‌های اینترفیسی نیاز داریم.

 

حالا درمورد آینده نمی‌تونیم صحبت زیادی بکنیم اما واضحه که زمان میبره تا وب معناییبتونه به جایگاهی که مدنظر خیلی هاست و اونم نقش محوری در وبه برسه اما خیلی ازجاها بصورت محلی و با آنتولوژی‌های محدود استفاده از اون داره بیشتر میشه و بدنیست اینجا به XML اشاره کنیم که چه جور تونست بهاین مقبولیت عام و این همه کاربرد و تسهیل امور در وب و پایگاه‌های داده و ...برسه پس به وب معنایی هم امیدوار باشین که نوعی از هوش مصنوعی وبی و اجتماعی هستشو میشه از ابزارهای سنتی هوش مصنوعی هم توش استفاده کرد.

 

این نوعنگرش به نمایش دانش وب و استفاده از استنتاج در اون به نظر من فوق‌العاده‌ست و منکلا به استفاده از روشهای فرمال در نمایش دانش علاقه دارم ، البته روشهای غیرفرمال در استنتاج هم جالبی خاص خودش رو داره.

خلاصه اینکه وب معنایی (معانی‌گرا و معانی‌نگر)  را می‌‌شود فضایی جهانی از جنسمحاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها دانشها،دانش‌نامه‌ها و دانشگان‌ها (پایگاه‌های دانش‌ ) به صورتی معنی‌گرا و با تواناییدرک مفهومی همدیگر در کنار هم قرار خواهند گرفت و وب معنایی شیوه ای برای ایجاد یکوب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده،آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند.

 

 

Comments (6) Posted to وب معناگرا چیست؟ 10/12/2010 Edit


درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds