SPARQL

02:16, 07/08,2014

همانطور که پایگاه داده های امروزی به منظور خواندن اطلاعات، از یک زبان استاندارد پایانی به نام SQL[1] استفاده می کنند، به منظور استخراج داده های وب معنایی نیز می توان از SPARQL[2][16]استفاده نمود. این زبان قادر است داده های مورد نظر را از منبع داده های وب معنایی استخراج کند. یکی از مثال های منبع داده های وب معنایی، DBPedia است[17]. SPARQL را می توان روی منبع داده های مختلف که با نحو های مختلف ذخیره شده اند، اجرا نموده و نتیجه را نیز در قالب های مختلف نمایش داد. SPARQL از روش های انطباق الگوی گراف[3] استفاده می کند.



[1]Structural Query Language

[2]SPARQL Protocol and RDF Query Language

[3]Graph Pattern Matching

 

 

منابع داده ای وب معنایی

02:15, 07/08,2014

داده های وب معنایی، همانند تمامی داده های دیگر نیاز به محلی جهت ذخیره شدن دارند. به منظور ذخیره سازی داده های وب معنایی، معمولا از فایل های ASCII استفاده می شود؛ بدین معنا که محتویات این فایل ها را می توان توسط نرم افزار های پردازش متن مانند NotePad باز و مشاهده نمود. داده های وب معنایی توسط یک یا چند آنتولوژی توصیف می شوند. خود آنتولوژی ها نیز در فایل های ASCII ذخیره می شوند. سپس هنگام تعریف و ایجاد فایل اصلی، داده های وب معنایی به این آنتولوژی ها ارجاع داده می شوند

داده های اصلی وب معنایی می توانند به صورت نحو[1] های مختلف مانند RDFa، N3، N-Triple، Turtle ذخیره شوند. برای استخراج این داده ها از زبان SPARQLاستفاده می شود که این زبان قابلیت خواندن اطلاعات با تمامی نحو های فوق را دارد. آن چه که اهمیت دارد این است که مقدار داده های ذخیره شده را مستقل از نحو داده ها می توان توسط زبان SPARQL به صورت سه تایی هایی استخراج نمود. نحوه استفاده از اکثر داده ها در این پایان نامه به همین صورت است.



[1]Syntax

 

 

مثالی از سه تایی ها

02:14, 07/08,2014

برای مثال به جملات زیر توجه کنید:

Buddy Belden owns a business

The business has a web site

Buddy is the father of Lynne

این جملات ممکن است در اسناد یا نامه های یک شرکت موجود باشد و در صورت بیانآن ها به صورتی استاندارد، می توان از آن ها به عنوان دانش در شرکت استفاده کرد. این روش مدیریت دانش به صورت پایین به بالا است. جملات بالا را می توان به صورت سه تایی های زیر مطرح کرد:

<#buddy><#owns><#business>

<#business><#has-website>

<#buddy><#father-of><#Lynne>

سه تایی های بالا به زبان N3 مطرح شده اند و علامت # نشان می دهد که URI مفهوم مربوطه، همین سند جاری می باشد.

 

 

عبارات RDF

02:13, 07/08,2014

هر عبارت   RDFبیانگر یک فقره اطلاعاتی در وب معنایی است که به صورت سه تایی[1]فاعل[2]، مسند[3] و مفعول[4] بیان می شود. فاعل و مسند خود از نوع منبع یا URI[5] هستندو مفعول نیز می تواند از نوع منبع یا رشته ای ثابت[6] باشد.URI ها شبیه URL هستند که مشخصه ای منحصر به فرد را برای هر موجودیت فراهم می کنند. گاهی به عبارات RDF، سه تایی نیز گفته می شود.علت این است که هر عبارت RDF شامل سه قسمت است.



[1]Triple

[2]Subject

[3]Predicate

[4]Object

[5]Uniform Resource Identifier

[6]Literal

 

 

معماری وب معنایی

01:49, 07/08,2014

به منظور ایجادیک محیط معنایی برای وب و همچنین رسیدن به اهداف در نظر گرفته شده و رفع مشکلات مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در محیط کنونی وب، «معماری هفت لایه وب معنایی» توسط W3C(کنسرسیوم جهانی وب) مطرح شده است.این معماری هفت لایه در شکل زیر آمده است.

  

 


 

پشته وب معنایی

01:46, 07/08,2014

با توجه به گسترش روز افزون اطلاعات در وب و نیازهای جدید به وجود آمده، محققان به این نتیجه رسیده اند که با استفاده از تکنیک های کنونی مورد استفاده در وب، نیازهای انسان ها به طورکامل پاسخ داده نمی‌شود و در حقیقت وب راه زیادی را تا رسیدن به پتانسیل کامل خود دارد. ساده و قابل فهم بودن وب کنونی این امکان را فراهم کرده تا سازمان ها و گروه های مختلف بتوانند اطلاعات خود را در آن قرار دهند و این امر باعث توسعه شگفت انگیز وب گشته است. هدف اول توسعه دهندگان وب نیز این بود که وب را فراگیر کنند. اکنون ذخیره سازی و انتشار اطلاعات با سهولت انجام می شود؛ اما این نوع ذخیره سازی مشکلات زیادی را برای بازیابی و استفاده های بعدی از اطلاعات به وجود آورده است. این مشکلات در مواردی مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در وب وجود دارد. راه حل این موضوع تغییر تفکر نسبت به داده ها و پیشرفت آن‌ها در جهتی هوشمند و همچنین بیان آن ها در ساختار معماری وب معنایی قبل از انتشارشان است. هدف وب معنایی این است که وب را بیش از آن که به شبکه ای از مدارک[1] تبدیل کند به شبکه ای از داده ها[2] تبدیل نماید. منابع وبی نباید شامل رشته های یکپارچه متنی باشند، بلکه آن ها باید قادر باشند که معنای[3] موجود در متن خود را نیز آشکار سازند. البته منظور از معنا عبارت است از معنایی که توسط ماشین قابل پردازش باشد. برای نیل به هدف فوق، وب معنایی باید بین تصورات وواقعیت های موجود در منابع وب، تعامل برقرار نماید. در واقع همانطور که ما در دنیای حقیقی نیاز به زبان مشترک برای انتقال مفاهیم و معانی داریم، در دنیای مجازی نیز نیاز به آن احساس می شود. وب معنایی به عنوان یک راه حل برای این مشکلات به وجود آمده است که هدف از آن به اشتراک گذاشتن اطلاعات در وب به صورتی هوشمند تر است به صورتی که نه تنها قابل فهم برای انسان باشند، بلکه ماشین ها نیز توانایی فهم آن را داشته باشند. در حال حاظر استفاده واقعی از تکنیک وب معنایی اندک است. بخشی از این مسئله به پیچیدگی مدل زیربنایی و این حقیقت که هنوز ما فاقد برنامه های کاربردی هستیم که به اندازه کافی این نوع پیچیدگی را پنهان نمایند بر می گردد.



[1]Documents

[2]Data

[3]Concept

 

 

سطوح هوشمندی داده

01:46, 07/08,2014

قدم اول در ایجاد وب معنایی تغییر تفکر نسبت به داده ها است. داده ها در وب معنایی می بایست هوشمند تر باشند تا توسط ماشین ها قابل درک باشند. به این معنی که می بایست مفاهیم بیشتری همراه با داده ها ذخیره کرد که ماشین ها توانایی درک آن ها را داشته باشند. در سطوح مختلف داده هوشمند نشان داده شده است. این روند به داده هایی که مفاهیم کافی برای درک توسط ماشین ها در خود دارند ختم می شود.

متن و پایگاه داده

اسنادXML جهت دامنه ای خاص

طبقه بندی و اسناد با واژگان آمیخته

آنتولوژی و قواعد

 

 

مفهوم وب معنایی

01:43, 07/08,2014

وب معنایی، همان طور که در ابتدا پیش بینی می شد، سیستمی است که ماشین ها را به کار می اندازد که "بفهمند" و به درخواست های پیچیده انسان براساس معنای آن ها پاسخ دهند. چنین"فهمیدن" مستلزم آن است که منابع اطلاعاتی مربوطه به طور معنایی ساختار یافته شوند؛ یعنی یک کار چالش برانگیز.

تعاریف زیر برای وب معنایی ارائه شده است:

پروژه ای با هدف ایجاد رسانه ای جهانی برای رد و بدل کردن اطلاعات به صورتی که برای کامپیوتر قابل فهم و پردازش باشد.

وب معنایی، شبکه ای از اطلاعات در مقیاس جهانی است، به نحوی که پردازش آن ها توسط ماشین به سادگی امکان پذیر است.

وب معنایی شامل داده های هوشمند وب است که توسط ماشین ها قابل پردازش است.

تمامی تعاریف فوق در یک چیز مشترک اند و آن اینکه داده های وب معنایی بایستی برای کامپیوتر قابل درک باشند که این امر توسط آنتولوژی ها انجام می گیرد. تعریف مناسبی از آنتولوژی توسط T.R.Gruber در سال 1995 ارائه شد که طی آن اظهار داشت: "آنتولوژی بیانگر مشخصات صریحی از یک مفهوم است".

تیم برنز لی[1] (پدر وب) در ابتدا چشم انداز وب معنایی را این گونه توصیف کرد:

"من رویایی دارم برای وب که در آن کامپیوتر ها توانایی تحلیل تمام داده های روی وب، مثل محتوی،پیوندها و تراکنش های بین مردم و کامپیوتر ها را دارند. یک وب معنایی، که این امر را ممکن می سازد، فعلا در حال ظهور است، اما زمانی که کامل شود، روال های روزانه تجارت، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشین ها انجام می شود. عامل های هوشمند بین مردم برای دوره ای که نهایتا این امر محقق شود تبلیغ می کنند.



[1]Tim-Bernese Lee

 

 

فناوری‌های وب معنایی و جایگاه آن‌ها در داده‌کاوی

01:39, 07/08,2014

وب سنتی دارای معایب زیادی است؛ از جمله اینکه واحد های داده‌ای در آن اسناد هستند و این اسناد از طریق ابرمتن[1]به یکدیگر پیوند خورده اند، اما این پیوند‌ها حاوی هیچگونه معنی و مفهومی نیستند و صرفاً ارتباط بین اسناد را نشان می دهند. از جهتی این اسناد تنها شامل متون غیر ساخت یافته می باشند که تنها توسط انسان قابل فهم هستند و در نتیجه موتور های جستجو گر به دلیل حجم بالای اسناد قادر به پردازش زبان طبیعی موجود در این اسناد نیستند؛ لذا از مکانیزم‌هایی مانند رتبه دهی بر اساس تعداد پیوند هایی که به یک سند داده شده اند[2] و میزان همخوانی موجود بین کلماتی که مورد جستجو قرار گرفته‌اند و تعداد تکرار این کلمات در آن سند، اسناد را رتبه بندی می‌کنند. علاوه بر معایب ذکر شده برای وب سنتی و موتور های جستجوی مبتنی بر آن، می توان این مورد را نیز اضافه نمود که خروجی این موتورهای جستجو تعداد زیادی صفحه است، به این معنا که اگر کاربر به دنبال جواب پرسشی باشد، بهترین حالت برای این موتور های جستجو، ارائه صفحه‌ای مرتبط با آن پرسش است که شاید جوابی نیز برای آن ذکر نشده باشد.

با ظهور وب معنایی[3]، بسیاری از مفاهیم تغییر پیدا کردند. در این تکنولوژی واحد های داده‌ای، خود داده ها هستند، به این صورت که داده ها توسط یک هستان شناسی[4] مرتبط با آن زمینه توصیف می شوند.پس از توصیف تمامی داده‌های موجود، امکان پرس و جو از داده ها با زبان طبیعی وجود دارد.



[1]Hyperlink

[2]Page Rank

[3]Semantic Web

[4]Ontology

 

 

کاوش داده

16:59, 12/23,2013
  vفرایند جستجوی اطلاعات پنهان ناشناخته در مجموعه داده بزرگ qمثال: کمک به تصمیم گیری، تحیقات بازاری ، تحلیل مالی، خرده فروشی های صنعتی vانواع کاوش q توصیفی oخلاصه کردن خصوصیات عمومی داده، یافتن الگوهای قابل تفسیر برای داده oمثال: خوشه بندی، کشف قوانین مشارکتی، کشف الگوی ترتیبی qپیشنهادی oاستنتاج و پیش بینی برای داده های فعلی از طریق داده های قبلی و پیش بینی متغیرهای ناشناخته oکلاس بندی ، رگرسیون vانواع کاوش q کلاس بندی: ایجاد یک مدل برای کلاس بندی دادهای فعلی و پیش بینی کلاس داده های بعدی(یادگیری با ناظر) oدرخت تصمیم، متد نزدیکترین همسایه، شبکه های عصبی qخوشه بندی: گروه بندی داده ها بر اساس شباهت (یادگیری بدون ناظر) oمثال خوشه بندی مشتریان بانک از طریق میزان  سرمایه و پس انداز جهت تصمیم گیری نحوه ارائه وام qقوانین مشارکتی  

 

وب معنایی

11:25, 10/27,2013
وب معنایی را می‌‌شود فضایی جهانی از جنس محاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها دانشها، دانش‌نامه‌ها و دانشگاه ها (پایگاه‌های دانش‌ - Knowledge bases) به صورتی معنی‌گرا و با توانایی درک مفهومی همدیگر در کنار هم قرار خواهند گرفت. آقاي Tim Berners-Lee،  آينده وب را بصورتي بيان کرده که بر خلاف وب کنوني فقط توسط انسانها قابل فهم نباشد بلکه توسط ماشين ها نيز قابل درک و پردازش است. ايده وب معنايي نيز از همين نکته منشا مي گيرد. در زير سه تعريف مختلف از وب معنايي ارائه شده است:

پروژه اي با هدف ايجاد رسانه اي جهاني براي رد و بدل کردن اطلاعات بصورتي که براي کامپيوتر قابل فهم و پردازش باشد.

وب معنايي، شبکه اي از اطلاعات در مقياس جهاني است به نحوي است که پردازش آنها توسط ماشين ها به سادگي امکان پذير است.

وب معنايي شامل داده هاي هوشمند وب است که توسط ماشين ها قابل پردازش است.

هر چند نزدیکی به تحقّقّ ایجاد چنان فضایی محتاج پیشرفت‌هایی جدید و کلّی‌نگرانه در بسیاری از زمینه‌های مهندسی، ریاضی، هوش مصنوعی، و به ویژه در زبان‌شناسی، فلسفه، و بسیاری از معارف دیگر انسانی خواهد بود، گام‌های اوّلیّه در این سمت برداشته شده است.