SPARQL

02:16, 07/08,2014

همانطور که پایگاه داده های امروزی به منظور خواندن اطلاعات، از یک زبان استاندارد پایانی به نام SQL[1] استفاده می کنند، به منظور استخراج داده های وب معنایی نیز می توان از SPARQL[2][16]استفاده نمود. این زبان قادر است داده های مورد نظر را از منبع داده های وب معنایی استخراج کند. یکی از مثال های منبع داده های وب معنایی، DBPedia است[17]. SPARQL را می توان روی منبع داده های مختلف که با نحو های مختلف ذخیره شده اند، اجرا نموده و نتیجه را نیز در قالب های مختلف نمایش داد. SPARQL از روش های انطباق الگوی گراف[3] استفاده می کند.



[1]Structural Query Language

[2]SPARQL Protocol and RDF Query Language

[3]Graph Pattern Matching

 

 

منابع داده ای وب معنایی

02:15, 07/08,2014

داده های وب معنایی، همانند تمامی داده های دیگر نیاز به محلی جهت ذخیره شدن دارند. به منظور ذخیره سازی داده های وب معنایی، معمولا از فایل های ASCII استفاده می شود؛ بدین معنا که محتویات این فایل ها را می توان توسط نرم افزار های پردازش متن مانند NotePad باز و مشاهده نمود. داده های وب معنایی توسط یک یا چند آنتولوژی توصیف می شوند. خود آنتولوژی ها نیز در فایل های ASCII ذخیره می شوند. سپس هنگام تعریف و ایجاد فایل اصلی، داده های وب معنایی به این آنتولوژی ها ارجاع داده می شوند

داده های اصلی وب معنایی می توانند به صورت نحو[1] های مختلف مانند RDFa، N3، N-Triple، Turtle ذخیره شوند. برای استخراج این داده ها از زبان SPARQLاستفاده می شود که این زبان قابلیت خواندن اطلاعات با تمامی نحو های فوق را دارد. آن چه که اهمیت دارد این است که مقدار داده های ذخیره شده را مستقل از نحو داده ها می توان توسط زبان SPARQL به صورت سه تایی هایی استخراج نمود. نحوه استفاده از اکثر داده ها در این پایان نامه به همین صورت است.



[1]Syntax

 

 

مثالی از سه تایی ها

02:14, 07/08,2014

برای مثال به جملات زیر توجه کنید:

Buddy Belden owns a business

The business has a web site

Buddy is the father of Lynne

این جملات ممکن است در اسناد یا نامه های یک شرکت موجود باشد و در صورت بیانآن ها به صورتی استاندارد، می توان از آن ها به عنوان دانش در شرکت استفاده کرد. این روش مدیریت دانش به صورت پایین به بالا است. جملات بالا را می توان به صورت سه تایی های زیر مطرح کرد:

<#buddy><#owns><#business>

<#business><#has-website>

<#buddy><#father-of><#Lynne>

سه تایی های بالا به زبان N3 مطرح شده اند و علامت # نشان می دهد که URI مفهوم مربوطه، همین سند جاری می باشد.

 

 

عبارات RDF

02:13, 07/08,2014

هر عبارت   RDFبیانگر یک فقره اطلاعاتی در وب معنایی است که به صورت سه تایی[1]فاعل[2]، مسند[3] و مفعول[4] بیان می شود. فاعل و مسند خود از نوع منبع یا URI[5] هستندو مفعول نیز می تواند از نوع منبع یا رشته ای ثابت[6] باشد.URI ها شبیه URL هستند که مشخصه ای منحصر به فرد را برای هر موجودیت فراهم می کنند. گاهی به عبارات RDF، سه تایی نیز گفته می شود.علت این است که هر عبارت RDF شامل سه قسمت است.



[1]Triple

[2]Subject

[3]Predicate

[4]Object

[5]Uniform Resource Identifier

[6]Literal

 

 

معماری وب معنایی

01:49, 07/08,2014

به منظور ایجادیک محیط معنایی برای وب و همچنین رسیدن به اهداف در نظر گرفته شده و رفع مشکلات مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در محیط کنونی وب، «معماری هفت لایه وب معنایی» توسط W3C(کنسرسیوم جهانی وب) مطرح شده است.این معماری هفت لایه در شکل زیر آمده است.

  

 


 

پشته وب معنایی

01:46, 07/08,2014

با توجه به گسترش روز افزون اطلاعات در وب و نیازهای جدید به وجود آمده، محققان به این نتیجه رسیده اند که با استفاده از تکنیک های کنونی مورد استفاده در وب، نیازهای انسان ها به طورکامل پاسخ داده نمی‌شود و در حقیقت وب راه زیادی را تا رسیدن به پتانسیل کامل خود دارد. ساده و قابل فهم بودن وب کنونی این امکان را فراهم کرده تا سازمان ها و گروه های مختلف بتوانند اطلاعات خود را در آن قرار دهند و این امر باعث توسعه شگفت انگیز وب گشته است. هدف اول توسعه دهندگان وب نیز این بود که وب را فراگیر کنند. اکنون ذخیره سازی و انتشار اطلاعات با سهولت انجام می شود؛ اما این نوع ذخیره سازی مشکلات زیادی را برای بازیابی و استفاده های بعدی از اطلاعات به وجود آورده است. این مشکلات در مواردی مانند جست و جو، بازیابی، ترکیب و مبادله اطلاعات در وب وجود دارد. راه حل این موضوع تغییر تفکر نسبت به داده ها و پیشرفت آن‌ها در جهتی هوشمند و همچنین بیان آن ها در ساختار معماری وب معنایی قبل از انتشارشان است. هدف وب معنایی این است که وب را بیش از آن که به شبکه ای از مدارک[1] تبدیل کند به شبکه ای از داده ها[2] تبدیل نماید. منابع وبی نباید شامل رشته های یکپارچه متنی باشند، بلکه آن ها باید قادر باشند که معنای[3] موجود در متن خود را نیز آشکار سازند. البته منظور از معنا عبارت است از معنایی که توسط ماشین قابل پردازش باشد. برای نیل به هدف فوق، وب معنایی باید بین تصورات وواقعیت های موجود در منابع وب، تعامل برقرار نماید. در واقع همانطور که ما در دنیای حقیقی نیاز به زبان مشترک برای انتقال مفاهیم و معانی داریم، در دنیای مجازی نیز نیاز به آن احساس می شود. وب معنایی به عنوان یک راه حل برای این مشکلات به وجود آمده است که هدف از آن به اشتراک گذاشتن اطلاعات در وب به صورتی هوشمند تر است به صورتی که نه تنها قابل فهم برای انسان باشند، بلکه ماشین ها نیز توانایی فهم آن را داشته باشند. در حال حاظر استفاده واقعی از تکنیک وب معنایی اندک است. بخشی از این مسئله به پیچیدگی مدل زیربنایی و این حقیقت که هنوز ما فاقد برنامه های کاربردی هستیم که به اندازه کافی این نوع پیچیدگی را پنهان نمایند بر می گردد.



[1]Documents

[2]Data

[3]Concept

 

 

سطوح هوشمندی داده

01:46, 07/08,2014

قدم اول در ایجاد وب معنایی تغییر تفکر نسبت به داده ها است. داده ها در وب معنایی می بایست هوشمند تر باشند تا توسط ماشین ها قابل درک باشند. به این معنی که می بایست مفاهیم بیشتری همراه با داده ها ذخیره کرد که ماشین ها توانایی درک آن ها را داشته باشند. در سطوح مختلف داده هوشمند نشان داده شده است. این روند به داده هایی که مفاهیم کافی برای درک توسط ماشین ها در خود دارند ختم می شود.

متن و پایگاه داده

اسنادXML جهت دامنه ای خاص

طبقه بندی و اسناد با واژگان آمیخته

آنتولوژی و قواعد

 

 

مفهوم وب معنایی

01:43, 07/08,2014

وب معنایی، همان طور که در ابتدا پیش بینی می شد، سیستمی است که ماشین ها را به کار می اندازد که "بفهمند" و به درخواست های پیچیده انسان براساس معنای آن ها پاسخ دهند. چنین"فهمیدن" مستلزم آن است که منابع اطلاعاتی مربوطه به طور معنایی ساختار یافته شوند؛ یعنی یک کار چالش برانگیز.

تعاریف زیر برای وب معنایی ارائه شده است:

پروژه ای با هدف ایجاد رسانه ای جهانی برای رد و بدل کردن اطلاعات به صورتی که برای کامپیوتر قابل فهم و پردازش باشد.

وب معنایی، شبکه ای از اطلاعات در مقیاس جهانی است، به نحوی که پردازش آن ها توسط ماشین به سادگی امکان پذیر است.

وب معنایی شامل داده های هوشمند وب است که توسط ماشین ها قابل پردازش است.

تمامی تعاریف فوق در یک چیز مشترک اند و آن اینکه داده های وب معنایی بایستی برای کامپیوتر قابل درک باشند که این امر توسط آنتولوژی ها انجام می گیرد. تعریف مناسبی از آنتولوژی توسط T.R.Gruber در سال 1995 ارائه شد که طی آن اظهار داشت: "آنتولوژی بیانگر مشخصات صریحی از یک مفهوم است".

تیم برنز لی[1] (پدر وب) در ابتدا چشم انداز وب معنایی را این گونه توصیف کرد:

"من رویایی دارم برای وب که در آن کامپیوتر ها توانایی تحلیل تمام داده های روی وب، مثل محتوی،پیوندها و تراکنش های بین مردم و کامپیوتر ها را دارند. یک وب معنایی، که این امر را ممکن می سازد، فعلا در حال ظهور است، اما زمانی که کامل شود، روال های روزانه تجارت، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشین ها انجام می شود. عامل های هوشمند بین مردم برای دوره ای که نهایتا این امر محقق شود تبلیغ می کنند.



[1]Tim-Bernese Lee

 

 

فناوری‌های وب معنایی و جایگاه آن‌ها در داده‌کاوی

01:39, 07/08,2014

وب سنتی دارای معایب زیادی است؛ از جمله اینکه واحد های داده‌ای در آن اسناد هستند و این اسناد از طریق ابرمتن[1]به یکدیگر پیوند خورده اند، اما این پیوند‌ها حاوی هیچگونه معنی و مفهومی نیستند و صرفاً ارتباط بین اسناد را نشان می دهند. از جهتی این اسناد تنها شامل متون غیر ساخت یافته می باشند که تنها توسط انسان قابل فهم هستند و در نتیجه موتور های جستجو گر به دلیل حجم بالای اسناد قادر به پردازش زبان طبیعی موجود در این اسناد نیستند؛ لذا از مکانیزم‌هایی مانند رتبه دهی بر اساس تعداد پیوند هایی که به یک سند داده شده اند[2] و میزان همخوانی موجود بین کلماتی که مورد جستجو قرار گرفته‌اند و تعداد تکرار این کلمات در آن سند، اسناد را رتبه بندی می‌کنند. علاوه بر معایب ذکر شده برای وب سنتی و موتور های جستجوی مبتنی بر آن، می توان این مورد را نیز اضافه نمود که خروجی این موتورهای جستجو تعداد زیادی صفحه است، به این معنا که اگر کاربر به دنبال جواب پرسشی باشد، بهترین حالت برای این موتور های جستجو، ارائه صفحه‌ای مرتبط با آن پرسش است که شاید جوابی نیز برای آن ذکر نشده باشد.

با ظهور وب معنایی[3]، بسیاری از مفاهیم تغییر پیدا کردند. در این تکنولوژی واحد های داده‌ای، خود داده ها هستند، به این صورت که داده ها توسط یک هستان شناسی[4] مرتبط با آن زمینه توصیف می شوند.پس از توصیف تمامی داده‌های موجود، امکان پرس و جو از داده ها با زبان طبیعی وجود دارد.



[1]Hyperlink

[2]Page Rank

[3]Semantic Web

[4]Ontology

 

 

انتخاب داده به عنوان دومین مرحله از فرایند داده کاوی

22:29, 07/05,2014

انتخاب داده ها: انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است که همه آن ها در داده کاوی مورد نیاز نیستند. برای فرآیند داده کاوی باید داده ها ی مورد نیاز انتخاب شوند. به عنوان مثال در پایگاه داده های مربوط به سیستم فروشگاهی، اطلاعاتی در مورد خرید مشتریان، خصوصیات آماری آن ها، تامین کنندگان، خرید، حسابداری و غیره وجود دارند. برای تعیین نحوه چیدن قفسه ها تنها به داده هایی در مورد خرید مشتریان و خصوصیات آماری آنها نیاز است. حتی در مواردی نیاز به کاوش در تمام محتویات پایگاه داده نیست؛ بلکه ممکن است به منظور کاهش هزینه عملیات، نمونه هایی از عناصر انتخاب و کاوش شوند.

 

 

انبارش داده ها به عنوان اولین مرحله از فرایند داده کاوی

22:24, 07/05,2014

انبارش داده‌ها: هدف از فرآیند انبارش داده ها، فراهم کردن یک محیط یکپارچه جهت پردازش اطلاعات است. در این فرآیند، اطلاعات مختصر، مفیدو تحلیلی در دوره های زمانی مناسب سازماندهی و ذخیره می‌شود تا بتوان از آن‌ها در فرآیند های تصمیم‌گیری که از ملزومات آن داده کاوی است، استفاده شود. به طور کلی تعریف زیر برای انبار داده ها ارائه می گردد:

انبار داده ها، مجموعه ای است موضوعی[1]، مجتمع[2]، متغیر در زمان[3] و پایدار[4] از داده ها که به منظور پشتیبانی از فرآیند مدیریت تصمیم گیری مورد استفاده قرار می گیرد.



[1]Subject Oriented

[2]Integrated

[3]Time Variant

[4]Non Volatile

 

 

مراحل فرایند کشف دانش

22:22, 07/05,2014

فرآیند کشف دانش از پایگاه داده ها شامل پنج مرحله است که عبارتند از :

انبارش داده ها[1]

انتخاب داده ها

تبدیل داده ها

کاوش در داده ها

تفسیر نتیجه



[1]Data Warehousing

 

 

کاربردهای داده‌کاوی

22:21, 07/05,2014

برخی از کاربردهای داده کاوی در محیط های واقعی عبارتند از :

خرده فروشی:

تعیین الگوهای خرید مشتریان

تجزیه و تحلیل سبد خرید بازار

پیشگویی میزان خرید مشتریان از طریق پست(فروش الکترونیکی)

بانکداری :

پیش بینی الگو های کلاهبرداری از طریق کارت های اعتباری

تشخیص مشتریان ثابت

تعیین میزان استفاده از کارت های اعتباری بر اساس گروه های اجتماعی

بیمه :

تجزیه و تحلیل دعاوی

پیشگویی میزان خرید بیمه نامه های جدید توسط مشتریان

پزشکی :

تعیین نوع رفتار با بیماران و پیشگویی میزان موفقیت اعمال جراحی

تعیین میزان موفقیت روش های درمانی در برخورد با بیماری های سخت

 

 

درجه اطمینان یک قانون همبستگی

17:21, 07/02,2014

 

  درجه اطمینان قانون همبستگی R=X->Y، برابر با درجه پشتیبانی تمام عناصری که در کل قانون آمده اند تقسیم بر درجه پشتیبانی بخش مقدم قانون به عبارت دیگر.

 اگر درجه اطمینان یک قانون از مقداریکه اصطلاحا کمترین پشتیبانی (MinConf) نام دارد بیشتر شود، این قانون به عنوان یک قانون قوی شناخته خواهد شد. این مقدار توسط کاربر تعیین می گردد.

 

 

درجه پشتیبانی یک مجموعه عنصر

17:18, 07/02,2014

درجه پشتیبانی مجموعه عنصر S ، تعداد تراکنش های داخل D است به گونه ای که شامل S  باشند. به عبارت دیگر، درجه پشتیبانی نسبی مجموعه عنصر S ، نسبت درصد تراکنش های موجود در D  که شامل S  نیز می باشند به کل تراکنش های D  می باشد. به عبارت دیگر درجه پشتیبانی می گوید که یک مجموعه عنصر چند بار یا چند درصد در کل منبع داده تکرار شده است.

 

 
1 2 3  بعدي»