ابزارهای MATLAB برای بازیابی اطلاعات

11/17/2014

سیستم بازیابی اطلاعات[۱] در مجموعه سند[۲]هایی که به فرمتهای گوناگون در پایگاه داده وجود دارد (حال این پایگاه داده ممکن است پایگاه دادة رابطه ای مستقل[۳] یا پایگاه دادة شبکه‌ای ابر متن[۴] مثل اینترنت باشد)، به دنبال اطلاعات مطلوب کاربر می‌گردد. جستجوی اطلاعات به دو صورت امکان پذیر است:

نگاه کردن کلی[۵] : در مواردی است که خواستة کاربر دقیق نباشد یا اینکه علایق کاربر گسترده باشد.

جست و جو کردن[۶] : در مواردی است که خواستة کاربر دقیق باشد.

۱-۱- مراحل بازیابی اطلاعات

در بازیابی اطلاعات چندین مرحلة مهم وجود دارد :

۱-    ایندکس‌بندی[۱]

۲-    خطی سازی سند[۲]

  • حذف نشانه‌ها و فرمت[۳]
  • نشان گذاری[۴]

۳-    فیلتر کردن[۵]

۴-    ریشه‌یابی[۶]

۵-    وزن دادن[۷]

۶-     رتبه بندی[۸]

 

[1]- Indexing

 

[2]- Document Linearization

 

[3]- Markup and Format Removal

 

[4]- Tokenization

 

[5]- Filtration

 

[6]- Stemming

 

[7]- Weighting

 

[8]- Ranking

 

[1]-Information Retrieval(IR) System

 

[2]-Document

 

[3]-Relational Stand-Alone Database

 

[4]-Hypertext Networked Database

 

[5]- Browsing

 

[6]- Quering

 

 

فایل ورد

یک فایل فشرده حاوی یک فایل:
۱. ابزارهای MATLAB برای بازیابی اطلاعات – گزارش درسی
نوع فایل:  Microsft word Office
تعداد صفحات: ۸۵
حجم: ۳ MB
 
 
رمز فایل فشرده :
www.tnt3.ir

فهرست مطالب

فهرست مطالب
فصل ۱: بازیابی اطلاعات ۵
۱-۱- سیستم بازیابی اطلاعات ۶
۱-۲- مراحل بازیابی اطلاعات ۷
۱-۲-۱- شاخصگذاری (ایندکسبندی) ۷
۱-۲-۲- خطیسازی سندها ۸
۱-۲-۳- فیلتر کردن ۱۰
۱-۲-۴- ریشه‌یابی کلمات ۱۲
۱-۲-۵- وزن‌دهی ۱۴
۱-۳- معیارهای صحت و کیفیت در بازیابی ۱۶
۱-۴- الگوهای وزن‌دهی ۱۷
۱-۴-۱- وزن‌دهی با فرکانس کلمات ۱۷
۱-۴-۲- مدل فضای برداری سالتون ۲۲
۱-۴-۳- وزن‌های محلی ۲۳
۱-۴-۴- وزن‌های سراسری ۲۴
۱-۴-۵- چگالی کلمات کلیدی ۲۵
۱-۴-۶- نارساییهای چگالی کلمه ۲۶
۱-۵- سایر روش‌های پیش پردازش زبانی ۲۶
۱-۵-۱- تشخیص زنجیرههای مرجعیتی ۲۷
۱-۵-۲- برچسب زنی معنایی نقش کلمات ۲۸
۱-۵-۳- برچسب زنی نحوی لغات ۲۸
فصل ۲: معرفی ابزار بازیابی اطلاعات Matlab 30
2-1- مقدمه ۳۱
۲-۲- نحوه نصب ابزار TMG 33
2-3- ابزار شاخص‌گذاری (ایندکس‌گذاری) ۳۵
۲-۴- ابزار کاهش ابعاد ۳۹
۲-۵- ابزار فاکتورگیری نامنفی ماتریس ۴۲
۲-۶- ابزار بازیابی اطلاعات ۴۵
۲-۷- ابزار خوشه‌بندی ۴۸
۲-۸- ابزار دسته‌بندی ۵۰
فصل ۳: ضمائم ۵۳
۳-۱- تبدیل داده‌ای ۵۴
۳-۱-۱- تجزیه ویژه‌مقدار ۵۴
۳-۱-۲- شاخص‌گذاری معنایی پنهان (LSI) 55
3-1-3- فاکتورگیری نامنفی ماتریس (NMF) 61
3-1-4- مقایسه NMF با LSI 62
3-2- خوشه‌بندی ۷۰
۳-۲-۲- رویه خوشه‌بندی ۷۱
۳-۲-۳- اندازه‌گیری شباهت ۷۲
۳-۲-۴- ساختارهای داده ۷۳
۳-۲-۵- ارزیابی ۷۴
۳-۳- خوشه‌بندی متنی ۷۴
۳-۳-۲- الگوریتم خوشه‌بندی k-Means 75
3-3-3- الگوریتم خوشه‌بندی Bisecting Kmeans 77
3-3-4- معیارهای خارجی کیفیت خوشه‌بندی ۸۰
مراجع ۸۳

 

2 Comments Add your own


  • 1. محبوبه  |  02/18,2015

    سلام آقای استیری چقدر گرونه این داکیومنتی که گذاشتید من دانشجوی ارشد فردوسی هستم. البته حل تمرین کامپایلر بنده هم بودید در کارشنناسی. دکتر صدوقی بهم گفته که در مورد روند پردازش متن یک مثال رو ارایه بدم براشون. میشه کمکم کنید؟؟

  • 2. zsana  |  06/16,2015

    با سلام آیا کتاب حل تمرین An Introduction to Information Retrieval هم در دسترس می باشد لطفا در صورت امکان به این ایمیل پاسخ دهید


Leave a Reply

ارسال نظر
Info

توجه: از ارسال پيام هاي خصوصي در حالت لاگين براي نويسنده وبلاگ اجتناب نماييد.
در صورتی که در فرم ارسال نظر، نام شما توسط سیستم شناسایی شده باشد(در حالت لاگین) نظر شما بلافاصله منتشر خواهد شد.


در غیر اینصورت نظر شما پس از تایید توسط مالک وبلاگ منتشر خواهد شد.

 authimage

درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds