نسخه جدید پیکره فرقان بارگذاری شد

 

بسمه تعالی

بحمد الله با عنایت خداوند باریتعالی و با همت مسیولین مرکز آمار و اطلاعات دانشگاه و توجه ویژه جناب آقای دکتر کاهانی نسخه دوم پیکره قرآنی فرقان در سایت آزمایشگاه فناوری وب دانشگاه فردوسی مشهد بارگذاری شد.

 

برای مشاهده پروژه اینجا را کلیلک کنید

 برای دانلود توضیحات و مستندات مربوط به پروژه اینجا را کلیک کنید

رای دانلود پیکره گردآوری شده تحت عنوان پیکره فرقان، اینجا را کلیک کنید

 

پیکره قرآنی فرقان : پروژه ایجاد و انتشار زیر ساخت وب معنایی برای قرآن کریم

تیر ماه 1392 ، نسخه 2

نسخه فعلی :
http://wtlab.um.ac.ir/linkdata/quran.html
نکات :
تقسیم بندی ویژگی های صرفی و نحوی کلمات عربی
پیکره قرآنی فرقان با کد داده: D3920326a در مرجع دادگان زبان فارسی ثبت گردیده است.

 

 

 

Comments (1) Posted to پروژه قرآنی 11/04/2013 Edit

ثبت پیکره قرآنی فرقان در مرجع دادگان زبان فارسی

forghan

پیکره متنی و زیرساختی که تحت عنوان «پیکره فرقان» برای قرآن کریم تولید گردیده است، حاصل بهره‌گیری از سامانه‌ای هوشمند است که در آزمایشگاه فناوری وب دانشگاه فردوسی مشهد، طراحی و پیاده‌سازی شده است. این پیکره با بیش از 587 مگابایت داده، حاوی کلیه اطلاعات قرآنی، آماری، متن و ترجمه فارسی و انگلیسی آیات و برچسب‌گذاری صرفی و نحوی متن عربی، فارسی و انگلیسی آیات، ریشه‌یابی کلمات آنها و بسیاری موارد دیگر در قالب RDF است و امکان استفاده و کاوش را برای هرگونه پژوهش و پردازش هوشمند ایجاد کرده است. 

مالکیت معنوی: 
 آزمایشگاه فناوری وب دانشگاه فردوسی مشهد
شرایط استفاده: 

-

اطلاعات ارجاع: 

- احمد استیری، محسن کاهانی، و هادی قائمی. (۱۳۹۲). اﯾﺠﺎد و اﻧﺘﺸﺎر زﯾﺮﺳﺎﺧﺖ وب ﻣﻌﻨﺎﯾﯽ ﺑﺮای ﻗﺮآن ﮐﺮﯾﻢ. ارائه شده در پنجمین کنفرانس فناوری اطلاعات و دانش، دانشگاه شیراز.

کاربردها: 
 متن‌کاوی قرآن، پردازش زبان طبیعی، زبان‌شناسی رایانشی
اطلاعات تکمیلی: 

- دسترسی برخط به داده‌ها: http://wtlab.um.ac.ir/linkdata/quran.html 

- لینک ثبت پیکره در مرجع دادگان زبان فارسی: http://dadegan.ir/catalog/forghan  

Comments (3) Posted to پروژه قرآنی 08/02/2013 Edit

پایان فاز اول پروژه قرآنی

بسم الله الرحمن الرحیم
امام علی (ع) می فرماید: "قرآن را زمانه تفسیر می‌کند."

در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته اند و بدیهی است این مهم مستلزم بهره مندی از فناوری‌های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، "شبکه پژوهشی قرآن­ کاوی"
(Quran Mining Research Network) در دهه اخیر شکل یافته است تا با بهره گیری از فناوری‌های متن کاوی (Text Mining) ابزار پیشرفته هوش مصنوعی رایانه را در خدمت اکتشاف اطلاعات پنهان متن قرآن قرار ­دهد. محققین این شبکه تلاش دارند نه تنها بحث‌های حل نشده و شبهه‌های ایجاد شده برای قرآن را مرتفع سازند بلکه جنبه‌هایی ناشناخته از این اصلی ترین منبع هدایت به بشریت عرضه کنند.
در همین راستا طراحي و پياده‌سازي پيكره متني قرآن كريم در قالب RDF و به شكل محتواي الكترونيكي، حاوي اطلاعات صرفي و نحوي، امكان استفاده و كاوش را براي هر گونه پژوهش و پردازش هوشمند ايجاد خواهد کرد.
تبيين اعجاز زباني قرآن كريم، در دستيابي به لايه‌هاي نامشهود زباني اين متن الهي می‌باشد.
بدین ترتیب پس از فراهم شدن بستر مناسب جهت متن کاوی روی قرآن کریم می‌توان با طراحی و بهره گیری از ابزارهای متن کاوی به اکتشاف کلامی و معنایی متن قرآن کریم پرداخت.
 
بحمد الله با صرف بیش از 6 ماه تلاش برای تهیه زیر ساخت وب معنایی برای قرآن کریم بالاخره به لطف ایزد باریتعالی و عنایات حضرتش، تلاش ها به بار نشست و فاز اول پروژه به پایان رسید و کلیه داده ها و اطلاعات موجود برای استفاده پژوهشگران و محققان بر روی وب قرار گرفت.
http://wtlab.um.ac.ir/linkdata/quran.html 
امید است که این تلاش های هر چند ناچیز مورد رضایت حق تعالی قرار گیرد.
از کلیه علاقه مندان به پژوهش های قرآنی، متن کاوی و داده کاوی در قرآن کریم و سایر کتب مقدسه و حوزه های مرتبط جهت ادامه پروژه دعوت به همکاری میشود.
علاقه مندان می توانند تمایل خود برای همکاری در ادامه پروژه و همچنین نظرات، پیشنهادات و انتقادات خود را با این حقیر در میان بگذارند.
 
احمد استیری
09151702634
 ahmad.estiry66@gmail.com
 

با سپاس فراوان
 
 

Comments (1) Posted to پروژه قرآنی 12/04/2012 Edit

بالاخره پروژه قرآنی به کجا رسید؟

 

تکمیل RDF های سوره ها و آیات قرآن کریم


طراحي و پياده‌سازي پيكره متني قرآن كريم در قالب RDF  و به شكل محتواي الكترونيكي در بر گیرنده¬ی هر گونه اطلاعات مفید و سودمند برای انجام عملیات متن کاوی، اصلی ترین بخش پروژه ی ما را به خود اختصاص داده است.
ما در فاز اولیه ی پروژه که با وجود وقفه در انجام آن مجددا از سر گرفته شد، آنتولوژی ها و پیکره های قرآنی موجود را جمع آوری کرده و به طور دقیق مورد بررسی قرار دادیم و با توجه به نیازهای فعلی و اطلاعات لازم برای گام های بعدی پروژه و انجام عملیات متن کاوی بر روی قرآن تصمیم گرفتیم که در نهایت، یک قالب ثابت برای سوره و آیه های قرآن کریم در نظر گرفته و با گردآوری پیکره های مناسب و موجود، محتوی این RDF ها را با برنامه نویسی تکمیل نماییم.
قالب RDF های در نظر گرفته شده برای پروژه به صورت زیر می باشد:
قالب RDF در نظر گرفته شده برای سوره:
-     نام سوره
-    شماره ی سوره
-    جزء های در بر گیرنده ی سوره
-    حزب های در بر گیرنده ی سوره
-    اسامی دیگر سوره
-    معنی نام سوره
-    نام سوره به زبان عربی
-    مکی یا مدنی بودن سوره
-    مفهوم کلی مطرح شده در سوره
-    کلیه ی مفاهیم ذکر شده در آیات سوره
-    صفحه ی آغازین سوره در قرآن عثمان طه
-    صفحه ی پایانی سوره در قرآن عثمان طه
-    تعداد آیه های سوره
-    تعداد سجده های سوره
-    تعداد سجده های واجب سوره
-    سوره ی قبلی
-    سوره ی بعدی
قالب RDF در نظر گرفته شده برای آیه:
-    فیلد مشخص کننده ی چندمین آیه از چندمین سوره
-    جزء در بر گیرنده ی آیه
-    حزب در بر گیرنده ی آیه
-    متن آیه به زبان عربی
-    ترجمه ی آیه به زبان فارسی
-    ترجمه ی آیه به زبان انگلیسی
-    ترجمه ی آیه به سایر زبان های موجود
-    تفسیر آیه به زبان های موجود
-    مفاهیم ذکر شده در آیه
-    شماره سوره ی در بر گیرنده ی آیه
-    نام سوره ی در بر گیرنده ی آیه
-    مکی یا مدنی بودن سوره ی در بر گیرنده ی آیه
-    شامل سجده بودن آیه
-    شامل سجده ی واجب بودن آیه
-    تعداد تکرار هر کدام از حروف الفبا در آیه
-    تعداد نقاط به کار رفته در حروف بکار رفته در آیه
-    تعداد تکرار هر کدام از حرکات، تنوین ها، سکون و تشدید به کار رفته در آیه


با قالب های در نظر گرفته شده برای سوره و آیه و تکمیل اطلاعات فوق، دامنه ی وسیعی از اطلاعات مفید و سودمند را برای انجام عملیات متن کاوی برای پژوهشگران و محققان قرآنی فراهم خواهیم آورد. در حال حاضر بخش اعظم RDF های در نظر گرفته تکمیل گردیده و یکی از مهم ترین بخش هایی که در حین کار خودمان به پروژه اضافه کردیم، مفاهیم مطرح شده در هر آیه و هر سوره است که به عنوان مثال می¬توان به روش های الگوریتمیک و البته با دقت نه چندان بالا مفهوم کلی هر آیه و سوره را استخراج کرد.
همانطور که ذکر گردید مفاهیم مطرح شده در هر آیه و هر سوره یکی از مهم ترین داده های موجود در RDF آیه و سوره است که می تواند به شدت مورد استفاده¬ی پژوهشگران و محققان قرآنی قرار گیرد. واحد پژوهش بیت القرآن امام علی (ع) شهرستان قم، اقدام به انتشار قرآنی نموده است که در هر آیه ی قرآن مضامین و مفاهیم مطرح شده در آن آیه ذکر گردیده است و با توجه به مکتوب بودن سند فوق، ما همینک در حال تلاش برای تماس با مجری طرح جهت دستیابی به فایل متنی فوق می باشیم.
در صورت دستیابی به این فایل، با تکمیل RDF های موجود، با فراهم آوردن اطلاعات بسیار مفید و سودمندی برای سوره ها و آیات قرآن کریم، بخش اعظمی از پروژه به اتمام خواهد رسید و گام بعدی پروژه، انتشار داده ها بر روی سایت WTLab می باشد.

انتشار داده های قرآنی به صورت RDFبر روی سایت WTLab
در حال حاضر برای هر کدام از سوره ها و آیه ها یک URL تخصیص داده ایم و  اطلاعات موجود پس از تکمیل، آماده ی انتشار به صورت RDFبر روی سایت WTLabمی باشند.
-    به عنوان مثال تخصیص URL برای سوره ی حمد و همچنین اولین آیه از سوره ی حمد به صورت زیر صورت خواهد بود:


http://wtlab.um.ac.ir/LinkData/Quran/1

http://wtlab.um.ac.ir/LinkData/Quran/1/1
 

 و من الله توفیق

Comments (2) Posted to پروژه قرآنی 10/24/2011 Edit

چزئیات پروژه قرآنی آزمایشگاه فناوری وب دانشگاه فردوسی مشهد

 

 


مراحل انجام پروژه:
1. تهیه ی یک آنتولوژی مناسب با توجه با اهداف پروژه:

الف. پیدا کردن یک آنتولوژی مناسب قرآنی، پیدا کردن نواقص و کمبودهای آن و تکمیل آنتولوژی مورد نظر جهت بهبود و استخراج مناسب اطلاعات مورد نظر.

ب. ساخت آنتولوژی مورد نظر از ابتدا توسط خودمان. (توسط نرم افزار Protege)

2. تهیه ی یک متن تگ گذاری شده از قرآن کریم شامل سوره ها، مکی و مدنی بودن سوره، تعدا سوره ها، آیه ها، کلمات و ...

3. تهیه و گردآوری ترجمه های مختلف قرآن کریم به زبان فارسی.(یک XML قرآنی داریم که کامل نیست که بایستی در ابتدا آن را با توجه به نیاز خودمان تکمیل نموده و سپس آن را به RDF تبدیل نماییم.)
4. تهیه و گردآوری ترجمه های مختلف قرآن کریم به زبان های مختلف.

5. تهیه و گردآوری تفاسیر قرآن کریم مفسران مختلف به زبان های گوناگون برای برداشت و استنباط مفاهیم آیات و سوره ها و بیان ارتباط آن ها.

6. تعیین و تخصیص URL برای هر کدام از سوره ها و آیه ها و انتشار داده ها به صورت Link Data بر روی سایت WTLab .

7. ایجاد ارتباط بین سوره ها، آیه ها و ترجمه های مختلف آن ها.
8. تعیین مفاهیم برای هر سوره و هر آیه به صورت دستی و یا با Text Mining و به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و .... با اطلاعات موجود در وب.
به عنوان مثال:
لغات کلیدی ==>> دیکشنری های مختلف آنلاین بر روی وب به زبان های مختلف.
مفاهیم پایه  ==>> اطلاعات موجود و مرتبط در Wikipedia .
اسامی جغرافیایی  ==>> Wikipedia و  Geonames .
اسامی تاریخی  ==>> ....
اسامی خاص  ==>> ....

9. با بهره گیری از دانش هوشمند متن كاوي (Text mining)  بر روی پيكره هاي متني برچسب گذاري شده قرآن کریم، سعی در تبيين اعجاز زباني قرآن كريم با دستيابي به لايه هاي نامشهود زباني اين متن الهي خواهیم داشت.

جزئیات پیاده سازی:

 ما در این پروژه نیازمند تعریف و طراحی دو آنتولوژی هستیم:

1. یک آنتولوژی برای سوره
در این آنتولوژی، بیشتر متا داده ها و اطلاعات کلی را می آوریم:
 از جمله مکی و مدنی بودن سوره، تعداد آیات، تعداد آیات سجده، شروع و پایان صفحات برای هر سوره مطابق با قرآن عثمان طه، ...
2. یک آنتولوژی برای آیات
  در این آنتولوژی، متن آیه را به همراه ترجمه ی آن خواهیم داشت. به علاوه ی شمارنده برای هر کدام از آیات که مثلا تعداد تکرار کلمات، حروف، اعراب، نقاط و ... را در خود نگه دارد. (tf-idf)


کارهای فعلی:
یک XML قرآنی داریم که کامل نیست که بایستی در ابتدا آن را با توجه به نیاز خودمان تکمیل نماییم و متن موجود در آن را به صورت جزء به جزء، سوره به سوره و آیه به آیه تفکیک نماییم.

تبدیل XML قرآنی به قالب RDF (نوشتن برنامه توسط Jena ، پارس کردن سند XML و تبدیل آن به RDF)
- تخصیص URL برای هر سوره.
  http://wtlab.um.ac.ir/LinkData/Quran/1

- تخصیص URL برای هر آیه.
  http://wtlab.um.ac.ir/LinkData/Quran/1/1

- انتشار داده ها به صورت Link Data بر روی سایت WTLab.




در ادامه جزئیات پیاده سازی:

- مشخص کردن موضوعات مندرج در قرآن کریم
- دسته بندی موضوعات و مشخص کردن رابطه بین آنها
-  ساخت آنتولوژی موضوعات و مفاهیم قرآن
- منتسب کردن آیات به مفاهيم
- تعیین مفاهیم برای هر سوره و هر آیه به صورت دستی و یا با Text Mining و به دنبال آن، تعیین ارتباط بین لغات، آیه ها، سوره ها، جزء ها و .... با اطلاعات موجود در وب.
-  پرسش و استنتاج
 

Comments (5) Posted to پروژه قرآنی 06/14/2011 Edit

پروژه قرآنی آزمایشگاه فناوری وب دانشگاه فردوسی مشهد

 

 
امام علی (ع) میفرماید: "قرآن را زمانه تفسیر می کند."
در برداشت از چنین روایاتی است که علامه طباطبایی هر دهه را نیازمند تفسیری جدید از قرآن دانسته­ اند و بدیهی است این مهم مستلزم بهره مندی از فناوری های معاصر است. با این نگرش و در پیروی از امر امام راحل (ره) به تلاش در تنقیب قرآن، "شبکه پژوهشی قرآن­ کاوی"
(Quran Mining Research Network) در دهه اخیر شکل یافته است تا با بهره گیری از فناوری های متن کاوی (Text Mining) ابزار پیشرفته هوش مصنوعی رایانه را در خدمت اکتشاف اطلاعات پنهان متن قرآن قرار ­دهد. محققین این شبکه تلاش دارند نه تنها بحث های حل نشده و شبهه های ایجاد شده برای قرآن را مرتفع سازند بلکه جنبه هایی ناشناخته از این اصلی ترین منبع هدایت به بشریت عرضه کنند.
در همین راستا طراحي و پياده‌سازي پيكره متني قرآن كريم در قالب RDF  و به شكل محتواي الكترونيكي، حاوي اطلاعات صرفي و نحوي، امكان استفاده و كاوش را براي هر گونه پژوهش و پردازش هوشمند ايجاد خواهد کرد.
تبيين اعجاز زباني قرآن كريم در دستيابي به لايه هاي نامشهود زباني اين متن الهي می باشد.
بدین ترتیب پس از فراهم شدن بستر مناسب جهت متن کاوی روی قرآن کریم می توان با طراحی و بهره گیری از ابزارهای متن کاوی به اکتشاف کلامی و معنایی متن قرآن کریم پرداخت.
دانش هوشمند متن كاوي (text mining) به عنوان جديد ترين وجه همكاري بين دانش هاي فناوري اطلاعات، زبان‌شناسي و ادبيات در كاوش رايانه اي متون بشري قصد حصول اين امر را دارد و چنين كاوشي مستلزم ايجاد پيكره هاي متني برچسب گذاري شده از آن متون است كه به شكل محتوايي الكترونيكي حاوي اطلاعات صرفي و نحوي متون مورد نظرند.

اهداف کلی پروژه:
1. ساخت و تهیه ی بستری مناسب در قالب RDF برای قرآن کریم جهت متن کاوی و اکتشاف اعجاز کلامی و نحوی قرآن کریم

2. Text Mining بر روی محتوای الکترونیکی قرآن کریم جهت تعیین ارتباط بین بخش های مختلف قرآن کریم و ارتباط پنهان سوره ها، آیه ها، کلمات، حروف، مفاهیم و ...
 

Comments (0) Posted to پروژه قرآنی 06/07/2011 Edit


درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds