ترجمه ماشینی _ پردازش زبانهای طبیعی

 

 

پردازش زبان‌های طبیعی یکی از زیر شاخه‌های با اهمیت در حوزه گسترده هوش مصنوعی، دانش زبان‌شناسی و یکی از نیازهای اساسی عصر فناوری جهت استفاده بهینه از منابع اطلاعاتی است. امروزه با رشد حجم مستندات تولید شده و نیاز به نگهداری، دسته بندی، بازیابی و پردازش ماشینی و سریع آنها توجه به پردازش زبان طبیعی بیش از پیش خودنمایی می کند.  تلاش عمده در این زمینه، ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانی می باشد. به تعریف دقیق‌تر پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتی نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها مثلاً برای مشورت گرفتن به گفتگو پرداخت.[2]
این‌ها تنها مثال‌هایی از کاربردهای متنوع پردازش زبان‌های طبیعی هستند. گفتنی ست هنوز سیستم چندان کارآمدی که پاسخگوی تمامی نیازهای ما باشد، برای پردازش زبان‌های طبیعی به وجود نیامده‌است.
موانع اساسی
- نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جمله‌ای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمی‌گردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست.
- دقیق نبودن دستور زبان‌ها: دستور هیچ زبانی آن‌قدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جمله‌های آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمی‌توان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است.
زبان‌شناسی محاسباتی
زبان‌شناسی رایانه‌ای یا زبان‌شناسی محاسباتی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که سعی دارد با بهره‌گیری از روش‌های آماری و مبتنی بر قاعده(rule-based)، از منظر محاسباتی به مدل‌سازی زبان طبیعی بپردازد. به خصوص از این روش‌ها برای حل مسائلی استفاده می‌کنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روش‌ها معمولاً مبتنی بر نمونه‌های متنی و مدل‌های مارکف هستند.
مقوله های زیر از جمله مباحثی هستند که در حیطه ی زبان‌شناسی محاسباتی قرار می گیرند:

- فرایافت concept و تجزیه زبان های برنامه نویسی : نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامه نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان می یابد.

- ترجمه ماشینی : این شاخه از زبان‌شناسی رایانه‌ای، زمان درازی کم اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته می‌باشد. پس از مرحلهٔ تجزیه واژه‌ها و نحو می باید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو سعی در شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

- پرسش و پاسخ با زبانهای طبیعی : این ایده مدتی به‌عنوان پاسخی قانع کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبه ی وسیعتری از دستور زایشی چامسکی است.

- صرف محاسباتی : به مطالعات مربوط به ساختارهای درونی کلمات صرف گفته می‌شود. [2] اغلب دست‌آوردها و نتائج تحقیقات در صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سیستم‌های پردازش زبان‌های طبیعی انسانی فراهم آمده است.

از جمله مهم ترین کارکردهای مهم پردازش زبان‌های طبیعی می توان موارد ذیل را نام برد:
خلاصه‌سازی خودکار، استخراج اطلاعات، بازیابی اطلاعات، ترجمه ماشینی، تشخیص نوری نویسه‌ها، تشخیص گفتار، ویرایش و ...

 

[2] Crystal D.، The Cambridge Encyclopedia of Language، 2nd edition، Cambridge University Press، 1996. ISBN 0-521-55967-7

Comments (5) Posted to ترجمه ماشینی 12/26/2010 Edit

ترجمه ماشینی _ مقدمه

 

 

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، بیان می گردد. اجزای مورد نیاز در معماری ماشین های ترجمه بیان گردیده و روشهای موجود در ترجمه ماشینی از ابتدا تا به اکنون تشریح و مزایا و معایب هر کدام ذکر می گردد. در پایان نیز با تاکید بر روش ترجمه ماشینی مبتنی بر روش های آمارگرا، ترجمه ماشینی در زبان فارسی مورد بررسی قرار می گیرد. اين مجموعه برای معرفی انواع پردازشهای موجود بر روی زبان های طبیعی و به خصوص ترجمه ماشینی متون، انواع روشهای موجود و روند پیشرفت و بهبود ماشین های ترجمه به پژوهشگراني كه هدفشان تحقيق در حوزه پردازش زبان و به خصوص ترجمه ماشینی است، كمك موثري باشد. در ضمن، به موانع موجود به خصوص در زمينه ترجمه ماشینی زبان فارسی اشاره گرديده و در خاتمه راه حل های پیشنهادی  موجود براي بهبود ترجمه ماشيني و به ویژه برای زبان فارسي مورد بررسي قرار گرفته است.
واژه های کلیدی:
ترجمه ماشینی، روشهای آماری، پیکره، فارسی.
مقدمه
پردازش زبانهای طبیعی نقشی بسیار عمده و کلیدی به خصوص در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر ایفا می کند.
ترجمه خود كار متون، جزو اولين كاربردهاي غير محاسبه اي كامپيوتر است. ايده ترجمه ماشيني اولين بار در بحثي بين وارن ويور و آندره بوث شكل گرفت. مدل آنان بر اساس جداولي طراحي شده بود كه در آنها براي رمز گشايي، از تواتر كلمات و حروف استفاده مي شد.[1]
با پيدايش تكنيك هايي چون جست و جوي دودوئي و روش تقليل مسأله در الگوريتم هاي برنامه سازي و ايده ويرايش ثانويه در ترجمه، اعتقاد به عملي بودن ترجمه ماشيني قوت گرفت. در پايان دهه 50 و اوايل 60، COMIT به عنوان اولين زبان همه منظوره پردازش نماد مطرح شد و برنامه هاي كمكي واژه پرداز به مرحله پياده سازي رسيد. از سوي ديگر در زمينه زبان شناسي، نسبت به ساخت جملات زبان، ديد الگوريتميكي تحت عنوان دستور زبان گشتاري مطرح گرديد.
نتيجه پروژه هاي دهه 60 كه بيشتر از آنها براي مقاصد سياسي استفاده مي شد، پيدايش دو شاخه اصلي در روش هاي ترجمه ماشيني بود. يكي از اين روش ها استفاده از فرم هاي اصلاح شده دستور زبان گشتاري و ديگري استفاده از اطلاعات آماري در مورد نقش كلمات در جمله و ترجمه آنها بود. در پايان دهه 70، اعتقاد عمومي بر آن بود كه ترجمه ماشيني بايد پيچيده تر از جابه جايي و جايگذاري كلمات زبان مبدا براي رسيدن به زبان مقصد باشد و ماشين بايد به نوعي يك فهم از معناي هر دو نوشتار پيدا كند. اين اعتقاد راه را براي استفاده از تكنيك هاي جديد هوش مصنوعي و به خصوص پردازش زبان طبيعي در ترجمه ماشيني هموار كرد و در اين‌ مدت‌‌ شاهد پيشرفت‌های چشمگيری در قلمرو ترجمه‌ ماشينی و دستاوردهای متنوع‌ جانبی آن‌ بوده‌ ايم. اهميت‌ اين‌ پديده‌ جديد و مقتضيات عصر ارتباطات و اطلاعات ‌ايجاب‌ كرده‌ است‌ كه‌ ميزان‌ سرمايه گذاری در اين‌ عرصه در سالهای گذشته بسيار ‌چشمگير باشد.


[1] Booth, K. H. V. (1967). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. 53-76). Amsterdam: North-Holland Publishing Company.

Comments (1) Posted to ترجمه ماشینی 12/24/2010 Edit

ترجمه ماشینی

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

در این وبلاگ مطالب بسیار مفیدی درباره ترجمه ماشینی ارائه می گردد که امیدوارم مورد رضایت شما

 علاقه مندان و بینندگان وبلاگ قرار بگیرد.

 

ترجمه ماشینی

ترجمه ماشینی _ مقدمه

ترجمه ماشینی _ پردازش زبانهای طبیعی

ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

ترجمه ماشینی _ روشهای موجود و شیوه های ارزیابی آنها

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

 

لینک های ذیل نیز برای دانلود فایل ها و مقاله های مرتبط با موضوع ترجمه ماشینی قرار داده شده است.

سخنرانی توسط دکتر عبدالحسین صراف زاده در مورد ترجمه ماشینی مبتنی بر آمار

 

 مقاله ای در مورد سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی

مطالعه و بررسی ابزارهاي آماده براي تحلیل پیکره متنی زبان فارسی

بررسی ابعاد و تفاوت هاي پیکره هاي برچسب داده اي و پیکره هاي خام در زبان فارسی  

امکان سنجی پروژه هاي زیرساختی کاربري خطو زبان فارسی در محیط رایانه اي 

بررسی ابعاد و لایه هاي ابهام در واژگان مشابه زبان فارسی 

  گروه اعداد در ترجمه ماشيني 

 دریافت اطلاعات HTML وبلاگ در موضوع ترجمه ماشینی در قالب فایل pdf

دریافت فایل پاورپویینت ترجمه ماشینی

 دریافت فایل پاور پویینت ترجمه ماشینی مبتنی بر آنتولوژی 

 

مهندس احمد استیری

Comments (0) Posted to ترجمه ماشینی 12/21/2010 Edit

پروژه پایان ترم کامپایلر

 

 

با سلام

 

 گروه هایی که سی دی پروژه میان ترم را تحویل نداده اند ، کلیه فایلها و مستندات خود را در قالب یک سی دی تحویل نمایند.

 

توضیحات تکمیلی پروژه پایان ترم  رو میتونید از لینک زیر دانلود کنید.

 

دانلود صورت کامل پروژه
 

 

 برای دانلود گرامر، روی لینک زیر کلیک کنید .... 

 

دانلود گرامر ساده زبان C 


 

با تشکر

مهندس استیری 

 کلمات کلیدی: پروژه اسکنر پروژه پارسر طراحی اسکنر طراحی پارسر اسکنر زبان C پارسر زبان C

پروژه کامپایلر اصول طراحی کامپایلر دانلود پروژه اسکنر دانلود پروژه پارسر پروژه LEX پروژه YACC

 اسکنر زبان C پارسر زبان C پروژه کامپایلر اصول طراحی کامپایلر دانلود اسکنر دانلود پارسر 

دانلود LEX دانلود YACC گرامر زبان C دانلود گرامر زبان C دانلود پروژه دانلود کامل پروژه

 جزوه اصول طراحي کامپايلر  جزوه کامپایلر  اسلاید کامپایلر  اسلایدهای کامپایلر  پروژه کامپایلر

نمرات کامپایلر  تمرین کامپایلر  تمرینات کامپایلر  حل تمرین کامپایلر  نمونه سوال کامپایلر

نمونه سوالات کامپایلر  امتحان کامپایلر  امتحانات کامپایلر حل تمرین کامپایلر

FLEX & YACC پروژه دانشجویی اسکنر پروژه دانشجویی پارسر flex bison

 flex.exe bison.exe a.l b.l Flex.l l.l

 

Comments (29) Posted to حل تمرین درس کامپایلر 12/08/2010 Edit

روبات ها به جنگ ما مي آيند!!!

تنوع روبات ها، به خصوص انسان نماها روز به روز بيشتر مي شود. توانايي هايشان افزايش مي يابد. حالا انسان از اين مي ترسد که روبات ها روزي در مقابل اش قرار بگيرند.

 

آيا روبات ها هميشه تحت کنترل انسان ها خواهند بود و از انسان ها فرمان مي برند يا روزي سر به طغيان بر خواهند داشت؟ روبات ها از دو سو به سرعت در حال پيشرفت هستند؛ از يک سو روز به روز پيشرفته تر مي شوند، گستره توانايي شان افزايش مي يابد و وظايف حساس تري بر عهده مي گيرند. از سوي ديگر تعداد آنها به سرعت در حال افزايش است و پيش بيني مي شود به زودي زندگي ما را پر کنند.

روبات ها به جنگ ما مي آيند؟

آيا روبات ها هميشه به انسان ها ياري مي دهند و زندگي آنها را ساده تر و لذت بخش تر مي کنند يا روزي براي انسان دردسرساز خواهند شد؟ آيا ممکن است در آينده به ستيز با انسان ها برخيزند. يا اين پرسش ها تنها به درد ساختن فيلم هاي تخيلي مي خورد؟

 

اگر به اين مباحث علاقه داريد، هر روز با وبلاگ خودتون همراه باشید.

 

اربک ساج مي گويد: «تسليم يک روبات شدن آن قدرها هم که فکر مي کنيد دور از ذهن نيست. فقط يک لحظه تصور کنيد سرش پوشش ندارد؛ پر از الکترود است. سيم هاي زيادي در آن نيست. سيم هاي نانوي مويي هم زياد نيستند. در بخش رسانه اي کمپين MIT در کيمبريج هستم. بخش تخصصي مربوط به روبات ها، بيشتر شبيه به اتاق يک جوان است تا يک لابراتوار. اتاقي پر است از انبوه کابل ها، جعبه هاي قديمي پيتزا و اسباب بازي ها و روبات هاي به هم ريخته و سرهم نشده. روبات انسان نماي يک و نيم متري که سه چرخ هم دارد مي آيد، به دور و بر اتاق نگاهي مي اندازد. با چشم هاي آبي پف کرده، تک تک به محققان خيره مي شود و من فکر مي کنم فرزندان همين روبات ها ممکن است چند سال ديگر با همين حالت بيايند و يقه سازندگانشان را بگيرند.»

 

او اضافه مي کند: «ساعتي قبل داشتم فيلم مربوط به همين روبات انسان نما به نام نکسي را روي اينترنت مي ديدم. به دوربين نگاه مي کرد و با صداي زنانه، خودش را معرفي مي کرد. فيلم را صدها نفر ديده بودند. چشمان نکسي بزرگ و صورتش بچه گانه بود. عده اي در باره فيلم  نظر داده بودند به جز چند نفر که از آن تعريف کرده بودند اکثريت خوششان نيامده بود؛ «اصلا شبيه انسان نيست»، «احمقانه است.» و «چندش آور است!»؛ اينها جمله هايي بود که نوشته بودند. مي خواستم به تمام کساني که اين طور بيرحمانه و بدون توجه به تلاش هاي شبانه روزي انجام شده براي ساخت اين روبات نوشته بودند، بگويم: آينده روبات هاي انسان نما درخشان است. اگر هنوز هم اين روبات ها چندان انسان ها را به وجد نمي آورند ولي به سرعت در حال پيشرفتند. مطمئنا در آينده نزديک، بچه ها عاشق روبات ها خواهند بود. من که شخصاً نکسي را دوست دارم! او يک روبات اجتماعي است.

 

نکسي؛ روباتي است که سلام مي کند، با شما دست مي دهد و اگر به او نزديک شويد شما را بغل مي کند. او به صدا حساس است و جمله هاي ساده اي را که برايش تعريف شده مي تواند تشخيص داده و به آنها عکس العمل نشان دهد. البته اگر اين جمله ها شمرده تلفظ  شوند. يکي از اعضاي تيم سازنده اش در باره آن مي گويد: اميدواريم در آينده نکسي هاي جديدتري بسازيم که از محدوده چند جمله اوليه فراتر رفته و با انسان مکالمه کنند، اگر چه نمي توانيم انتظار داشته باشيم در اوايل کار اين مکالمات جذاب باشند.»

روبات ها به جنگ ما مي آيند؟

اربک ساج ادامه مي دهد: «در مورد پيشرفت سريع روبات ها و پيچيده شدن آنها شک ندارم ولي موضوع اين است که اگر امروز نکسي مي تواند به صورت انسان ها نگاه کند و به چشمان آنها خيره شود و لبخند بزند، فردا روباتي ساخته خواهد شد که مي توانيم ادعا کنيم عاشق مي شود، دوست مي دارد، مي ترسد و حتي فريب مي دهد، وقتي روباتي به اين اندازه هوشمند ساخته شود و بتواند با ذهن انسان رابطه برقرار کند، آنگاه چطور مي توان مطمئن بود که مانند يک انسان انديشه نکند و به دنبال آمال و آرزوهاي خودش نرود؟ انديشيدن به اين مساله انسان را از جامعه در حال گسترش روبات ها به هراس مي اندازد.»

 

- روبات ها چگونه ظهور کردند؟

روبات ها در پيمودن سير تکامل داروين نيز خيلي با انگيزه تر و پرتلاش تر از انسان هستند. اين طور که نشان داده اند براي اينکه به تکامل برسند مثل انسان ها تنبل نيستند و نيازي به آن هزاره هاي دراز ندارند.

نخست در سال 1921 کلمه روبات را «R.U.R» ، يک دپارتمان علمي در کشور چک معرفي کرد، اول مي خواستند يک دستگاه الکترونيکي بسازند که ارزان قيمت باشد و در صنعت، بعضي از کارهاي ساده و طاقت فرساي انسان را به عهده بگيرد ولي همين هيات علمي در دهه هاي 40 و 50 ميلادي روبات هايي ساخت که مهندسين اش، خودشان تعجب کرده بودند! در اين دوره رفته رفته پديده اي به نام روباتيک ظهور کرد و معلوم شد داستان هاي آيزاک آسيموف چندان هم تخيلي نيستند.

روبات ها به جنگ ما مي آيند؟

در سال 1984 اتفاقي افتاد که عموم مردم را با روبات ها آشنا کرد. ترميناتور،فيلمي که آن روزها همه از آن صحبت  مي کردند. آرنولد شوارتزنگر نقش روباتي را بازي مي کرد که تفنگ در دست مي گرفت و بي واهمه براي دفاع از انسان مي جنگيد به زودي چند فيلم ديگر هم در اين باره ساخته شد و بحث روبات به موضوعي جذاب تبديل شد امروز آنچه در فيلم ترميناتور اتفاق افتاد به واقعيت نزديک تر مي شود. ارتش ها روبات ها را وارد ميدان جنگ مي کنند و کارهاي حساسي به آنها مي دهند؛ کارهاي خطرناک مانند خنثي کردن بمب را به آنها مي سپارند و شايد در آينده نزديک به آنها اسلحه بدهند و بگويند: بريد جلو!

 

- از روبات بايد ترسيد

روزي که روبات ها اسلحه به دست بگيرند آيا نبايد از آنها ترسيد؟ اين سوال ها را ابتدا پاتريک لين مطرح کرد. او استاد فلسفه دانشگاه کاليفرنياي آمريکاست و ظاهراً هم خيلي از روبات ها ترسيده. او مي گويد: «روبات ها بسيار پر کاربرد و به دردبخور هستند و پيشرفته تر شدن آنها مي تواند به نفع ما باشد. اما بايد حد و مرزي قائل باشيم. نبايد به آنها آزادي مطلق بدهيم. به شما هشدار مي دهم اگر امروز اين روبات ها را وارد کارهاي حساس و سرنوشت ساز کنيد ديگر نمي توانيد براي آينده تان تصميم بگيريد. اگر امروز به دست آنها اسلحه داديد فردا با همين سلاح ها در مقابل شما خواهند ايستاد!»

او حتي روبات هاي خانگي و روبات هاي به اصطلاح اجتماعي را هم بي خطر نمي داند. مي گويد: «مگر هدف نهايي شما آن نيست که اين روبات ها را مانند انسان احساساتي بار بياوريد؟ آن وقت اگر از شما؛ صاحبانشان توقعاتي داشتند آيا تضمين مي دهيد آنها را برآورده کنند؟ اصلا شما رمان فرانکشتاين را خوانده ايد؟»

او معتقد است روبات ها احساس تعلق خاطري به آرمان ها و ارزش هاي انساني نمي کنند. او مي گويد تا دير نشده بايد خط قرمزي براي روبات هاي در حال پيشرفت ترسيم کرد و مسووليت هاي حساس مانند رانندگي و از آن خطرناک تر وظايف نظامي را از آنها گرفت. او مي افزايد: «ترميناتور را فراموش کنيد، آن فقط يک فيلم تخيلي است. اسلحه دادن به دست يک روبات بازي با جان انسان هاست.»

ساخت روبات هايي که تنها جنبه سرگرمي دارند يا کارهاي خانه را انجام مي دهند، زياد خطرناک به نظر نمي رسد. آنها امکاناتي ندارند که ما را تهديد کنند يکي از اين نوع روبات ها روباتي است که با شما پينگ پنگ بازي مي کند. البته او هنوز خيلي ناشي است. روباتي کوتاه قد هم اخيرا ساخته شده. يک توپ رنگي را برايش پرتاب مي کنيد، مي رود و آن را مي آورد. دوست داشتني تر و بامزه تر از آن است که بخواهد دردسر ساز شود.

 

روبات ها به جنگ ما مي آيند؟

- فقط اگر يک لحظه ...

ولي همه روبات هايي که اين روزها معرفي مي شوند اين گونه نيستند. از بحث روبات هاي نظامي که بگذريم، روبات هايي که براي جراحي وارد نقاط حساس بدن مي شوند هم امروز در حال طراحي و ساخته شدن هستند آنها را هم نبايد دست کم گرفت. بعضي از آنها مغز را جراحي مي کنند هر حرکتي ممکن است جبران ناپذير باشد. امروز خطري که وجود دارد اين است که آنها در اثر خطا درست کار نکنند ولي در آينده وقتي پيچيده تر شدند و استقلال بيشتري پيدا کردند، در ميان يک عمل جراحي شايد بخواهند تصميمات عجيبي بگيرند و عمداً دست به حرکات فاجعه باري بزنند.

اخيرا هم برخي از شرکت هاي بزرگ فعال در زمينه ساخت روبات تصميم به توليد روبات هايي گرفته اند که پشت اتومبيل مي نشينند و رانندگي مي کنند. آيا ممکن است روزي، در حالي که يکي از ما انسان ها در حال عبور از خيابان هستيم يکي از اين روبات هاي راننده دلش نخواهد بايستد؟

يکي از شرکت هاي روباتيک اعلام کرده در حال کار روي پروژه عظيم روباتي به نام روبات مغز است گفته اند در سال 2019 آن را عرضه خواهند کرد کسي نمي داند دقيقا چيست شرکت سازنده اش گفته، آنچه در حال ساخت آن است يک مغز تمام عيار است؛ مغزي مانند مغز انسان! چيزي که مي توانيم با اطمينان بگوييم اين است که روبات ها فعلا در اختيار ما هستند هنوز مي توانيم آينده آنها را هر طور که خواستيم تعيين کنيم. اما آيا شرکت هايي که روبات مي سازند و سود سالانه کلاني از فروش توليداتشان به دست مي آورند حاضر مي شوند برخي توليداتشان را متوقف کنند يا در بعضي زمينه ها کارشان را محدود کنند؟ شايد سال 2019 ديگر براي اين کار دير شده باشد از طرف ديگر، عده اي خطرساز شدن روبات ها را اصلا باور ندارند و آن را يک شوخي بامزه مي پندارند کوين وارويک استاد دانشگاه ريدينگ انگليس يکي از آنهاست او اصلا نگران پيشرفت چشم گير روبات ها نيست و مي گويد: «مگر ما آنها را نمي سازيم؟ پس ديگر نگراني براي چيست؟ وقتي ما آنها را تهيه و توليد مي کنيم به اين معني است که از نظر فکري ما از آنها برتريم. نبايد از آنها بترسيم هر چقدر هم که پيشرفته و هوشمند شوند ما همواره يک پله از آنها بالاتريم هميشه در مشت ما خواهند بود!»

 

برگرفته از همشهري

Comments (0) Posted to مطالب علمی 12/08/2010 Edit

WEB3 چیست؟ ( از دیدگاه مهندس سالخورده حقیقی)


 «وب 3» اصطلاحی است که برای اشاره به وب آینده به کار میرود. پس از آنکه اصطلاح وب 2 برای تکامل اخیر وب رواج یافت، بسیاری ازمتخصصین ،روزنامه نگاران و رهبران فن، اصطلاح وب 3 را بکار بردند تا فرضیاتیدرباره موج آینده تغییرات اینترنت مطرح کنند.

نظراتپیرامون مرحله بعدی سیر تکاملی وب، بسیار متفاوت است، برخی معتقدند؛ پدیدار شدنتکنولوژی وب مفهومی راه وب راتغییر خواهد داد و آنرا به سوی هوش مصنوعی خواهد برد.دیگر نظریه پردازان اظهار میکنند که وب 3 افزایش سرعت اینترنت، اپلیکیشن های تحت وب، یا پیشرفت گرافیکی رایانه، نقش کلیدی را در سیر تکاملی وب بازی خواهد کرد.

نظرات رهبران فن:
تیم برنزلی ـ مخترع وبـ در ماه می سال 2006 گفت:
مردم مداممیپرسند وب 3 چیست؟ من فکر میکنم وقتی شما تعداد زیادی کاغذ کالک را روی هممیگذارید همه چیز ناهموار و چین خورده شده، مبهم به نظر میرسد. وب 2 و دسترسی بهوب مفهومی، سراسر حجم عظیم اطلاعات را یکپارچه میکند، شما دسترسی غیر قابل باوریبه منابع اطلاعاتی خواهید داشت.
در ماه میسال 2006 از اریک اسمیت ـ مدیر گوگل ـ خواسته شدتا وب 2 و وب 3* را تعریف کند. او پاسخ داد:
اگر بخواهیدکه حدس بزنم که وب 3 چه خواهدبود، خواهم گفت که «وب 3» راهی متفاوت در ساخت اپلیکیشن ها است. پیش بینی من ایناست که «وب 3» در نهایت در قالب اپلیکیشن هایی تحقق می یابد که تکه ای ازیکدیگرند. شماری از ویژگی های آنها از این قرار است: اپلیکیشن ها نسبتا کوچک ،اطلاعات توده ای ، اپلیکیشن ها روی هر وسیله ای اعم از پی سی یا تلفن همراه قابلاجرا، اپلیکیشن ها بسیار سریع و بسیار قابل کاستومایز و اپلیکیشن ها توزیعی خواهندبود، بصورت لفظ به لفظ؛ با شبکه های اجتماع، با ایمیل. شما به فروشگاه نمیروید تاآنها را بخرید آنها نوع بسیار متفاوتی از اپلیکیشن هاخواهند بود که ما هرگز در محاسباتمان ندیده ایم.
در نوامبرسال 2006، جری یانگ ـ بنیانگذار و رئیس یاهو ـ گفت:
وب 2 خوبمستند شده و درباره آن سخن گفته اند، نیروی اینترنت با امکاناتی که در مرحله شبکهمیتوان انجام داد به نقطه بحرانی رسیده است، ما همچنین از چهار سال قبل شاهدابزارهای قدرتمند هستیم، همچنین راه های قدرتمند تعامل با شبکه را نه تنها در سختافزار مانند کنسول های بازی و ابزارهای همراه، بلکه حتی در شاخه نرم افزار مشاهدهمیکنیم، شما لازم نیست که متخصص کامپیوتر باشید تا یک برنامه ایجاد کنید. مامیبینیم که توسعه بزرگ در وب 2 و وب 3، توسط مانیفست صورت میگیرد، یک اشتراک حقیقیمیانی تمایز میان حرفه ای، نیمه حرفه ای، ومصرف کننده گان محو میشود. ایجاد یک شبکه، تجارت و اپلیکیشن ها را نتیجه میدهد.
رید هاستینگس 
ـ بنیانگذار و مدیر Netflix ـ فرمول ساده تری برای تعریف مراحل وبدارد:
وب 1 دیالآپ بود، با 50 کیلوبایت پهنای باند، وب 2 با 1 مگابایت پهنای باند میانگین، و وب 3با 10 مگابایت پهنای باند ثابت خواهد بود. بگونه ای که وب کاملا ویدئویی خواهدبود، آن هنگام آرزوی وب 3 تحقق خواهدیافت.

نوآوری هایی که با «وب 3» پیوند خورده اند:
اپلیکیشن های مبتنی بر وب و دسکتاپ؛
تکنولوژی وب3 همچون نرم افزار های هوشمند که از داده های مفهومی استفاده میکنند. اندازه کوچکبا چندین شرکت برای اینکه از کار با داده ها بهره وری بیشتر و موثرتری داشت. در هرصورت در سالهای اخیر عموماً روی تکنولوژی وب مفهومی تمرکز بیشتری میباشد.

منازعات پیرامون وب 3: (منازعاتقابل توجه پیرامون چیستی اصطلاح وب 3 و تعریف شایسته آن)

تبدیل وب 3 به یک دیتابیس:
اولین قدمبسوی وب 3 ظهور «داده وب» است، ساختاری که اسناد در وب منتشر میشوند. فرمت های قابلاستفاده، قابل کنترل و قابل جستجو همچون RDF، ICDL و microformats. رشد اخیر تکنولوژی SPARQL استانداردی برای زبان جستجو و API یی برای جستجوی سراسر RDF، دیتابیسی توزیعی روی وب فراهم کرده است. داده وبمرحله جدیدی از داده های یکپارچه و اپلیکیشن های مشارکتی را فعال کرده و داده هارا قابل دستیابی باز و قابل پیوند همچون صفحات وب ساخته است. داده وب اولین قدم ازراهی است که بسوی وب کاملا مفهومی میرود. در مرحله داده وب، تمرکز بیشتر بر روی تبدیلفرمت داده های در دسترس به RDF میباشد. وبمفهومی کامل، مرحله ای از وب است که تمام پهنای داده های فرمت شده و سنتی که قالببندی نشده اند یا محتواهای نیمه فرمت شده، (همچون صفحات وب، اسناد و مانند آن)باید در دسترس RDF و OWL که فرمتهایمفهومی میباشند قرار گیرداجزای تمپلتوبسایت هاباید قابل استفاده مجری وب 3 باشد تا بیشتر بتواند اطلاعات جامعیدرباره محتوای سازمان یافته وبسایتها بدست آورد.

سیر تکاملی بسوی هوش مصنوعی:
همچنین وب 3مسیر تکاملی وب را که به هوش مصنوعی منتهی میشودتوصیف میکند، مسیری که وب را به شکل یک شبه انسان تبدیل میکند. برخی شکاکانمعتقدند که این تصوری دست نیافتنی است. در هر صورت کمپانی هایی همچون آی بی ام و گوگل در حالتکمیل تکنولوژی های جدیدی هستند که اطلاعات شگفت انگیزی بدست می آورد مانند پیشبینی موسیقی از طریق اطلاعاتی که روی وبسایستهای موزیک موجود است. اینجا همچنین برروی اینکه نیرویی که وب 3 را به حرکتدر خواهد آورد مناقشه است؛ آیا سیستم های باهوش خواهند بود یا هوشمندی از یک نوعسازمان دهی بیشتر پدیدار خواهد شد. از سلسله ای از هوشمندی انسانها، چنانکه از راه فیلترینگجمعیسرویسهایی همچون خوشمزه، فلیکر و 

Comments (1) Posted to وب معناگرا چیست؟ 11/15/2010 Edit

جزئیات بیشتری از وب معنایی

وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. مقاله به اجمال به توصیف پنج سطح وب معنایی می پردازد شامل: 1) آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)؛ 2) فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.){تعریف نوع سند(دی.ان.اس.)}/ فرانمای چارچوب وصیف منبع (آر.دی.اف)؛ 3) واژگان- هستی شناسی؛ 4)قواعد- منطق و برهان؛ 5)امنیت- اطمینان. مقاله با این نتیجه خاتمه می یابد که بایستی وب سایت های خود را به عنوان جزئی از یک کل در نظر بگیریم، نه در انزوا از دیگر سایت ها.


کليد واژه ها :وب معنایی


 

مقدمه

 


در حالیکه به نظر می رسد با فروکش کردن موج دات کام ها {سایت های تجاری.م.} ، بخشی از انقلاب اینترنت خاتمه یافته است، انقلاب خاموش دیگری در وب در حال وقوع است. وب تا کنون درمسیر تولید، ورود، ذخیره و نمایش اطلاعات موفق بوده است، اما بازیابی و پردازش هنوز به عنوان یک مشکل باقی است.


 

موج اول پیشرفت وب شامل ارائه حداکثر اطلاعات ممکن به شکلی بود که بتواند به صورت مستقیم در قالب زبان نشانه گذاری فرامتن (HTML)برای مخاطب نمایش داده شود. بانک های اطلاعاتی هر روز بیش از پیش تلاش می کنند اطلاعات را به شکلی تولید نمایند که قبل از نمایش برای کاربر، توسط دیگر رایانه ها قابل خواندن و پردازش باشد. آنها برای برچسب گذاری داده ها، به جای HTML از زبان نشانه گذاری توسعه پذیر (XML) بهره می برند و برخی از آنها به منظور استاندارد سازی قالب محتوا به نحوی که صرف نظر از کاربرد نهایی، توسط رایانه ها نیز قابل خواندن باشد به استفاده از چارچوب توصیف سند (RDF) روی آورده اند.

 


 

در موج جدید پیشرفت تلاش می شود تا هر شیی اطلاعاتی موجود در جهان اطلاعات به واسطه موضوع، محل، پدیدآورنده، تاریخ و دیگر ویژگی هایش توصیف شود. این نوع اطلاعات پیشتر تنها در یک بانک اطلاعاتی ذخیره می شد اما اکنون ممکن است در یک سند ذخیره شود.

 


وجه تمایز میان یک پیشینه در یک پایگاه اطلاعاتی و یک سند هر روز کم رنگ تر می شود. اطلاعات ممکن است در ابربرچسب (Metatag) ها در راس یک صفحه HTML قرار گیرد یا یک سند کامل ممکن است با استفاده از XML با بخش های مفصل نظیر عنوان، چکیده، روش ها، و نتایج کدگذاری شود.


 

این موج تازه پیشرفت را "وب معنایی"( Semantic web) می نامند. وب معنایی شیوه ای است برای ایجاد یک وب که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. این امر ممکن است از بازیابی اسناد گرفته تا جمع بندی عناصر برنامه ای مختلف برای خلق یک نرم افزار کاربردی را دربر گیرد. تیم برنرزلی (Tim Berners-Lee) {ابداع کننده وب معنایی.م.}عقاید خود را درباره این امکانات در { http://www.w3.org/2000/talks/1206-xml2k-tbl }مطرح کرده است.

 


 

وب معنایی شامل پنج سطح است:

 


1.  آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URI) ،

2.  فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (XML Schema) {تعریف نوع سند(DTD) }/ فرانمای چاچوب توصیف منبع (RDF Schema) ،

 

3.  واژگان- هستی شناسی،

 

4.  قواعد- منطق و برهان،

 

5. امنیت- اطمینان.

 

 

 

در حالیکه بسیاری از این عناصر پیشاپیش پیرامون وب وجودداشته اند، فناوری هایی که امکان بکارگیری منسجم آنها را فراهم می کند به تازگی عرضه شده اند. محدودیت های اصلی این رهیافت بیشتر از عوامل انسانی نشأت می گیرد تا از فناوری.

 

 

آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)

 

 

نقطه آغاز برای اطلاعات وب، آدرس منحصر به فرد آن است- اما آیا واقعاً منحصر به فرد است؟ ما با مکان نماهای متحدالشکل منبع (URL) به عنوان شیوه توصیف محل ها آشنا هستیم اما با ایجاد تغییر در اسامی حوزه ها و بسته شدن سایت ها، نشانگرهای منحصر به فرددیگری اتخاذ می شوند نظیر نشانگر دیجیتالی شئی (DOI) یا یو.آر.ال ثابت (برای جزئیات بیشتر نگاه کنید به http://www.purl.org. )راه حل های گوناگونی وجود دارد، این موارد را می توان به صورت کلی تر به عنوان URI ها توصیف کرد که این مزیت رادارند که اگر آدرس وب نهایی تغییر کند، URI  هنوز به محلی اشاره می کند که نهایتاً به محل اصلی منبع منتهی می شود.


 

فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.)/ فرانمای چاچوب توصیف منبع (آر.دی.اف)

 


 

زبان نشانه گذاری توسعه پذیر قبلاً در مقاله دیگری توصیف شده است(1). تولید برونداد در قالب XML ازیک بانک اطلاعاتی چه به عنوان یک صفحه وب ثابت یا یک نتیجه جستجوی پویا امر بسیار ساده ایست. این برونداد می تواند توسط یک برنامه کاربردی دیگر مورد استفاده قرر گیرد و امکان تبادل، ترکیب یا پردازش داده ها را فراهم نماید (برای جزئیات نگاه کنید به http://www.xml.org.

 


 

XML شیوه ای برای برچسب گذاری داده هاست. با این حال نیازمند یک فرانما (طرح) برای اعتبار بخشی به محتوای برچسب (Tag) هایی است که هر جزء از داده ها را توصیف می کنند. پدیدآورنده، عنوان و سال ممکن است به عنوان برچسب در سندی که توسط یک فرانما یا تعریف نوع سند (DTD) توصیف شده است درج شوند. زبان نشانه گذاری توسعه بین المللی (IDML) می تواند مثال خوبی باشد (برای اطلاعات بیشتر نگاه کنید به http://www.idmlinitiative.org/).)

 


مادامیکه به سمت یک نظام خودکار که در آن رایانه ها داده ها را تعبیر می کنند پیش می رویم، لازم است برچسب هایی برای کنترل پردازش داده ها و اطمینان از استاندارد سازی محتوا وجود داشته باشد؛ این همان جایی است که آر.دی.اف اهمیت می یابد. آر.دی.اف یک استاندارد است که گاه برای تبادل داده میان بانک های اطلاعاتی مورد استفاده قرار می گیرد.


یکی دیگر ازسیستم های کدگذاری که برای کمک به تبادل محتوا به زبان های مختلف ایجاد شده است، Unicode است. یونی کد استانداردی است برای مشخص نمودن حروفی که خارج از مجموعه کدهای ASCII قرار دارند. یونی کد یک استاندارد جهانی برای نمایش حروف و علائم فراهم نموده و تبادل ساده آنها با دیگر برنامه های کاربردی را بدون بروز اشکال در مورد حروف دارای اکسان (علائم صوتی) میسر می نماید (برای جزئیات بیشتر نگاه کنید به http://www.unicode.org/.)


 

واژگان- هستی شناسی

 


 

این مبحث، هم به واژگان رایانه نظیر واژگان مورد استفاده برای خدمت دهنده های اینترنت جهت برقراری ارتباط و تبادل اطلاعات ارتباط می یابد و هم به مفاهیمی که گروه های فعال درحوزه های موضوعی مختلف جهت تعریف حوزه موضوعی شان بکار می برند.. هر دو مورد برای اطمینان از بازیابی و نمایش اسناد یا داده های مرتبط در هنگام جستجوی کاربر به زبان طبیعی ضرورت دارند. مراحل دخیل دراین امر نه تنها شامل عبارت جستجوی ارسال شده به بانک های اطلاعاتی مختلف جهت دریافت پاسخ می شود بلکه اهمیت برقراری پیوند میان واژگان در زبان ها و رشته های مختلف را نیز دربر می گیرد.

 


قواعد- منطق و برهان

 

 

قواعدی که رایانه با اتکا به آنها به بازیابی داده ها از طیفی از منابع می پردازد در واقع همان Script ها و برنامه های نرم افزاری هستند. برخی بر این باورند که این قواعد بایستی به مرحله ای از تکامل برسند که به صورت خودکار به عنوان مثال افزایش دستمزد ها را در یک شرکت بر مبنای برآورد فروش یا تولید در اینترانت آن شرکت کنترل کنند؛ اما شاید هم در جهان علمی، اعتبار، برگرفته از گزارش ها یا نوشته های افراداست نه رایانه.

 

 

امنیت- اطمینان

 

در حالت واقعی، اگر چه ایده یک وب یکپارچه ممکن است جذاب به نظر برسد، اما هر روز بیش از پیش با محدودسازی وب از طریق ایجاد رمز عبور برای وب سایت ها مواجه می شویم. اطلاعات به طور معمول میان یک گروه از شرکت ها یا یک کنسرسیوم از سازمان ها به اشتراک گذاشته می شود. تجربه شخصی من این است که در مورد همکاری با سازمان های وابسته به سازمان ملل و بانک جهانی، اگر قرار باشد آنها با گردآوری انبوه اطلاعات یک نظام مرکزی تدارک ببینند، تردید وجود دارد. جایی که یک تعاونی یا کنسرسیوم از سازمان ها پیرامون امنیت یا نفع مشترک گرد هم می آیند، رهیافت اشتراک داده ها موفق تر است. فناوری های جدید شیوه هایی جهت وصول اطمینان از تضمین امنیت اطلاعات فراهم می کنند. به طبع، دراین صورت کاربر نیز اطمینان و اعتماد بیشتری به داده ها و نظام پیدا می کند. در نتیجه نهایتاً با مجموعه ای از وب ها مواجه خواهیم بود که از اطمینان لازم برای کاربردهای مختلف توسط گروه های متفاوت برخوردار هستند. این شبکه ها نسبت به نظام های موجود که مبتنی بر یک سازمان فراهم کننده محتوا هستند، خدمات بهتری می توانند ارائه کنند.

 

 


وب معنایی چگونه بر نظام شما اثر می گذارد؟


همه گروه های فراهم کننده اطلاعات روی وب پیشاپیش با انتخاب ابربرچسب های بکار رفته در صفحات وب خود، به نحوی در ایجاد نوعی وب معنایی مشارکت کرده اند. با انتخاب برچسب ها، به عنوان نمونه برچسب های پیشنهادی Alta Vista یا Dublin Core (http://www.purl.org/dc/) شیوه هایی جهت توصیف پدید آورنده، عنوان وموضوع یک سند فراهم می شود. انتخاب کلیدواژه موضوعی احتمالاً مشکل تر است. اگر در یک شرکت کشاورزی کار می کنید ممکن است به عنوان مثال از AGRIS یا CAB Thesaurus یا سیاهه کلید واژگان خاص خودتان استفاده کنید.

 


 

ممکن در حال استفاده از یک بانک اطلاعاتی برای ایجاد وب سایت خود باشید. دراین صورت احتمالاً با ایکس.ام.ال به عنوان شیوه ای جهت ارسال داده ها به دیگران و دریافت داده ها از دیگر منابع به منظور درونداد دسته ای داده ها آشنا باشید. وقتی این موارد پیچیده تر می شوند، ممکن است از نرم افرارهای کاربردی ای استفاده کنید که معرّف لایه های منطق و برهان در وب معنایی هستند. به عنوان مثال ممکن است تنها پذیرای دروندادی باشید که با معیارهای خاصی مطابقت داشته باشد، به یک موضوع خاص مربوط باشد و به دوره زمانی خاصی محدود شود.

 



بسیاری از وب سایت های موجود دارای حوزه های امن متکی بر رمز عبور هستند اما مشکل توسعه وب سایت ها، به ایجاد اطمینان هنگام همکاری با سایر فراهم کنندگان اطلاعات جهت ایجاد خدمات مشترک و یا همکاری با کاربران جهت ارائه خدمات برمی گردد.


روشن است مادامی که وب معنایی تا قبل از رسیدن به دیدگاه های مطرح شده توسط افرادی چون تیم برنرزلی همچنان به تکامل خود ادامه می دهد، ما بایستی وب سایت های خود را جزئی از یک کل در نظر بگیریم و نه درانزوا از دیگر سایت ها. با توجه به این ایده، ارزش آن را دارد که توجه خود را معطوف شیوه ایجاد وب سایت ها کرده و با بهره گیری از فناوری های نوین به همکاری با دیگران جهت تدارک خدمات روی آوریم.

 



* Addison, C. (2001), “the Semantic Web”, Information development, 17(2), pp. 83-84.


 

مآخذ:

 


1. Addison, C. (1999), “Extensible Markup Language”, Information development, 15(3), pp. 153-154


نکته: جهت مطالعه بیشتر در مورد وب معنایی به زبان فارسی وآشنایی بیشتر با برخی اصطلاحات بکاررفته در این مقاله رجوع کنید به: جمالی مهموئی، حمید رضا "وب معنایی: راهکاری رو به توسعه..."، اطلاع شناسی، ج.1، شماره.2 (1382 پاییز(


 


معادل انگلیسی واژه های متن:

برهان = Proof

 

تعریف نوع سند = Document Type Definition: DTD

 

زبان نشانه گذاری توسعه بین المللی = International Development Markup Language: IDML

 

زبان نشانه گذاری توسعه پذیر = eXtensible Markup Language: XML

 

زبان نشانه گذاری فرامتنی = HyperText Markup Language: HTML

 

فرانمای چاچوب توصیف منبع = Rresource Description Framework Schema

 

فرانمای زبان نشانه گذاری توسعه پذیر = (XML Schema)

 

مکان نماهای متحدالشکل منبع = Uniform Resource Locator: URL

 

مکان نماهای متحدالشکل منبع ثابت = Uniform Resource Locator: PURL Permanent

 

نشانگر دیجیتالی شئی = Digital Object Identifier: DOI

 

نشانگر متحدالشکل منبع = Uniform Resource Indicator: URI

 

هستی شناسی = Ontology

 

 

Comments (1) Posted to وب معناگرا چیست؟ 10/29/2010 Edit

Semantic Web یا Data Web یا وب3 یا همون وب معنایی

اول از همه یهتعریف کوچکی از نسخه های قبلی وب داشته باشیم.
وب 1 که همون
World Wide Web اولیه خودمون بود که سیستم فقط تک کاربره بود و یااصلآ داینامیک نبود که بعد ها تبدیل به داینامیک هم شد.
وب 2 که با ظهور تکنولوژی
Ajax (تو پرانتز) که خیلی ها هم فکر میکنن به خاطر هیمن Ajax بهش میگن وب 2ولی نه به خاطر به وجود آمدن سیستم های اشتراک کاربری مثل ویکی پدیا یا یوتیوپ بهاین نام مشهور شد
وب 3 تو این نسخه که به
Semantic Web (همون وب معنایی) معروفه تلاش محققان و صاجبنظران براینه که محتوای وب سایتها طوری نوشته بشن که علاوه بر انسان برای ماشین هم قابلدرک باشه.
همانطور که میدونید امروزه اکثر کاربرای اینترنتی برای پیدا کردن سوالات خود
Search enginها کمک بگیرند.
ولی با تمام هزینه هایی که برای موتور های جستجو می شود ولی باز هم نتایج ایده آلنشده و صفحاتی برای کاربر نشان داده میشود که اصلآ ربطی به کوئری که او میخواهدندارد.

 حالا لازم میدونم یه گزارشمختصر بدم از وب معنایی که این روزا خیلی تو بورسه و کلا هم خیلی سنش زیاد نیست.وب به رغم موفقیت‌زیادش در انتشار اطلاعات تو یه زمینه متاسفانه تا حالا به موفقیتقابل توجهی دست پیدا نکرده و اونم اینکه نقش کامپیوترا تو این فرایند انتشاراطلاعات فقط ابزاریه و اونم در حد ساده و غیر معنایی. کامپیوتر هیچ شهودی نداره ازاینکه این اطلاعات چی هستن و اصولا بر مبنای یه سری الگوریتم نسبتا کور عمل میکنه.اعمالی مثل کلاسترینگ یا دسته بندی و غیره هم کمک خاصی به این موضوع نمیکنن.کامپیوتر و برنامه‌ها باید نقش فعال‌تری ایفا کنن و بتونن اطلاعات رو تفسیر کنن ویا اینکه از اونها نتیجه‌گیری‌های جدیدی به عمل بیارن که لازم به دخالت انساننباشه.

مشکلاساسی از اونجا میاد که کامپیوترها با معنا سروکار ندارن وبیشتر به ارتباطات صفحاتو ساختار گیر میدن تا معنای مستتر در صفحات وب و این مخالف فرایند انسانیه که بهمعنا اهمیت بیشتر میده. دلیل اینکه به وب معنایی نیاز هست هم تا حدی واضحه . اول اینکهالگوریتم‌هایی که در رشته‌های مختلف وجود دارن وابسته به دامنة خاصی هستن و جاهایدیگه کار نمی‌کنن و ما میخوایم به یه الگوریتم یا فرایند نسبتا یکنواخت دست پیداکنیم که تو حوزة معنا کار کنه یه چیزی شبیه به مفهوم پروتکل که نمونه‌ش همین httpیا پروتکل‌هایدیگه‌س که بصورت یکنواخت و همه‌جا فهم عمل میکنن و دوم هم اینکه اصولا این مکانیسمو مفهوم وب معنایی شدیدا به کمک کاربرا میاد و میتونه قسمت اعظم کار و زحمت اونا ویا شاید زحمت‌هایی که هیچوقت امکانات انسانی از پسش بر نمیان رو انجام بده مثلاینکه 100 ژورنال رو بخونه و مقالة مورد نظر ما رو پیدا کنه و یا اینکه از خوندنیه سری از اونا و سرزدن به کلی سایت و صفحه بتونه به نتایجی برسه که کار ما روشدیدا ساده کنه.

تیمبرنرز-لی این اصطلاح وب معنایی رو بعنوان افزایش  یک منطقبرای وب بکار برد و ابداع کرد. و هدفش هم این بود که تمامی پتانسیل وب رو بااستفاده از متاداده‌هایی که میتونن برا ماشین قابل فهم باشن ، استخراج کنه.

میبینینچقدر این ایده و مفهوم میتونه زندگی رو راحت کنه و یا شاید امکاناتی رو بوجودبیاره که قبلا خوابشم نمی‌دیدیم؟ حالا اومدن و فکر کردن که برای تحقق این رویا چهکاری میتونیم انجام بدیم و ایدة متاداده یا metadata که چیزیشبیه tagهستش اولین ابزاریه که به ذهن میرسه. مسئلة اول اینه که یه syntax مورد قبولهمه برای نمایش این متاداده فراهم کنیم که این کار رو سازمان W3C انجام داده که همون کنسرسیوم WWWهستش. دو زبان استانداردی که معرفی شدن عبارتن از RDF- Resource Description Format  و   OWL  که همون WebOntology Languageهستش و یا DAML+OIL و SHOE که بازمورد استفاده قرار میگیرن. حالا لازمه که محافل علمی و صنعت از این دو استانداردحمایت کنن که حمایت‌ها و هماهنگ‌سازی‌ها شروع شدن. زبونایی که گفتم کلی چیزای دیگهلازم دارن مثلا زبونی برای گرفتن Query که در مورد RDF اسمش هست RQL.

مسئلةاساسی تر با داشتن نحو زبان‌ها داشتن فرهنگ لغاتیه که بشه باهاش صحبت کرد و اینالبته از یه حوزه به حوزة دیگه کاملا متفاوته و اصطلاحا این فرهنگ لغات و واژگانرو Ontology میگن. حالا اینکه این آنتولوژی‌هااز کجا میان به چند صورت ممکنه. صورت اول اینه که یه سری آدم متتخصص تو هر رشتهبشینن و زحمتشو بکشن که خیلی شبیه کاریه که یاهو اوائل انجام میداد و خوب محدودیتداره و نمیشه این حجم عظیم دانش رو بصورت دستی زحمتشو کشید. روش دیگر استفاده ازالگوریتم‌های مناسب روی توده‌های عظیم متنی یا corpusها هستش و استفاده از یادگیری ماشین و روشهای آماری و خلاصه هر روشی که بهذهنتون میرسه(میتونین مقاله بدین اینجا).  استفادهاز منطق در این وب بصورت وسیعی انجام میشه و قاعدتا منطق مرتبةاول و توسیع‌های اونو یا شبکه‌های معنایی و معادل فرمال اونها یعنی Description Logic  نقش عمده‌ای دارن و بد نیست به زبانی مثل Event Calculusاشاره کنم که به نظر من پتانسیل‌های بسیار وسیعی تو این حوزه و مدل کردندانش common sense داره.

استفادهاز منطق در وب معنایی منحصر به منطق کلاسیک و monotonicنیست و در واقع نیاز به فرمالیسم‌های nonmonotonicو Default Reasoning هست که با فرایند استنتاج انسانیهمخوان باشن و در واقع tolterance بالایی داشته باشن . از اینفرمالیسم‌های معروف میتونم به Circumscription و Default Logic یا model preference  آقای Shoham اشاره کنم که در واقع تعمیمی ازهمون Circumscription‌هستش و یا Negationas failureکه در برنامه‌سازی منطق بکار میره و بنیاد پرولوگه. فرمالیسم‌ها بصورت خامنمیتونن بکار برن چون خیلی سریع از حل سناریوهایی مثل Yale Shooting problem  و یا StolenCar Scenario در میمونن و نیاز به کلی ریزه‌کاریو دقت فرمال و ریاضی دارن(اینجاش یه کم تخصصی شد ببخشین)

 

وب معناییساختار لایه‌ای داره که یه شکل خیلی معروف داره و به کیک معروفه (خودتون بگردینمیتونین تو اینترنت پیداش کنین.)


حالا اینجا یکی از مسائل مهم و موردتحقیق اینه که شما بتونین بین آنتولوژی‌هایمختلف برا یه حوزه نگاشت‌هایی پیدا کنین که اونا رو به هم بنگارین و یکنواخت کنینکه اصطلاحا به این مسئلة خیلی مهم میگن
Ontologymapping Problem.میبینین اینجا کلی کار برا انجام دادن هست که نمونه‌ش میتونیم به استخراجآنتولوژی با استفاده از NLP از توده‌های متنی و یا گفتاریه و..... و آخر سر هم اینکه باز باید تاکید کنیم که باید بتونیم وب فعلی بدون متادادهرو با وب معنایی و قابل فهم و استنتاج برای ماشین ترکیب کنیم که میبینین چقدر بهمکانیزم‌های اینترفیسی نیاز داریم.

 

حالا درمورد آینده نمی‌تونیم صحبت زیادی بکنیم اما واضحه که زمان میبره تا وب معناییبتونه به جایگاهی که مدنظر خیلی هاست و اونم نقش محوری در وبه برسه اما خیلی ازجاها بصورت محلی و با آنتولوژی‌های محدود استفاده از اون داره بیشتر میشه و بدنیست اینجا به XML اشاره کنیم که چه جور تونست بهاین مقبولیت عام و این همه کاربرد و تسهیل امور در وب و پایگاه‌های داده و ...برسه پس به وب معنایی هم امیدوار باشین که نوعی از هوش مصنوعی وبی و اجتماعی هستشو میشه از ابزارهای سنتی هوش مصنوعی هم توش استفاده کرد.

 

این نوعنگرش به نمایش دانش وب و استفاده از استنتاج در اون به نظر من فوق‌العاده‌ست و منکلا به استفاده از روشهای فرمال در نمایش دانش علاقه دارم ، البته روشهای غیرفرمال در استنتاج هم جالبی خاص خودش رو داره.

خلاصه اینکه وب معنایی (معانی‌گرا و معانی‌نگر)  را می‌‌شود فضایی جهانی از جنسمحاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها دانشها،دانش‌نامه‌ها و دانشگان‌ها (پایگاه‌های دانش‌ ) به صورتی معنی‌گرا و با تواناییدرک مفهومی همدیگر در کنار هم قرار خواهند گرفت و وب معنایی شیوه ای برای ایجاد یکوب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده،آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند.

 

 

Comments (6) Posted to وب معناگرا چیست؟ 10/12/2010 Edit

«قبلي   1 2 3 4 5 6 7 8 9 10

درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds