ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

 

 

فعالیت و کار ترجمه سابقة بسیار طولانی دارد. بعضیها معتقدند که اولین کاری که بشر کرده ترجمه است؛ اگر ترجمه را به معنی برگرداندن فرض کنیم کلام در واقع برگردان اندیشه است. این اولین قدمی است که بشر برای ترجمه برداشته است. در واقع یکی از استراتژیهای ترجمه، از هر زبانی که بخواهید ترجمه کنید، به هدف و نوع متنی که ترجمه می‎کنید بستگي دارد. مثلاً متن تبلیغاتي با متنی که قرار است در یک صفحة اینترنت درج شود و یا با متن ادبی و اخبار سیاسی متفاوت است. چرا که مخاطبها و دوره های مختلف تاریخی توقعات مختلفی از متنها به وجود می‎آورند. [3]
ترجمه ماشینی
ترجمه ماشینی ترجمه‌ای است که توسط کامپیوتر و بدون دخالت فرد انجام می‌شود. ترجمه ی ماشینی(Machine Translation - MT) زیر شاخه ای از زبان‌شناسی محاسباتی می‌باشد که عبارت است از ترجمه ی متنی از یک زبان طبیعی به زبانی دیگر، توسط کامپیوتر. در سطح مقدماتی، ترجمه ماشینی یک جایگزینی ساده برای کلمات از زبان طبیعی به زبان دیگری است. با استفاده از تکنیک‌های زبان‌شناسی پیکره ای، ترجمه‌های پیچیده بیشتری قابل دستیابی هستند. همچنین این تکنیک‌ها کنترل بهتر تفاوت های گونه‌شناسی در زبان، تشخیص عبارات و ترجمه ی اصطلاحات را به خوبی و درستی جدا کردن عبارات نامتعارف در متن، مقدور میسازند.
نخستین تلاش‌ها برای ترجمه توسط رایانه ناموفق بودند، چرا که در آن دوران نظریه¬ی زبان‌شناسی وجود نداشت که بتواند کمک شایانی به پردازش زبان‌ها بکند. در سال ۱۹۵۷ کتاب ساختارهای نحوی اثر نوام چامسکی زبان‌شناس جوان آمریکایی که از آن پس به شناخته‌شده‌ترین چهره¬ی زبان‌شناسی نظری تبدیل شد به چاپ رسید. از آن پس پردازش زبان با حرکت‌های تازه‌ای دنبال شد. [4]
نرم‌افزارهای ترجمه ماشینی کنونی اغلب به کاربر اجازه ی تغییر دلخواه بر اساس حوزه کاری یا حرفه ای دلخواه را می دهند. در واقع ارتقای کیفیت خروجی با استفاده از محدود کردن کلمات جایگزین شونده، انجام میشود. این تکنیک بطور خاص در حوزه ی رسمی یا زبان های فرموله شده استفاده می شود. همچنین کیفیت خروجی بهبود یافته می تواند با استفاده از دخالت انسان بدست آید. برای مثال سیستم هایی موجودند که اگر کاربر بطور کاملا واضحی کلماتی که اسامی خاص هستند را معین کرده باشد، قادر به ترجمه دقیقتری هستند. با ¬¬کمک گرفتن از این تکنیک‌ها ترجمه ماشینی بعنوان یک ابزار برای کمک کردن به مترجمان(انسان ها) و بسیاری از موضوع های محدود، قادر به تولید خروجی قابل استفاده و نهایی است.
براي اينكه بتوان جمله اي را از يك زبان ترجمه و به زبان ديگري تبديل نمود، ابتدا به يك روال تشخيص واژه ها يا واكافت واژه اي و واكافت ساختواژي نياز مي باشد، به طوري كه كلمات ساده و مركب آن زبان از ورودي تشخيص داده شود. سپس بايد تركيب كلمات از نظر نحوي صحيح باشد و جمله متعلق به آن زبان را ايجاد نمايد. حال براي اينكه اين جمله به زبان ديگري برگردان شود، بايد نقش و معناي هر كلمه مشخص و با توجه به دستور زبان مقصد و ترجمه كلمه با توجه به نقش آن، جمله زبان مقصد توليد شود. بنابراين ديده مي شود كه مهمترين بخش، مشخص كردن نقش و معناي كلمات مي باشد نقش كلمات با توجه به محل قرار گرفتن آن در جمله مشخص مي گردد، اما مسئله مهم معني كلمات مي باشد؛ چرا كه تعدادي از كلمات داراي چند معني مي باشد كه اين ابهام بايد به روش مناسبي رفع گردد ( مانينگ و شوتس، 2000 ). در ترجمه ماشيني ابهام هم در معناي كلمات زبان مبدا وجود دارد ( از نظر درك معني آن ) و هم در زبان مقصد و همين باعث مي گردد روند ترجمه دچار مشكل شود.
با این وجود به طور کلی در ترجمه¬ی ماشینی ویژگیهایی وجود دارد که نه تنها از نظر جاذبه و کشش علمی، بلکه، از دیدگاه اقتصادی و دیگر ضرورت‌ها و اقتضاهای عصر، انجام آن را کاملاً توجیه می‌کند.
فرآیند ترجمه
فرآیند ترجمه به شرح زیر است:
1. رمزگشایی معنایی متن مبدا
2. کدگذاری دوباره این معنا در زبان مقصد
در پس این فرآیند بظاهر آسان، عملیات شناختی پیچیده ای واقع است. به منظور رمز گشایی معنای متن مبدا، مترجم باید قابلیت تفسیر و تجزیه تحلیل تمام ویژگی‌های متن را داشته باشد. یک فرآیند که احتیاج به دانش عمیقی از دستور زبان ، جمله‌شناسی(نحو)، معناشناسی و اصطلاحات از زبان مرجع دارد به همان اندازه باید دانش مربوط به فرهنگ صحبت کنندگان آن زبان را نیز داشته باشد. از آن جهت، چالشی در ترجمه ماشینی وجود دارد که چگونه یک کامپیوتر را برنامه نویسی کنیم که بتواند همانند یک انسان متنی را بفهمد و بتواند یک متن جدید در زبان مقصد بسازد که بنظر می رسد توسط انسان نوشته شده است. این مساله ممکن است به روشهای مختلفی حل شود.
انگيزه ترجمه ماشينی
در طول چند دهه‌ اخير و همزمان‌ با گسترش‌ و پيشرفت‌ زبان‌شناسی محاسباتی ‌‌، در بسياری از كشورهای‌ پيشرفته‌، تلاشهای‌ همه‌جانبه‌ و پيگير در جهت‌ ترجمه‌ متون‌ به کمک كامپيوتر انجام‌ گرفته است.‌ با توجه‌ به‌ تنگناها و مسائل‌ خاص‌ مطرح در زمينه ترجمه ماشينی و علی رغم کاستی ها، حاصل اين فعاليتها‌ درخور توجه‌ بوده‌ است‌. توسعه ارتباطات از طريق اينترنت نيز که بصورت يک بستر  جهانی برای مبادله افکار و اطلاعات درآمده است خود مستلزم توسعه ماشين های ترجمه می باشد تا با سرعت بتوان اطلاعات را از يک زبان به زبان ديگر برگرداند.
رشد جالب توجه شبکه‌های اجتماعی،همانند فیس بوک یا پیام‌رسان‌های فوری همانند اسکایپ(Skype)،گوگل تاک(Google Talk) و ام اس ان مسنجر(MSN Messenger)، در سالهای اخیر، مورد استفاده ی دیگری برای نرم‌افزارهای ترجمه ماشینی شده است. چراکه بدین وسیله کابران به زبان‌های مختلف میتوانند با یکدیگر ارتباط برقرار کنند.
نرم‌افزارهای ترجمه ماشینی همچنین برای بسیاری از موبایلها، کامپیوترهای جیبی و .. عرضه شده است. بخاطر قابلیت حمل آنها، اینگونه وسایل بعنوان ابزارهای ترجمه برای موبایل مشخص شده اند که شبکه تجارتی با استفاده از موبایل را بین شرکایی با زبانهای مختلف ممکن ساخته است.همچنین این نرم‌افزارها نیاز به مترجم انسان بعنوان واسطی در مکالمات دوطرف را از بین می برند.
تاريخچه ترجمه ماشينی
ترجمه ی ماشینی از جمله ی اولین اهداف مورد نظر در علوم رایانه و بخصوص در حوزه ی هوش ماشینی به حساب می‌آید و سابقه¬ی آن به حدود نیم قرن پیش از این باز می‌گردد.
نخستین ترجمه‌ای که بطور کامل توسط کامپیوتر انجام شد، ترجمه ی متنی بود از زبان انگلیسی به زبان روسی. گر چه از آن زمان تا کنون فن آوری ترجمه¬ی ماشینی رشد زیادی داشته‌است، هنوز هم نقص‌های فراوانی را داراست. اصولا چون کامپیوترها نمی‌توانند مانند انسان هوشمند باشند، ترجمه‌ای هم که توسط آنها انجام شود، ترجمه¬ی کاملی نخواهد بود. نمی‌توان انتظار داشت که با استفاده از یک نرم‌افزار مترجم، هر متنی به آسانی ترجمه شود. نرم‌افزارهای مترجم، در بهترین حالت، عمل ترجمه را با دقتی در حدود ۷۰ درصد انجام می‌دهند. برای به دست آوردن نتیجه بهتر، لازم است قبل و بعد از ترجمه، مقداری ویرایش روی متن انجام شود. در این متن تاریخچه روند پیشرفت ترجمه ماشینی در طی گذر زمان ذکر نخواهد گردید و فقط ایده ها و نتایج تحقیقاتی آنها در بخش های مختلف ذکر خواهد گردید.
مشکلات در ترجمه ماشينی
قبل‌ از تعريف‌ ترجمه‌ ماشينی‌، لازم است‌ از ديدگاه‌ زبان‌شناسی‌، ماهيت‌ ترجمه‌ را  در مفهوم‌ عام‌ آن‌ يعنی‌ ترجمه‌ توسط شخص‌ متخصص‌ و زبان¬دان‌ و به اصطلاح ترجمه‌ انسانی‌ معرفی كنيم‌. با آنكه‌ ترجمه‌ سابقه بسيار طولانی دارد‌ هنوز تعريفی از آن که‌ مورد قبول‌ همگان‌ باشد وجود ندارد. در حالت کلی ترجمه‌ عبارتست‌ از تبديل‌ يا برگرداندن‌ نزديك‌ترين‌ پيام‌ مستتر در صورت‌ واژه‌های‌ زبان‌ مبدأ  به ‌صورت‌  زبان‌ مقصد. ترجمه‌ ماشينی‌ به‌ سيستم‌ های نرم‌افزار کامپيوتری اطلاق‌ می‌شود كه‌ با آنها‌ می‌توان‌ متون‌ ورودی به‌ زبان‌ مبدأ را طی‌ فرايندهای‌ خاصی و در سطوح‌ مختلف‌ زبان‌شناختی‌ تجزيه‌ و تحليل نموده ودر نهايت‌ به‌ زبان مقصد ترجمه نمود. در طراحی سيستمهای ترجمه‌ ماشينی بايستی تمهيداتی انديشيده‌ شده و در معماری آن‌ مؤلفه‌هايی لحاظ گردد که سيستم‌ را قادر سازد تا تقريبا همانند يک انسان مترجم‌ کار تجزيه‌ و تحليل‌های‌ زبان‌شناختی‌ متن‌ ورودی‌ را انجام‌ داده‌ و با بهره‌گيری‌ از داده‌ها و براساس ‌يافته‌ها، معادل‌ جملات‌ زبان‌ مبدأ را در زبان‌ مقصد توليد كند. انجام‌ اين‌ عمل‌ مستلزم‌ آن‌ است‌ كه‌ سيستم‌ علاوه‌ بر برنامه‌‌ رايانه‌ای‌ متشكل‌ از مجموعه‌ الگوريتم‌های‌ خاص‌ و پيچيده‌، مجموعه ‌فرهنگهای لغات و پايگاه های داده حاوی‌ واژگان‌ و قواعد ساختاری‌ و معنا شناختی‌ زبانهای‌ مبدأ و مقصد باشد. اگر بتوان‌ ادعا كرد كه‌ امكان‌ تدوين‌ فرهنگ‌ قواعد ساختاری‌ يا واژگان‌ دستوری‌ نسبتاً كامل‌ فراهم‌ باشد، مختصه‌ و ويژگی‌ زبان‌ به‌ گونه‌ای‌ است‌ كه‌ درهيچ‌ مقطعی نمی‌توان‌ فرهنگ مناسبی را يافت‌ كه‌ دربر دارنده‌ همه‌ واژه‌های آن‌ زبان‌ باشد زيرا ‌ زبان‌ پديده‌ زايايی است‌ و مرتب واژه‌های جديدی خلق شده  و به‌ مجموعه‌ واژگان‌ آن‌ زبان‌ افزوده‌ می شوند.
در حالت کلی نوع‌ متن مورد نظر‌ و ميزان‌ پيچيدگی‌ آن‌ در بازدهی‌ کار ترجمه كاملا موثر است. ترجمه ی متون رسمی و قاعده مند و همچنین متون علمی به‌ این‌ علت‌ که‌ از وضوح‌ بیشتر و ابهام کمتری برخوردارند به‌ سهولت‌ از طریق ‌کامپیوتر انجام‌ می‌گیرد، ولی‌ ترجمه‌ متون‌ ادبی‌ که‌ از دیدگاه‌ علمی‌ در حیطه‌ ترجمه‌ فرهنگی قرار دارد، اگر غیر ممکن‌ نباشد، چندان‌ ساده‌ نخواهد بود.

نقش ترجمه ماشینی در آینده شغلی مترجمان

رشد و گسترش انکار ناپذیر ترجمه های ماشینی در سال های اخیر، به میزان قابل توجهی بر محبوبیت این گونه ترجمه ها افزوده است، بطوریکه به نظر می رسد آینده ترجمه و فرصت های شغلی مترجمان در سایه ای از ابهام و تردید قرار دارد. به باور بسیاری از متخصصان فن ترجمه ، مولفه هایی که نقش اساسی را در نتیجه نهایی یک ترجمه ایفا می کنند، شامل هزینه، زمان تحویل و کیفیت می شوند.  با این حال، ترجمه های ماشینی در شرایط کنونی نه تنها از سرعت بالایی برخوردارند، بلکه بسیار کم هزینه اند و به راحتی در دسترس همگان قرار می گیرند. اما کیفیت ترجمه این گونه نرم افزارها همچنان مسئله ای مشکل ساز و در عین حال پیچیده است.
یکی از مسائلی که ترجمه ماشینی را ازدیگر ترجمه ها متمایز می کند، نداشتن یک نظریه معقول است. این گونه ترجمه ها بر مبنای تئوری و نظریه اصولی بنیان نشده اند و به همین علت جهت گیری و انسجام لازم را در این زمینه ندارند. این در حالی است که هر مترجمی بر اساس باورها و فرضیه های خود متنی را ترجمه و از آن دفاع می کند.
گاهی تفاوت هایی زبانی به قدری نامحسوس است که ماشین ها و نرم افزار های ترجمه نسبت به آن ها بی توجه اند و ظرافت لازم را برای جداسازی شیوه های نوشتاری و ویژگی های ساختاری این زبان ها ندارند، اما مترجمی که از یک زبان به زبان مادری خود ترجمه می کند، قطعا این گونه تفاوت ها و تناقض ها را در می یابد و آن را در نحوه ترجمه خود اعمال می کند.
برخی از متون ارزش ترجمه را ندارند و در نهایت اگر هم ترجمه شوند، چندان موثر و مفید واقع نمی شوند. یک مترجم با یک بررسی هر چند اجمالی قادر است تا متن را ارزیابی کند و بر مبنای ابعاد و جوانب دوراندیشی شروع به ترجمه متن کند. ترجمه ماشینی از این ویژگی بی بهره است و همین هم سبب می شود تا ارزش نهایی  برخی از کارها به چشم نیاید.
و اما آینده شغلی مترجمان در بازار کار ترجمه ...
این مسئله تا حدود زیادی بستگی به مخاطبان و مشتریان دارد. آن دسته از افرادی که بیش تر به این گرایش دارند تا متنی از یک زبان به زبان دیگر بر گردانده شود و به کیفیت آن بهای چندانی نمی دهند، ترجمه ماشینی را بر می گزینند، اما کسانی هم هستند که کیفیت برایشان حرف اول را می زند و نه کمیت و به همین خاطر ترجمه ماشینی را قابل اعتماد نمی دانند و کار را به مترجمان خبره و با تجربه می سپارند.
این احتمال می رود که در آینده ای نزدیک، مترجمان امروز به عنوان ویرایشگران فردای ترجمه های ماشینی به کار خود ادامه دهند و همین ویرایش متون ترجمه شده نرم افزارها، خود کاری طاقت فرسا و دشوار است که مهارت و دقت عمل بیش تری را می طلبد تا جایی که مترجم های آینده باید وقت بیش تری را صرف اصلاح ترجمه های ماشینی نا منسجم کنند. شاید روزی برسد که مترجمان آرزوی بازگشت آن روزهای خوبی را داشته باشند که تک تک کلمات و جملات متن را از ذهن خود بر روی کاغذ می آوردند و یا با دست خود می نوشتند.
باید منتظر ماند و به آینده امیدوار بود، چرا که زندگی با تغییرات بسیاری آمیخته شده و هر کس که نتواند خود را با تغییرات وفق دهد، یک بازنده واقعی خواهد بود.


اجزای اصلی معماری ماشین های ترجمه
در معماری ماشين های ترجمه‌ سه‌ جزء‌ اصلی  وجود دارد. هر جزء‌ نيز به ‌نوبه‌ خود از مجموعه‌ اجزايی تشكيل‌ می ‌شود كه‌ در راستای تحقق‌ نقش‌‌ آن‌ سه‌ جزء ‌اصلی عمل‌ می كنند. اجزاء فوق در سه‌ سطح‌ قرار دارند که عبارتند از:
الف‌ - واژگانی
ب‌- صرفی و نحوی
ج‌- معنايی‌
بخش واژگانی
نخستين‌ مرحله‌ پردازش‌ در ترجمه‌ ماشينی‌ در سطح‌ واژگان‌ انجام‌ می‌شود که عبارتست‌ از تجزيه‌ و تحليل‌ مرفولوژيكی‌ واژه‌های‌ واحد تحت ترجمه‌. در اين‌ مرحله‌ عناصرموجود در سطح‌ واحد ترجمه‌ يك‌ به‌ يك‌ تفكيك‌، پردازش‌ و مقوله‌گذاری‌ می‌شوند. بايد با توجه به موارد مشکل آفرين‌ کاری کرد كه‌ ميزان‌ خطا در اين‌سطح‌‌ به‌ حداقل‌ برسد و راه‌ برای‌ انجام‌ پردازش‌ و تجزيه‌ وتحليل‌های‌ زبان‌شناختی مراحل بعد‌ هموار شود.
بخش صرفی
در اين بخش قواعد صرفی طی چند مرحله اعمال می گردد. ابتدا، پس از اينکه سيستم متن را بر اساس نمادهای قابل خوانش به طور خودکار شناسايی کرد، مرز جمله، گروه، واژه و ساير اجزای نحوی متمايز می شود. در مرحله دوم، متن به واحدهای پردازش تقطيع می شود و سپس اين واحدها به واحدهای واژگانی تقسيم می گردند. در مرحله سوم به طور خودکار مرز واژه ها مشخص می شود. در اين مرحله متن ورودی به صورت يک سلسله علايم پياپی در می آيد. از ترکيب اين علايم واژه ها و جمله ها به دست می آيند. وقتی متن به واحدهای پردازش واژه تقطيع شد تحليل دستوری آغاز می شود. اولين قدم در تحليل دستوری، آزمون هر واژه در جمله و انجام تقطيع های صرفی لازم می باشد. تقطيع صرفی (مثلاً پسوند + پايه) باعث می شود تعداد مدخلهای واژگانی در فرهنگ لغت سيستم کاهش يابد.
بخش نحوی
بخش نحوی در تحليل جملات و سازه های آن در زبان مبدأ و توليد جملات درست در زبان مقصد نقش ايفا می نمايد. سيستمهای ترجمه ماشينی معمولاً مجهز به سه نوع دستور هستند: دستور زبان مبدأ، دستور انتقال ساخت زبان مقصد و دستور زبان مقصد. دستور انتقال از اهميت خاصی برخوردار است زيرا برای يافتن قرينه های دستوری بايد به دستورهای انتقال مراجعه نمود و به اطلاعات راجع به تناظر ساختهای نحوی در دو زبان مبدأ و مقصد دست يافت.
Parser  در اصطلاح زبان شناسی محاسباتی ‌به برنامه‌ تجزيه‌ و تحليل ‌نحوی‌ متن‌ گفته می شود. با کمک آن رايانه می‌تواند عناصر تشكيل‌ دهنده ‌واحد تحت ترجمه‌ را بازشناسی‌ كرده و نقش‌ آنها و روابط درونی‌ و فيمابين‌ آنها و قواعد حاكم‌ بر آنها را تشخيص‌ دهد. در ترجمه‌ ماشينی‌ دستيابی‌ به‌ اطلاعات‌ ياد شده‌ ضروری‌ است‌ زيرا ‌ علاوه‌ بر برگردان‌ عناصر معنائی‌ و واژگان‌، ترجمه‌ ساختار نحوی‌ واحد ترجمه‌، از زبان‌ مبدأ به‌ مقصد نيز بايد انجام‌ شود. در واقع‌ برگردان‌ قالب‌ و ساختار جمله‌ از زبان‌ مبدأ به‌ زبان‌ مقصد، شرط اساسی‌ ترجمه‌ است‌. اين‌ امر جز با تجزيه‌ و تحليل‌ گرامری ‌واحد ترجمه‌ ميسر نمی‌شود. شايد‌ مهمترين‌ ركن يک‌ ماشين‌ ترجمه‌ تجزيه‌ و تحليلگر نحوی‌ يا parser  باشد
بخش معنايی
زبان اغلب به عنوان نظامی از نشانه ها تعريف می شود و عناصر زبانی مانند واژگان به شيوه ای بر اساس قواعد نحوی در کنار هم ظاهر می شوند که در ترکيب آنها معنای خاصی به ذهن متبادر می شود. مشكل‌ چندمعنا‌ بودن‌ واژه‌ها يکی از شناخته‌ شده‌ترين‌ ويژگيهای زبان‌ است‌. مترجم‌ به‌ هنگام‌ برخورد به‌ واژه‌ چند معنا، با تكيه‌ بر توانش‌ زبانی خود و بافت و موضوع‌ متن‌ می‌تواند معادل‌ واقعی‌ آن واژه‌ را تشخيص‌ داده و برگزيند اما يک رايانه‌ فاقد چنين ‌توانی‌ است‌. بنابراين‌ طراح‌ ماشين‌ ترجمه‌ بايد‌ خلأ موجود را ترميم‌ كند. اين‌ تمهيدات‌ بايد از نخستين ‌مراحل‌ پردازش‌ يعنی‌ از مرحله‌ واژگان‌ و نحو و ساختار آغاز گردد و تا آخرين‌ مرحله‌ يعنی ‌مرحله‌ تجزيه‌ و تحليل‌ معناشناختی‌ متن‌ تداوم‌ يابد.

 


[3] فرحزاد ف. استاد زبانشناسی و مطالعات ترجمة دانشگاه علامه طباطبایی، روزنامه کیهان

[4] Manning، C. D.، and Schutze، H.، Foundations of Statistical Natural Language Processing، 5th edition، The MIT Press، 2002. ISBN 0-262-13360-1

Comments (0) Posted to ترجمه ماشینی 12/28/2010 Edit

ترجمه ماشینی _ پردازش زبانهای طبیعی

 

 

پردازش زبان‌های طبیعی یکی از زیر شاخه‌های با اهمیت در حوزه گسترده هوش مصنوعی، دانش زبان‌شناسی و یکی از نیازهای اساسی عصر فناوری جهت استفاده بهینه از منابع اطلاعاتی است. امروزه با رشد حجم مستندات تولید شده و نیاز به نگهداری، دسته بندی، بازیابی و پردازش ماشینی و سریع آنها توجه به پردازش زبان طبیعی بیش از پیش خودنمایی می کند.  تلاش عمده در این زمینه، ماشینی کردن فرایند درک و برداشت مفاهیم بیان گردیده با یک زبان طبیعی انسانی می باشد. به تعریف دقیق‌تر پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و نوشتاری. با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتی نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها مثلاً برای مشورت گرفتن به گفتگو پرداخت.[2]
این‌ها تنها مثال‌هایی از کاربردهای متنوع پردازش زبان‌های طبیعی هستند. گفتنی ست هنوز سیستم چندان کارآمدی که پاسخگوی تمامی نیازهای ما باشد، برای پردازش زبان‌های طبیعی به وجود نیامده‌است.
موانع اساسی
- نیاز به درک معانی: رایانه برای آن که بتواند برداشت درستی از جمله‌ای داشته باشد و اطلاعات نهفته در آن جمله را درک کند، گاهی لازم است که برداشتی از معنای کلمات موجود در جمله داشته باشد و تنها آشنایی با دستور زبان کافی نباشد. مثلاً جمله حسن سیب را نخورد برای این که کال بود. و جمله حسن سیب را نخورد برای این که سیر بود. ساختار دستوری کاملاً یکسانی دارند و تشخیص این که کلمات کال و سیر به حسن برمی‌گردند یا به سیب بدون داشتن اطلاعات قبلی درباره ماهیت حسن و سیب ممکن نیست.
- دقیق نبودن دستور زبان‌ها: دستور هیچ زبانی آن‌قدر دقیق نیست که با استفاده از قواعد دستوری همیشه بتوان به نقش هر یک از اجزای جمله‌های آن زبان پی برد. برای مثال در جمله کوتاه باز روی زمین نشست. نمی‌توان تشخیص داد که باز قید جمله به معنای دوباره است یا این که فاعل جمله به معنای نوعی پرنده شکاری است.
زبان‌شناسی محاسباتی
زبان‌شناسی رایانه‌ای یا زبان‌شناسی محاسباتی (Computational linguistics) حوزه‌ای میان‌رشته‌ای است که سعی دارد با بهره‌گیری از روش‌های آماری و مبتنی بر قاعده(rule-based)، از منظر محاسباتی به مدل‌سازی زبان طبیعی بپردازد. به خصوص از این روش‌ها برای حل مسائلی استفاده می‌کنند که ناشی از طولانی بودن جملات و زیاد بودن تعداد حالات ممکن برای نقش کلمات هستند. این روش‌ها معمولاً مبتنی بر نمونه‌های متنی و مدل‌های مارکف هستند.
مقوله های زیر از جمله مباحثی هستند که در حیطه ی زبان‌شناسی محاسباتی قرار می گیرند:

- فرایافت concept و تجزیه زبان های برنامه نویسی : نوآم چامسکی توانست تشابه زبانهای طبیعی و زبانهای برنامه نویسی را به اثبات برساند. یعنی یک زبان رایانه‌ای مانند زبانهای طبیعی دارای یک دستور زبان و یک فرهنگ می‌باشد. تفسیر یک متن از تجزیهٔ واژه‌ها lexicon آغاز سپس با تجزیه نحو syntax و در آخر با تجزیه مفهوم semantic آن پایان می یابد.

- ترجمه ماشینی : این شاخه از زبان‌شناسی رایانه‌ای، زمان درازی کم اهمیت جلوه می‌کرد. اما امروزه یکی از موارد مورد علاقه پژوهشگران این رشته می‌باشد. پس از مرحلهٔ تجزیه واژه‌ها و نحو می باید تجزیهٔ مفهوم و سپس پرگماتیک را نیز افزود. در واقع این دو سعی در شناخت مفهوم خاص یک واژه در مکانی که ظاهر می‌شود را دارد.

- پرسش و پاسخ با زبانهای طبیعی : این ایده مدتی به‌عنوان پاسخی قانع کننده به مسئله ارتباط انسان و ماشین تلقی می‌شد. این دید در واقع جنبه ی وسیعتری از دستور زایشی چامسکی است.

- صرف محاسباتی : به مطالعات مربوط به ساختارهای درونی کلمات صرف گفته می‌شود. [2] اغلب دست‌آوردها و نتائج تحقیقات در صرف محاسباتی در سایه تلاشهای علمی انسان به منظور ایجاد و ساخت سیستم‌های پردازش زبان‌های طبیعی انسانی فراهم آمده است.

از جمله مهم ترین کارکردهای مهم پردازش زبان‌های طبیعی می توان موارد ذیل را نام برد:
خلاصه‌سازی خودکار، استخراج اطلاعات، بازیابی اطلاعات، ترجمه ماشینی، تشخیص نوری نویسه‌ها، تشخیص گفتار، ویرایش و ...

 

[2] Crystal D.، The Cambridge Encyclopedia of Language، 2nd edition، Cambridge University Press، 1996. ISBN 0-521-55967-7

Comments (5) Posted to ترجمه ماشینی 12/26/2010 Edit

ترجمه ماشینی _ مقدمه

 

 

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

دراين وبلاگ در این مبحث ، در ابتدا به طور خلاصه به تعریف پردازش زبانهای طبیعی، محدودیت ها، موانع موجود و همچنین کارکردهای مهم پردازش زبان های طبیعی پرداخته می شود. پس از آن مفهوم ترجمه و ترجمه ماشینی که یکی از مهم تریت کارکردهای پردازش زبان های طبیعی می باشد، بیان می گردد. اجزای مورد نیاز در معماری ماشین های ترجمه بیان گردیده و روشهای موجود در ترجمه ماشینی از ابتدا تا به اکنون تشریح و مزایا و معایب هر کدام ذکر می گردد. در پایان نیز با تاکید بر روش ترجمه ماشینی مبتنی بر روش های آمارگرا، ترجمه ماشینی در زبان فارسی مورد بررسی قرار می گیرد. اين مجموعه برای معرفی انواع پردازشهای موجود بر روی زبان های طبیعی و به خصوص ترجمه ماشینی متون، انواع روشهای موجود و روند پیشرفت و بهبود ماشین های ترجمه به پژوهشگراني كه هدفشان تحقيق در حوزه پردازش زبان و به خصوص ترجمه ماشینی است، كمك موثري باشد. در ضمن، به موانع موجود به خصوص در زمينه ترجمه ماشینی زبان فارسی اشاره گرديده و در خاتمه راه حل های پیشنهادی  موجود براي بهبود ترجمه ماشيني و به ویژه برای زبان فارسي مورد بررسي قرار گرفته است.
واژه های کلیدی:
ترجمه ماشینی، روشهای آماری، پیکره، فارسی.
مقدمه
پردازش زبانهای طبیعی نقشی بسیار عمده و کلیدی به خصوص در ترجمه ماشینی، بازیابی اطلاعات تک و دوزبانه، خلاصه سازی اسناد، مدیریت محتوا در سیستم های آموزشگر، خطایاب نحوی و معنایی متون، درک و تولید متون فارسی، تشخیص صحبت، تبدیل متن به گفتار، تحلیل نحوی، استخراج اطلاعات از متون و بسیاری کاربردهای دیگر ایفا می کند.
ترجمه خود كار متون، جزو اولين كاربردهاي غير محاسبه اي كامپيوتر است. ايده ترجمه ماشيني اولين بار در بحثي بين وارن ويور و آندره بوث شكل گرفت. مدل آنان بر اساس جداولي طراحي شده بود كه در آنها براي رمز گشايي، از تواتر كلمات و حروف استفاده مي شد.[1]
با پيدايش تكنيك هايي چون جست و جوي دودوئي و روش تقليل مسأله در الگوريتم هاي برنامه سازي و ايده ويرايش ثانويه در ترجمه، اعتقاد به عملي بودن ترجمه ماشيني قوت گرفت. در پايان دهه 50 و اوايل 60، COMIT به عنوان اولين زبان همه منظوره پردازش نماد مطرح شد و برنامه هاي كمكي واژه پرداز به مرحله پياده سازي رسيد. از سوي ديگر در زمينه زبان شناسي، نسبت به ساخت جملات زبان، ديد الگوريتميكي تحت عنوان دستور زبان گشتاري مطرح گرديد.
نتيجه پروژه هاي دهه 60 كه بيشتر از آنها براي مقاصد سياسي استفاده مي شد، پيدايش دو شاخه اصلي در روش هاي ترجمه ماشيني بود. يكي از اين روش ها استفاده از فرم هاي اصلاح شده دستور زبان گشتاري و ديگري استفاده از اطلاعات آماري در مورد نقش كلمات در جمله و ترجمه آنها بود. در پايان دهه 70، اعتقاد عمومي بر آن بود كه ترجمه ماشيني بايد پيچيده تر از جابه جايي و جايگذاري كلمات زبان مبدا براي رسيدن به زبان مقصد باشد و ماشين بايد به نوعي يك فهم از معناي هر دو نوشتار پيدا كند. اين اعتقاد راه را براي استفاده از تكنيك هاي جديد هوش مصنوعي و به خصوص پردازش زبان طبيعي در ترجمه ماشيني هموار كرد و در اين‌ مدت‌‌ شاهد پيشرفت‌های چشمگيری در قلمرو ترجمه‌ ماشينی و دستاوردهای متنوع‌ جانبی آن‌ بوده‌ ايم. اهميت‌ اين‌ پديده‌ جديد و مقتضيات عصر ارتباطات و اطلاعات ‌ايجاب‌ كرده‌ است‌ كه‌ ميزان‌ سرمايه گذاری در اين‌ عرصه در سالهای گذشته بسيار ‌چشمگير باشد.


[1] Booth, K. H. V. (1967). Machine aided translation with a post-editor. In A. D. Booth (Ed.), Machine Translation (pp. 53-76). Amsterdam: North-Holland Publishing Company.

Comments (1) Posted to ترجمه ماشینی 12/24/2010 Edit

ترجمه ماشینی

 ربات ها به زودی جایگزین مترجمین انسانی می شوند...

در این وبلاگ مطالب بسیار مفیدی درباره ترجمه ماشینی ارائه می گردد که امیدوارم مورد رضایت شما

 علاقه مندان و بینندگان وبلاگ قرار بگیرد.

 

ترجمه ماشینی

ترجمه ماشینی _ مقدمه

ترجمه ماشینی _ پردازش زبانهای طبیعی

ترجمه ماشینی _ مفهوم ترجمه و ترجمه ماشینی

ترجمه ماشینی _ روشهای موجود و شیوه های ارزیابی آنها

ترجمه ماشینی _ کارهای فعلی در زبان فارسی

 

لینک های ذیل نیز برای دانلود فایل ها و مقاله های مرتبط با موضوع ترجمه ماشینی قرار داده شده است.

سخنرانی توسط دکتر عبدالحسین صراف زاده در مورد ترجمه ماشینی مبتنی بر آمار

 

 مقاله ای در مورد سیستم ترجمه ماشینی آماری مبتنی بر عبارت فارسی انگلیسی

مطالعه و بررسی ابزارهاي آماده براي تحلیل پیکره متنی زبان فارسی

بررسی ابعاد و تفاوت هاي پیکره هاي برچسب داده اي و پیکره هاي خام در زبان فارسی  

امکان سنجی پروژه هاي زیرساختی کاربري خطو زبان فارسی در محیط رایانه اي 

بررسی ابعاد و لایه هاي ابهام در واژگان مشابه زبان فارسی 

  گروه اعداد در ترجمه ماشيني 

 دریافت اطلاعات HTML وبلاگ در موضوع ترجمه ماشینی در قالب فایل pdf

دریافت فایل پاورپویینت ترجمه ماشینی

 دریافت فایل پاور پویینت ترجمه ماشینی مبتنی بر آنتولوژی 

 

مهندس احمد استیری

Comments (0) Posted to ترجمه ماشینی 12/21/2010 Edit

پروژه پایان ترم کامپایلر

 

 

با سلام

 

 گروه هایی که سی دی پروژه میان ترم را تحویل نداده اند ، کلیه فایلها و مستندات خود را در قالب یک سی دی تحویل نمایند.

 

توضیحات تکمیلی پروژه پایان ترم  رو میتونید از لینک زیر دانلود کنید.

 

دانلود صورت کامل پروژه
 

 

 برای دانلود گرامر، روی لینک زیر کلیک کنید .... 

 

دانلود گرامر ساده زبان C 


 

با تشکر

مهندس استیری 

 کلمات کلیدی: پروژه اسکنر پروژه پارسر طراحی اسکنر طراحی پارسر اسکنر زبان C پارسر زبان C

پروژه کامپایلر اصول طراحی کامپایلر دانلود پروژه اسکنر دانلود پروژه پارسر پروژه LEX پروژه YACC

 اسکنر زبان C پارسر زبان C پروژه کامپایلر اصول طراحی کامپایلر دانلود اسکنر دانلود پارسر 

دانلود LEX دانلود YACC گرامر زبان C دانلود گرامر زبان C دانلود پروژه دانلود کامل پروژه

 جزوه اصول طراحي کامپايلر  جزوه کامپایلر  اسلاید کامپایلر  اسلایدهای کامپایلر  پروژه کامپایلر

نمرات کامپایلر  تمرین کامپایلر  تمرینات کامپایلر  حل تمرین کامپایلر  نمونه سوال کامپایلر

نمونه سوالات کامپایلر  امتحان کامپایلر  امتحانات کامپایلر حل تمرین کامپایلر

FLEX & YACC پروژه دانشجویی اسکنر پروژه دانشجویی پارسر flex bison

 flex.exe bison.exe a.l b.l Flex.l l.l

 

Comments (29) Posted to حل تمرین درس کامپایلر 12/08/2010 Edit

روبات ها به جنگ ما مي آيند!!!

تنوع روبات ها، به خصوص انسان نماها روز به روز بيشتر مي شود. توانايي هايشان افزايش مي يابد. حالا انسان از اين مي ترسد که روبات ها روزي در مقابل اش قرار بگيرند.

 

آيا روبات ها هميشه تحت کنترل انسان ها خواهند بود و از انسان ها فرمان مي برند يا روزي سر به طغيان بر خواهند داشت؟ روبات ها از دو سو به سرعت در حال پيشرفت هستند؛ از يک سو روز به روز پيشرفته تر مي شوند، گستره توانايي شان افزايش مي يابد و وظايف حساس تري بر عهده مي گيرند. از سوي ديگر تعداد آنها به سرعت در حال افزايش است و پيش بيني مي شود به زودي زندگي ما را پر کنند.

روبات ها به جنگ ما مي آيند؟

آيا روبات ها هميشه به انسان ها ياري مي دهند و زندگي آنها را ساده تر و لذت بخش تر مي کنند يا روزي براي انسان دردسرساز خواهند شد؟ آيا ممکن است در آينده به ستيز با انسان ها برخيزند. يا اين پرسش ها تنها به درد ساختن فيلم هاي تخيلي مي خورد؟

 

اگر به اين مباحث علاقه داريد، هر روز با وبلاگ خودتون همراه باشید.

 

اربک ساج مي گويد: «تسليم يک روبات شدن آن قدرها هم که فکر مي کنيد دور از ذهن نيست. فقط يک لحظه تصور کنيد سرش پوشش ندارد؛ پر از الکترود است. سيم هاي زيادي در آن نيست. سيم هاي نانوي مويي هم زياد نيستند. در بخش رسانه اي کمپين MIT در کيمبريج هستم. بخش تخصصي مربوط به روبات ها، بيشتر شبيه به اتاق يک جوان است تا يک لابراتوار. اتاقي پر است از انبوه کابل ها، جعبه هاي قديمي پيتزا و اسباب بازي ها و روبات هاي به هم ريخته و سرهم نشده. روبات انسان نماي يک و نيم متري که سه چرخ هم دارد مي آيد، به دور و بر اتاق نگاهي مي اندازد. با چشم هاي آبي پف کرده، تک تک به محققان خيره مي شود و من فکر مي کنم فرزندان همين روبات ها ممکن است چند سال ديگر با همين حالت بيايند و يقه سازندگانشان را بگيرند.»

 

او اضافه مي کند: «ساعتي قبل داشتم فيلم مربوط به همين روبات انسان نما به نام نکسي را روي اينترنت مي ديدم. به دوربين نگاه مي کرد و با صداي زنانه، خودش را معرفي مي کرد. فيلم را صدها نفر ديده بودند. چشمان نکسي بزرگ و صورتش بچه گانه بود. عده اي در باره فيلم  نظر داده بودند به جز چند نفر که از آن تعريف کرده بودند اکثريت خوششان نيامده بود؛ «اصلا شبيه انسان نيست»، «احمقانه است.» و «چندش آور است!»؛ اينها جمله هايي بود که نوشته بودند. مي خواستم به تمام کساني که اين طور بيرحمانه و بدون توجه به تلاش هاي شبانه روزي انجام شده براي ساخت اين روبات نوشته بودند، بگويم: آينده روبات هاي انسان نما درخشان است. اگر هنوز هم اين روبات ها چندان انسان ها را به وجد نمي آورند ولي به سرعت در حال پيشرفتند. مطمئنا در آينده نزديک، بچه ها عاشق روبات ها خواهند بود. من که شخصاً نکسي را دوست دارم! او يک روبات اجتماعي است.

 

نکسي؛ روباتي است که سلام مي کند، با شما دست مي دهد و اگر به او نزديک شويد شما را بغل مي کند. او به صدا حساس است و جمله هاي ساده اي را که برايش تعريف شده مي تواند تشخيص داده و به آنها عکس العمل نشان دهد. البته اگر اين جمله ها شمرده تلفظ  شوند. يکي از اعضاي تيم سازنده اش در باره آن مي گويد: اميدواريم در آينده نکسي هاي جديدتري بسازيم که از محدوده چند جمله اوليه فراتر رفته و با انسان مکالمه کنند، اگر چه نمي توانيم انتظار داشته باشيم در اوايل کار اين مکالمات جذاب باشند.»

روبات ها به جنگ ما مي آيند؟

اربک ساج ادامه مي دهد: «در مورد پيشرفت سريع روبات ها و پيچيده شدن آنها شک ندارم ولي موضوع اين است که اگر امروز نکسي مي تواند به صورت انسان ها نگاه کند و به چشمان آنها خيره شود و لبخند بزند، فردا روباتي ساخته خواهد شد که مي توانيم ادعا کنيم عاشق مي شود، دوست مي دارد، مي ترسد و حتي فريب مي دهد، وقتي روباتي به اين اندازه هوشمند ساخته شود و بتواند با ذهن انسان رابطه برقرار کند، آنگاه چطور مي توان مطمئن بود که مانند يک انسان انديشه نکند و به دنبال آمال و آرزوهاي خودش نرود؟ انديشيدن به اين مساله انسان را از جامعه در حال گسترش روبات ها به هراس مي اندازد.»

 

- روبات ها چگونه ظهور کردند؟

روبات ها در پيمودن سير تکامل داروين نيز خيلي با انگيزه تر و پرتلاش تر از انسان هستند. اين طور که نشان داده اند براي اينکه به تکامل برسند مثل انسان ها تنبل نيستند و نيازي به آن هزاره هاي دراز ندارند.

نخست در سال 1921 کلمه روبات را «R.U.R» ، يک دپارتمان علمي در کشور چک معرفي کرد، اول مي خواستند يک دستگاه الکترونيکي بسازند که ارزان قيمت باشد و در صنعت، بعضي از کارهاي ساده و طاقت فرساي انسان را به عهده بگيرد ولي همين هيات علمي در دهه هاي 40 و 50 ميلادي روبات هايي ساخت که مهندسين اش، خودشان تعجب کرده بودند! در اين دوره رفته رفته پديده اي به نام روباتيک ظهور کرد و معلوم شد داستان هاي آيزاک آسيموف چندان هم تخيلي نيستند.

روبات ها به جنگ ما مي آيند؟

در سال 1984 اتفاقي افتاد که عموم مردم را با روبات ها آشنا کرد. ترميناتور،فيلمي که آن روزها همه از آن صحبت  مي کردند. آرنولد شوارتزنگر نقش روباتي را بازي مي کرد که تفنگ در دست مي گرفت و بي واهمه براي دفاع از انسان مي جنگيد به زودي چند فيلم ديگر هم در اين باره ساخته شد و بحث روبات به موضوعي جذاب تبديل شد امروز آنچه در فيلم ترميناتور اتفاق افتاد به واقعيت نزديک تر مي شود. ارتش ها روبات ها را وارد ميدان جنگ مي کنند و کارهاي حساسي به آنها مي دهند؛ کارهاي خطرناک مانند خنثي کردن بمب را به آنها مي سپارند و شايد در آينده نزديک به آنها اسلحه بدهند و بگويند: بريد جلو!

 

- از روبات بايد ترسيد

روزي که روبات ها اسلحه به دست بگيرند آيا نبايد از آنها ترسيد؟ اين سوال ها را ابتدا پاتريک لين مطرح کرد. او استاد فلسفه دانشگاه کاليفرنياي آمريکاست و ظاهراً هم خيلي از روبات ها ترسيده. او مي گويد: «روبات ها بسيار پر کاربرد و به دردبخور هستند و پيشرفته تر شدن آنها مي تواند به نفع ما باشد. اما بايد حد و مرزي قائل باشيم. نبايد به آنها آزادي مطلق بدهيم. به شما هشدار مي دهم اگر امروز اين روبات ها را وارد کارهاي حساس و سرنوشت ساز کنيد ديگر نمي توانيد براي آينده تان تصميم بگيريد. اگر امروز به دست آنها اسلحه داديد فردا با همين سلاح ها در مقابل شما خواهند ايستاد!»

او حتي روبات هاي خانگي و روبات هاي به اصطلاح اجتماعي را هم بي خطر نمي داند. مي گويد: «مگر هدف نهايي شما آن نيست که اين روبات ها را مانند انسان احساساتي بار بياوريد؟ آن وقت اگر از شما؛ صاحبانشان توقعاتي داشتند آيا تضمين مي دهيد آنها را برآورده کنند؟ اصلا شما رمان فرانکشتاين را خوانده ايد؟»

او معتقد است روبات ها احساس تعلق خاطري به آرمان ها و ارزش هاي انساني نمي کنند. او مي گويد تا دير نشده بايد خط قرمزي براي روبات هاي در حال پيشرفت ترسيم کرد و مسووليت هاي حساس مانند رانندگي و از آن خطرناک تر وظايف نظامي را از آنها گرفت. او مي افزايد: «ترميناتور را فراموش کنيد، آن فقط يک فيلم تخيلي است. اسلحه دادن به دست يک روبات بازي با جان انسان هاست.»

ساخت روبات هايي که تنها جنبه سرگرمي دارند يا کارهاي خانه را انجام مي دهند، زياد خطرناک به نظر نمي رسد. آنها امکاناتي ندارند که ما را تهديد کنند يکي از اين نوع روبات ها روباتي است که با شما پينگ پنگ بازي مي کند. البته او هنوز خيلي ناشي است. روباتي کوتاه قد هم اخيرا ساخته شده. يک توپ رنگي را برايش پرتاب مي کنيد، مي رود و آن را مي آورد. دوست داشتني تر و بامزه تر از آن است که بخواهد دردسر ساز شود.

 

روبات ها به جنگ ما مي آيند؟

- فقط اگر يک لحظه ...

ولي همه روبات هايي که اين روزها معرفي مي شوند اين گونه نيستند. از بحث روبات هاي نظامي که بگذريم، روبات هايي که براي جراحي وارد نقاط حساس بدن مي شوند هم امروز در حال طراحي و ساخته شدن هستند آنها را هم نبايد دست کم گرفت. بعضي از آنها مغز را جراحي مي کنند هر حرکتي ممکن است جبران ناپذير باشد. امروز خطري که وجود دارد اين است که آنها در اثر خطا درست کار نکنند ولي در آينده وقتي پيچيده تر شدند و استقلال بيشتري پيدا کردند، در ميان يک عمل جراحي شايد بخواهند تصميمات عجيبي بگيرند و عمداً دست به حرکات فاجعه باري بزنند.

اخيرا هم برخي از شرکت هاي بزرگ فعال در زمينه ساخت روبات تصميم به توليد روبات هايي گرفته اند که پشت اتومبيل مي نشينند و رانندگي مي کنند. آيا ممکن است روزي، در حالي که يکي از ما انسان ها در حال عبور از خيابان هستيم يکي از اين روبات هاي راننده دلش نخواهد بايستد؟

يکي از شرکت هاي روباتيک اعلام کرده در حال کار روي پروژه عظيم روباتي به نام روبات مغز است گفته اند در سال 2019 آن را عرضه خواهند کرد کسي نمي داند دقيقا چيست شرکت سازنده اش گفته، آنچه در حال ساخت آن است يک مغز تمام عيار است؛ مغزي مانند مغز انسان! چيزي که مي توانيم با اطمينان بگوييم اين است که روبات ها فعلا در اختيار ما هستند هنوز مي توانيم آينده آنها را هر طور که خواستيم تعيين کنيم. اما آيا شرکت هايي که روبات مي سازند و سود سالانه کلاني از فروش توليداتشان به دست مي آورند حاضر مي شوند برخي توليداتشان را متوقف کنند يا در بعضي زمينه ها کارشان را محدود کنند؟ شايد سال 2019 ديگر براي اين کار دير شده باشد از طرف ديگر، عده اي خطرساز شدن روبات ها را اصلا باور ندارند و آن را يک شوخي بامزه مي پندارند کوين وارويک استاد دانشگاه ريدينگ انگليس يکي از آنهاست او اصلا نگران پيشرفت چشم گير روبات ها نيست و مي گويد: «مگر ما آنها را نمي سازيم؟ پس ديگر نگراني براي چيست؟ وقتي ما آنها را تهيه و توليد مي کنيم به اين معني است که از نظر فکري ما از آنها برتريم. نبايد از آنها بترسيم هر چقدر هم که پيشرفته و هوشمند شوند ما همواره يک پله از آنها بالاتريم هميشه در مشت ما خواهند بود!»

 

برگرفته از همشهري

Comments (0) Posted to مطالب علمی 12/08/2010 Edit

WEB3 چیست؟ ( از دیدگاه مهندس سالخورده حقیقی)


 «وب 3» اصطلاحی است که برای اشاره به وب آینده به کار میرود. پس از آنکه اصطلاح وب 2 برای تکامل اخیر وب رواج یافت، بسیاری ازمتخصصین ،روزنامه نگاران و رهبران فن، اصطلاح وب 3 را بکار بردند تا فرضیاتیدرباره موج آینده تغییرات اینترنت مطرح کنند.

نظراتپیرامون مرحله بعدی سیر تکاملی وب، بسیار متفاوت است، برخی معتقدند؛ پدیدار شدنتکنولوژی وب مفهومی راه وب راتغییر خواهد داد و آنرا به سوی هوش مصنوعی خواهد برد.دیگر نظریه پردازان اظهار میکنند که وب 3 افزایش سرعت اینترنت، اپلیکیشن های تحت وب، یا پیشرفت گرافیکی رایانه، نقش کلیدی را در سیر تکاملی وب بازی خواهد کرد.

نظرات رهبران فن:
تیم برنزلی ـ مخترع وبـ در ماه می سال 2006 گفت:
مردم مداممیپرسند وب 3 چیست؟ من فکر میکنم وقتی شما تعداد زیادی کاغذ کالک را روی هممیگذارید همه چیز ناهموار و چین خورده شده، مبهم به نظر میرسد. وب 2 و دسترسی بهوب مفهومی، سراسر حجم عظیم اطلاعات را یکپارچه میکند، شما دسترسی غیر قابل باوریبه منابع اطلاعاتی خواهید داشت.
در ماه میسال 2006 از اریک اسمیت ـ مدیر گوگل ـ خواسته شدتا وب 2 و وب 3* را تعریف کند. او پاسخ داد:
اگر بخواهیدکه حدس بزنم که وب 3 چه خواهدبود، خواهم گفت که «وب 3» راهی متفاوت در ساخت اپلیکیشن ها است. پیش بینی من ایناست که «وب 3» در نهایت در قالب اپلیکیشن هایی تحقق می یابد که تکه ای ازیکدیگرند. شماری از ویژگی های آنها از این قرار است: اپلیکیشن ها نسبتا کوچک ،اطلاعات توده ای ، اپلیکیشن ها روی هر وسیله ای اعم از پی سی یا تلفن همراه قابلاجرا، اپلیکیشن ها بسیار سریع و بسیار قابل کاستومایز و اپلیکیشن ها توزیعی خواهندبود، بصورت لفظ به لفظ؛ با شبکه های اجتماع، با ایمیل. شما به فروشگاه نمیروید تاآنها را بخرید آنها نوع بسیار متفاوتی از اپلیکیشن هاخواهند بود که ما هرگز در محاسباتمان ندیده ایم.
در نوامبرسال 2006، جری یانگ ـ بنیانگذار و رئیس یاهو ـ گفت:
وب 2 خوبمستند شده و درباره آن سخن گفته اند، نیروی اینترنت با امکاناتی که در مرحله شبکهمیتوان انجام داد به نقطه بحرانی رسیده است، ما همچنین از چهار سال قبل شاهدابزارهای قدرتمند هستیم، همچنین راه های قدرتمند تعامل با شبکه را نه تنها در سختافزار مانند کنسول های بازی و ابزارهای همراه، بلکه حتی در شاخه نرم افزار مشاهدهمیکنیم، شما لازم نیست که متخصص کامپیوتر باشید تا یک برنامه ایجاد کنید. مامیبینیم که توسعه بزرگ در وب 2 و وب 3، توسط مانیفست صورت میگیرد، یک اشتراک حقیقیمیانی تمایز میان حرفه ای، نیمه حرفه ای، ومصرف کننده گان محو میشود. ایجاد یک شبکه، تجارت و اپلیکیشن ها را نتیجه میدهد.
رید هاستینگس 
ـ بنیانگذار و مدیر Netflix ـ فرمول ساده تری برای تعریف مراحل وبدارد:
وب 1 دیالآپ بود، با 50 کیلوبایت پهنای باند، وب 2 با 1 مگابایت پهنای باند میانگین، و وب 3با 10 مگابایت پهنای باند ثابت خواهد بود. بگونه ای که وب کاملا ویدئویی خواهدبود، آن هنگام آرزوی وب 3 تحقق خواهدیافت.

نوآوری هایی که با «وب 3» پیوند خورده اند:
اپلیکیشن های مبتنی بر وب و دسکتاپ؛
تکنولوژی وب3 همچون نرم افزار های هوشمند که از داده های مفهومی استفاده میکنند. اندازه کوچکبا چندین شرکت برای اینکه از کار با داده ها بهره وری بیشتر و موثرتری داشت. در هرصورت در سالهای اخیر عموماً روی تکنولوژی وب مفهومی تمرکز بیشتری میباشد.

منازعات پیرامون وب 3: (منازعاتقابل توجه پیرامون چیستی اصطلاح وب 3 و تعریف شایسته آن)

تبدیل وب 3 به یک دیتابیس:
اولین قدمبسوی وب 3 ظهور «داده وب» است، ساختاری که اسناد در وب منتشر میشوند. فرمت های قابلاستفاده، قابل کنترل و قابل جستجو همچون RDF، ICDL و microformats. رشد اخیر تکنولوژی SPARQL استانداردی برای زبان جستجو و API یی برای جستجوی سراسر RDF، دیتابیسی توزیعی روی وب فراهم کرده است. داده وبمرحله جدیدی از داده های یکپارچه و اپلیکیشن های مشارکتی را فعال کرده و داده هارا قابل دستیابی باز و قابل پیوند همچون صفحات وب ساخته است. داده وب اولین قدم ازراهی است که بسوی وب کاملا مفهومی میرود. در مرحله داده وب، تمرکز بیشتر بر روی تبدیلفرمت داده های در دسترس به RDF میباشد. وبمفهومی کامل، مرحله ای از وب است که تمام پهنای داده های فرمت شده و سنتی که قالببندی نشده اند یا محتواهای نیمه فرمت شده، (همچون صفحات وب، اسناد و مانند آن)باید در دسترس RDF و OWL که فرمتهایمفهومی میباشند قرار گیرداجزای تمپلتوبسایت هاباید قابل استفاده مجری وب 3 باشد تا بیشتر بتواند اطلاعات جامعیدرباره محتوای سازمان یافته وبسایتها بدست آورد.

سیر تکاملی بسوی هوش مصنوعی:
همچنین وب 3مسیر تکاملی وب را که به هوش مصنوعی منتهی میشودتوصیف میکند، مسیری که وب را به شکل یک شبه انسان تبدیل میکند. برخی شکاکانمعتقدند که این تصوری دست نیافتنی است. در هر صورت کمپانی هایی همچون آی بی ام و گوگل در حالتکمیل تکنولوژی های جدیدی هستند که اطلاعات شگفت انگیزی بدست می آورد مانند پیشبینی موسیقی از طریق اطلاعاتی که روی وبسایستهای موزیک موجود است. اینجا همچنین برروی اینکه نیرویی که وب 3 را به حرکتدر خواهد آورد مناقشه است؛ آیا سیستم های باهوش خواهند بود یا هوشمندی از یک نوعسازمان دهی بیشتر پدیدار خواهد شد. از سلسله ای از هوشمندی انسانها، چنانکه از راه فیلترینگجمعیسرویسهایی همچون خوشمزه، فلیکر و 

Comments (1) Posted to وب معناگرا چیست؟ 11/15/2010 Edit

جزئیات بیشتری از وب معنایی

وب معنایی شیوه ای برای ایجاد یک وب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. مقاله به اجمال به توصیف پنج سطح وب معنایی می پردازد شامل: 1) آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)؛ 2) فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.){تعریف نوع سند(دی.ان.اس.)}/ فرانمای چارچوب وصیف منبع (آر.دی.اف)؛ 3) واژگان- هستی شناسی؛ 4)قواعد- منطق و برهان؛ 5)امنیت- اطمینان. مقاله با این نتیجه خاتمه می یابد که بایستی وب سایت های خود را به عنوان جزئی از یک کل در نظر بگیریم، نه در انزوا از دیگر سایت ها.


کليد واژه ها :وب معنایی


 

مقدمه

 


در حالیکه به نظر می رسد با فروکش کردن موج دات کام ها {سایت های تجاری.م.} ، بخشی از انقلاب اینترنت خاتمه یافته است، انقلاب خاموش دیگری در وب در حال وقوع است. وب تا کنون درمسیر تولید، ورود، ذخیره و نمایش اطلاعات موفق بوده است، اما بازیابی و پردازش هنوز به عنوان یک مشکل باقی است.


 

موج اول پیشرفت وب شامل ارائه حداکثر اطلاعات ممکن به شکلی بود که بتواند به صورت مستقیم در قالب زبان نشانه گذاری فرامتن (HTML)برای مخاطب نمایش داده شود. بانک های اطلاعاتی هر روز بیش از پیش تلاش می کنند اطلاعات را به شکلی تولید نمایند که قبل از نمایش برای کاربر، توسط دیگر رایانه ها قابل خواندن و پردازش باشد. آنها برای برچسب گذاری داده ها، به جای HTML از زبان نشانه گذاری توسعه پذیر (XML) بهره می برند و برخی از آنها به منظور استاندارد سازی قالب محتوا به نحوی که صرف نظر از کاربرد نهایی، توسط رایانه ها نیز قابل خواندن باشد به استفاده از چارچوب توصیف سند (RDF) روی آورده اند.

 


 

در موج جدید پیشرفت تلاش می شود تا هر شیی اطلاعاتی موجود در جهان اطلاعات به واسطه موضوع، محل، پدیدآورنده، تاریخ و دیگر ویژگی هایش توصیف شود. این نوع اطلاعات پیشتر تنها در یک بانک اطلاعاتی ذخیره می شد اما اکنون ممکن است در یک سند ذخیره شود.

 


وجه تمایز میان یک پیشینه در یک پایگاه اطلاعاتی و یک سند هر روز کم رنگ تر می شود. اطلاعات ممکن است در ابربرچسب (Metatag) ها در راس یک صفحه HTML قرار گیرد یا یک سند کامل ممکن است با استفاده از XML با بخش های مفصل نظیر عنوان، چکیده، روش ها، و نتایج کدگذاری شود.


 

این موج تازه پیشرفت را "وب معنایی"( Semantic web) می نامند. وب معنایی شیوه ای است برای ایجاد یک وب که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده، آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند. این امر ممکن است از بازیابی اسناد گرفته تا جمع بندی عناصر برنامه ای مختلف برای خلق یک نرم افزار کاربردی را دربر گیرد. تیم برنرزلی (Tim Berners-Lee) {ابداع کننده وب معنایی.م.}عقاید خود را درباره این امکانات در { http://www.w3.org/2000/talks/1206-xml2k-tbl }مطرح کرده است.

 


 

وب معنایی شامل پنج سطح است:

 


1.  آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (URI) ،

2.  فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (XML Schema) {تعریف نوع سند(DTD) }/ فرانمای چاچوب توصیف منبع (RDF Schema) ،

 

3.  واژگان- هستی شناسی،

 

4.  قواعد- منطق و برهان،

 

5. امنیت- اطمینان.

 

 

 

در حالیکه بسیاری از این عناصر پیشاپیش پیرامون وب وجودداشته اند، فناوری هایی که امکان بکارگیری منسجم آنها را فراهم می کند به تازگی عرضه شده اند. محدودیت های اصلی این رهیافت بیشتر از عوامل انسانی نشأت می گیرد تا از فناوری.

 

 

آدرس های منحصر به فرد- نشانگر متحدالشکل منبع (یو.آر.آی)

 

 

نقطه آغاز برای اطلاعات وب، آدرس منحصر به فرد آن است- اما آیا واقعاً منحصر به فرد است؟ ما با مکان نماهای متحدالشکل منبع (URL) به عنوان شیوه توصیف محل ها آشنا هستیم اما با ایجاد تغییر در اسامی حوزه ها و بسته شدن سایت ها، نشانگرهای منحصر به فرددیگری اتخاذ می شوند نظیر نشانگر دیجیتالی شئی (DOI) یا یو.آر.ال ثابت (برای جزئیات بیشتر نگاه کنید به http://www.purl.org. )راه حل های گوناگونی وجود دارد، این موارد را می توان به صورت کلی تر به عنوان URI ها توصیف کرد که این مزیت رادارند که اگر آدرس وب نهایی تغییر کند، URI  هنوز به محلی اشاره می کند که نهایتاً به محل اصلی منبع منتهی می شود.


 

فرانماها- فرانمای زبان نشانه گذاری توسعه پذیر (ایکس.ام.ال.)/ فرانمای چاچوب توصیف منبع (آر.دی.اف)

 


 

زبان نشانه گذاری توسعه پذیر قبلاً در مقاله دیگری توصیف شده است(1). تولید برونداد در قالب XML ازیک بانک اطلاعاتی چه به عنوان یک صفحه وب ثابت یا یک نتیجه جستجوی پویا امر بسیار ساده ایست. این برونداد می تواند توسط یک برنامه کاربردی دیگر مورد استفاده قرر گیرد و امکان تبادل، ترکیب یا پردازش داده ها را فراهم نماید (برای جزئیات نگاه کنید به http://www.xml.org.

 


 

XML شیوه ای برای برچسب گذاری داده هاست. با این حال نیازمند یک فرانما (طرح) برای اعتبار بخشی به محتوای برچسب (Tag) هایی است که هر جزء از داده ها را توصیف می کنند. پدیدآورنده، عنوان و سال ممکن است به عنوان برچسب در سندی که توسط یک فرانما یا تعریف نوع سند (DTD) توصیف شده است درج شوند. زبان نشانه گذاری توسعه بین المللی (IDML) می تواند مثال خوبی باشد (برای اطلاعات بیشتر نگاه کنید به http://www.idmlinitiative.org/).)

 


مادامیکه به سمت یک نظام خودکار که در آن رایانه ها داده ها را تعبیر می کنند پیش می رویم، لازم است برچسب هایی برای کنترل پردازش داده ها و اطمینان از استاندارد سازی محتوا وجود داشته باشد؛ این همان جایی است که آر.دی.اف اهمیت می یابد. آر.دی.اف یک استاندارد است که گاه برای تبادل داده میان بانک های اطلاعاتی مورد استفاده قرار می گیرد.


یکی دیگر ازسیستم های کدگذاری که برای کمک به تبادل محتوا به زبان های مختلف ایجاد شده است، Unicode است. یونی کد استانداردی است برای مشخص نمودن حروفی که خارج از مجموعه کدهای ASCII قرار دارند. یونی کد یک استاندارد جهانی برای نمایش حروف و علائم فراهم نموده و تبادل ساده آنها با دیگر برنامه های کاربردی را بدون بروز اشکال در مورد حروف دارای اکسان (علائم صوتی) میسر می نماید (برای جزئیات بیشتر نگاه کنید به http://www.unicode.org/.)


 

واژگان- هستی شناسی

 


 

این مبحث، هم به واژگان رایانه نظیر واژگان مورد استفاده برای خدمت دهنده های اینترنت جهت برقراری ارتباط و تبادل اطلاعات ارتباط می یابد و هم به مفاهیمی که گروه های فعال درحوزه های موضوعی مختلف جهت تعریف حوزه موضوعی شان بکار می برند.. هر دو مورد برای اطمینان از بازیابی و نمایش اسناد یا داده های مرتبط در هنگام جستجوی کاربر به زبان طبیعی ضرورت دارند. مراحل دخیل دراین امر نه تنها شامل عبارت جستجوی ارسال شده به بانک های اطلاعاتی مختلف جهت دریافت پاسخ می شود بلکه اهمیت برقراری پیوند میان واژگان در زبان ها و رشته های مختلف را نیز دربر می گیرد.

 


قواعد- منطق و برهان

 

 

قواعدی که رایانه با اتکا به آنها به بازیابی داده ها از طیفی از منابع می پردازد در واقع همان Script ها و برنامه های نرم افزاری هستند. برخی بر این باورند که این قواعد بایستی به مرحله ای از تکامل برسند که به صورت خودکار به عنوان مثال افزایش دستمزد ها را در یک شرکت بر مبنای برآورد فروش یا تولید در اینترانت آن شرکت کنترل کنند؛ اما شاید هم در جهان علمی، اعتبار، برگرفته از گزارش ها یا نوشته های افراداست نه رایانه.

 

 

امنیت- اطمینان

 

در حالت واقعی، اگر چه ایده یک وب یکپارچه ممکن است جذاب به نظر برسد، اما هر روز بیش از پیش با محدودسازی وب از طریق ایجاد رمز عبور برای وب سایت ها مواجه می شویم. اطلاعات به طور معمول میان یک گروه از شرکت ها یا یک کنسرسیوم از سازمان ها به اشتراک گذاشته می شود. تجربه شخصی من این است که در مورد همکاری با سازمان های وابسته به سازمان ملل و بانک جهانی، اگر قرار باشد آنها با گردآوری انبوه اطلاعات یک نظام مرکزی تدارک ببینند، تردید وجود دارد. جایی که یک تعاونی یا کنسرسیوم از سازمان ها پیرامون امنیت یا نفع مشترک گرد هم می آیند، رهیافت اشتراک داده ها موفق تر است. فناوری های جدید شیوه هایی جهت وصول اطمینان از تضمین امنیت اطلاعات فراهم می کنند. به طبع، دراین صورت کاربر نیز اطمینان و اعتماد بیشتری به داده ها و نظام پیدا می کند. در نتیجه نهایتاً با مجموعه ای از وب ها مواجه خواهیم بود که از اطمینان لازم برای کاربردهای مختلف توسط گروه های متفاوت برخوردار هستند. این شبکه ها نسبت به نظام های موجود که مبتنی بر یک سازمان فراهم کننده محتوا هستند، خدمات بهتری می توانند ارائه کنند.

 

 


وب معنایی چگونه بر نظام شما اثر می گذارد؟


همه گروه های فراهم کننده اطلاعات روی وب پیشاپیش با انتخاب ابربرچسب های بکار رفته در صفحات وب خود، به نحوی در ایجاد نوعی وب معنایی مشارکت کرده اند. با انتخاب برچسب ها، به عنوان نمونه برچسب های پیشنهادی Alta Vista یا Dublin Core (http://www.purl.org/dc/) شیوه هایی جهت توصیف پدید آورنده، عنوان وموضوع یک سند فراهم می شود. انتخاب کلیدواژه موضوعی احتمالاً مشکل تر است. اگر در یک شرکت کشاورزی کار می کنید ممکن است به عنوان مثال از AGRIS یا CAB Thesaurus یا سیاهه کلید واژگان خاص خودتان استفاده کنید.

 


 

ممکن در حال استفاده از یک بانک اطلاعاتی برای ایجاد وب سایت خود باشید. دراین صورت احتمالاً با ایکس.ام.ال به عنوان شیوه ای جهت ارسال داده ها به دیگران و دریافت داده ها از دیگر منابع به منظور درونداد دسته ای داده ها آشنا باشید. وقتی این موارد پیچیده تر می شوند، ممکن است از نرم افرارهای کاربردی ای استفاده کنید که معرّف لایه های منطق و برهان در وب معنایی هستند. به عنوان مثال ممکن است تنها پذیرای دروندادی باشید که با معیارهای خاصی مطابقت داشته باشد، به یک موضوع خاص مربوط باشد و به دوره زمانی خاصی محدود شود.

 



بسیاری از وب سایت های موجود دارای حوزه های امن متکی بر رمز عبور هستند اما مشکل توسعه وب سایت ها، به ایجاد اطمینان هنگام همکاری با سایر فراهم کنندگان اطلاعات جهت ایجاد خدمات مشترک و یا همکاری با کاربران جهت ارائه خدمات برمی گردد.


روشن است مادامی که وب معنایی تا قبل از رسیدن به دیدگاه های مطرح شده توسط افرادی چون تیم برنرزلی همچنان به تکامل خود ادامه می دهد، ما بایستی وب سایت های خود را جزئی از یک کل در نظر بگیریم و نه درانزوا از دیگر سایت ها. با توجه به این ایده، ارزش آن را دارد که توجه خود را معطوف شیوه ایجاد وب سایت ها کرده و با بهره گیری از فناوری های نوین به همکاری با دیگران جهت تدارک خدمات روی آوریم.

 



* Addison, C. (2001), “the Semantic Web”, Information development, 17(2), pp. 83-84.


 

مآخذ:

 


1. Addison, C. (1999), “Extensible Markup Language”, Information development, 15(3), pp. 153-154


نکته: جهت مطالعه بیشتر در مورد وب معنایی به زبان فارسی وآشنایی بیشتر با برخی اصطلاحات بکاررفته در این مقاله رجوع کنید به: جمالی مهموئی، حمید رضا "وب معنایی: راهکاری رو به توسعه..."، اطلاع شناسی، ج.1، شماره.2 (1382 پاییز(


 


معادل انگلیسی واژه های متن:

برهان = Proof

 

تعریف نوع سند = Document Type Definition: DTD

 

زبان نشانه گذاری توسعه بین المللی = International Development Markup Language: IDML

 

زبان نشانه گذاری توسعه پذیر = eXtensible Markup Language: XML

 

زبان نشانه گذاری فرامتنی = HyperText Markup Language: HTML

 

فرانمای چاچوب توصیف منبع = Rresource Description Framework Schema

 

فرانمای زبان نشانه گذاری توسعه پذیر = (XML Schema)

 

مکان نماهای متحدالشکل منبع = Uniform Resource Locator: URL

 

مکان نماهای متحدالشکل منبع ثابت = Uniform Resource Locator: PURL Permanent

 

نشانگر دیجیتالی شئی = Digital Object Identifier: DOI

 

نشانگر متحدالشکل منبع = Uniform Resource Indicator: URI

 

هستی شناسی = Ontology

 

 

Comments (1) Posted to وب معناگرا چیست؟ 10/29/2010 Edit

Semantic Web یا Data Web یا وب3 یا همون وب معنایی

اول از همه یهتعریف کوچکی از نسخه های قبلی وب داشته باشیم.
وب 1 که همون
World Wide Web اولیه خودمون بود که سیستم فقط تک کاربره بود و یااصلآ داینامیک نبود که بعد ها تبدیل به داینامیک هم شد.
وب 2 که با ظهور تکنولوژی
Ajax (تو پرانتز) که خیلی ها هم فکر میکنن به خاطر هیمن Ajax بهش میگن وب 2ولی نه به خاطر به وجود آمدن سیستم های اشتراک کاربری مثل ویکی پدیا یا یوتیوپ بهاین نام مشهور شد
وب 3 تو این نسخه که به
Semantic Web (همون وب معنایی) معروفه تلاش محققان و صاجبنظران براینه که محتوای وب سایتها طوری نوشته بشن که علاوه بر انسان برای ماشین هم قابلدرک باشه.
همانطور که میدونید امروزه اکثر کاربرای اینترنتی برای پیدا کردن سوالات خود
Search enginها کمک بگیرند.
ولی با تمام هزینه هایی که برای موتور های جستجو می شود ولی باز هم نتایج ایده آلنشده و صفحاتی برای کاربر نشان داده میشود که اصلآ ربطی به کوئری که او میخواهدندارد.

 حالا لازم میدونم یه گزارشمختصر بدم از وب معنایی که این روزا خیلی تو بورسه و کلا هم خیلی سنش زیاد نیست.وب به رغم موفقیت‌زیادش در انتشار اطلاعات تو یه زمینه متاسفانه تا حالا به موفقیتقابل توجهی دست پیدا نکرده و اونم اینکه نقش کامپیوترا تو این فرایند انتشاراطلاعات فقط ابزاریه و اونم در حد ساده و غیر معنایی. کامپیوتر هیچ شهودی نداره ازاینکه این اطلاعات چی هستن و اصولا بر مبنای یه سری الگوریتم نسبتا کور عمل میکنه.اعمالی مثل کلاسترینگ یا دسته بندی و غیره هم کمک خاصی به این موضوع نمیکنن.کامپیوتر و برنامه‌ها باید نقش فعال‌تری ایفا کنن و بتونن اطلاعات رو تفسیر کنن ویا اینکه از اونها نتیجه‌گیری‌های جدیدی به عمل بیارن که لازم به دخالت انساننباشه.

مشکلاساسی از اونجا میاد که کامپیوترها با معنا سروکار ندارن وبیشتر به ارتباطات صفحاتو ساختار گیر میدن تا معنای مستتر در صفحات وب و این مخالف فرایند انسانیه که بهمعنا اهمیت بیشتر میده. دلیل اینکه به وب معنایی نیاز هست هم تا حدی واضحه . اول اینکهالگوریتم‌هایی که در رشته‌های مختلف وجود دارن وابسته به دامنة خاصی هستن و جاهایدیگه کار نمی‌کنن و ما میخوایم به یه الگوریتم یا فرایند نسبتا یکنواخت دست پیداکنیم که تو حوزة معنا کار کنه یه چیزی شبیه به مفهوم پروتکل که نمونه‌ش همین httpیا پروتکل‌هایدیگه‌س که بصورت یکنواخت و همه‌جا فهم عمل میکنن و دوم هم اینکه اصولا این مکانیسمو مفهوم وب معنایی شدیدا به کمک کاربرا میاد و میتونه قسمت اعظم کار و زحمت اونا ویا شاید زحمت‌هایی که هیچوقت امکانات انسانی از پسش بر نمیان رو انجام بده مثلاینکه 100 ژورنال رو بخونه و مقالة مورد نظر ما رو پیدا کنه و یا اینکه از خوندنیه سری از اونا و سرزدن به کلی سایت و صفحه بتونه به نتایجی برسه که کار ما روشدیدا ساده کنه.

تیمبرنرز-لی این اصطلاح وب معنایی رو بعنوان افزایش  یک منطقبرای وب بکار برد و ابداع کرد. و هدفش هم این بود که تمامی پتانسیل وب رو بااستفاده از متاداده‌هایی که میتونن برا ماشین قابل فهم باشن ، استخراج کنه.

میبینینچقدر این ایده و مفهوم میتونه زندگی رو راحت کنه و یا شاید امکاناتی رو بوجودبیاره که قبلا خوابشم نمی‌دیدیم؟ حالا اومدن و فکر کردن که برای تحقق این رویا چهکاری میتونیم انجام بدیم و ایدة متاداده یا metadata که چیزیشبیه tagهستش اولین ابزاریه که به ذهن میرسه. مسئلة اول اینه که یه syntax مورد قبولهمه برای نمایش این متاداده فراهم کنیم که این کار رو سازمان W3C انجام داده که همون کنسرسیوم WWWهستش. دو زبان استانداردی که معرفی شدن عبارتن از RDF- Resource Description Format  و   OWL  که همون WebOntology Languageهستش و یا DAML+OIL و SHOE که بازمورد استفاده قرار میگیرن. حالا لازمه که محافل علمی و صنعت از این دو استانداردحمایت کنن که حمایت‌ها و هماهنگ‌سازی‌ها شروع شدن. زبونایی که گفتم کلی چیزای دیگهلازم دارن مثلا زبونی برای گرفتن Query که در مورد RDF اسمش هست RQL.

مسئلةاساسی تر با داشتن نحو زبان‌ها داشتن فرهنگ لغاتیه که بشه باهاش صحبت کرد و اینالبته از یه حوزه به حوزة دیگه کاملا متفاوته و اصطلاحا این فرهنگ لغات و واژگانرو Ontology میگن. حالا اینکه این آنتولوژی‌هااز کجا میان به چند صورت ممکنه. صورت اول اینه که یه سری آدم متتخصص تو هر رشتهبشینن و زحمتشو بکشن که خیلی شبیه کاریه که یاهو اوائل انجام میداد و خوب محدودیتداره و نمیشه این حجم عظیم دانش رو بصورت دستی زحمتشو کشید. روش دیگر استفاده ازالگوریتم‌های مناسب روی توده‌های عظیم متنی یا corpusها هستش و استفاده از یادگیری ماشین و روشهای آماری و خلاصه هر روشی که بهذهنتون میرسه(میتونین مقاله بدین اینجا).  استفادهاز منطق در این وب بصورت وسیعی انجام میشه و قاعدتا منطق مرتبةاول و توسیع‌های اونو یا شبکه‌های معنایی و معادل فرمال اونها یعنی Description Logic  نقش عمده‌ای دارن و بد نیست به زبانی مثل Event Calculusاشاره کنم که به نظر من پتانسیل‌های بسیار وسیعی تو این حوزه و مدل کردندانش common sense داره.

استفادهاز منطق در وب معنایی منحصر به منطق کلاسیک و monotonicنیست و در واقع نیاز به فرمالیسم‌های nonmonotonicو Default Reasoning هست که با فرایند استنتاج انسانیهمخوان باشن و در واقع tolterance بالایی داشته باشن . از اینفرمالیسم‌های معروف میتونم به Circumscription و Default Logic یا model preference  آقای Shoham اشاره کنم که در واقع تعمیمی ازهمون Circumscription‌هستش و یا Negationas failureکه در برنامه‌سازی منطق بکار میره و بنیاد پرولوگه. فرمالیسم‌ها بصورت خامنمیتونن بکار برن چون خیلی سریع از حل سناریوهایی مثل Yale Shooting problem  و یا StolenCar Scenario در میمونن و نیاز به کلی ریزه‌کاریو دقت فرمال و ریاضی دارن(اینجاش یه کم تخصصی شد ببخشین)

 

وب معناییساختار لایه‌ای داره که یه شکل خیلی معروف داره و به کیک معروفه (خودتون بگردینمیتونین تو اینترنت پیداش کنین.)


حالا اینجا یکی از مسائل مهم و موردتحقیق اینه که شما بتونین بین آنتولوژی‌هایمختلف برا یه حوزه نگاشت‌هایی پیدا کنین که اونا رو به هم بنگارین و یکنواخت کنینکه اصطلاحا به این مسئلة خیلی مهم میگن
Ontologymapping Problem.میبینین اینجا کلی کار برا انجام دادن هست که نمونه‌ش میتونیم به استخراجآنتولوژی با استفاده از NLP از توده‌های متنی و یا گفتاریه و..... و آخر سر هم اینکه باز باید تاکید کنیم که باید بتونیم وب فعلی بدون متادادهرو با وب معنایی و قابل فهم و استنتاج برای ماشین ترکیب کنیم که میبینین چقدر بهمکانیزم‌های اینترفیسی نیاز داریم.

 

حالا درمورد آینده نمی‌تونیم صحبت زیادی بکنیم اما واضحه که زمان میبره تا وب معناییبتونه به جایگاهی که مدنظر خیلی هاست و اونم نقش محوری در وبه برسه اما خیلی ازجاها بصورت محلی و با آنتولوژی‌های محدود استفاده از اون داره بیشتر میشه و بدنیست اینجا به XML اشاره کنیم که چه جور تونست بهاین مقبولیت عام و این همه کاربرد و تسهیل امور در وب و پایگاه‌های داده و ...برسه پس به وب معنایی هم امیدوار باشین که نوعی از هوش مصنوعی وبی و اجتماعی هستشو میشه از ابزارهای سنتی هوش مصنوعی هم توش استفاده کرد.

 

این نوعنگرش به نمایش دانش وب و استفاده از استنتاج در اون به نظر من فوق‌العاده‌ست و منکلا به استفاده از روشهای فرمال در نمایش دانش علاقه دارم ، البته روشهای غیرفرمال در استنتاج هم جالبی خاص خودش رو داره.

خلاصه اینکه وب معنایی (معانی‌گرا و معانی‌نگر)  را می‌‌شود فضایی جهانی از جنسمحاسبات هوشمند ماشینی تصوّر کرد که در آن تمامی کتاب‌ها، کتاب‌خانه‌ها دانشها،دانش‌نامه‌ها و دانشگان‌ها (پایگاه‌های دانش‌ ) به صورتی معنی‌گرا و با تواناییدرک مفهومی همدیگر در کنار هم قرار خواهند گرفت و وب معنایی شیوه ای برای ایجاد یکوب است که در آن رایانه ها می توانند از شبکه ای از داده های منبع استفاده کرده،آنها را تعبیر، تحلیل و پردازش کرده و به کاربر ارائه نمایند.

 

 

Comments (6) Posted to وب معناگرا چیست؟ 10/12/2010 Edit

«قبلي   1 2 3 4 5 6 7 8 9 10

درباره من

احمد استیری

احمد استیری هستم. بنده فارغ التحصیل مقطع کارشناسی ارشد رشته مهندسی کامپیوتر - گرایش نرم افزار از دانشگاه فردوسی مشهد می باشم. دوره کارشناسی ارشد را زیر نظر جناب دکتر کاهانی در آزمایشگاه فناوری وب دانشگاه فردوسی گذرانده ام. در این مدت در حوزه های مرتبط با پردازش متن از جمله وب معنایی و به طور ویژه متن کاوی بر روی متون زبان فارسی فعالیت داشتم. طراحی و پیاده سازی ابزارهای پایه ای پردازش زبان فارسی و به خصوص طراحی نخستین ابزار پارسر زبان فارسی و ابزار ارزیابی خودکار خلاصه سازهای فارسی و همچنین تولید پیکره قرآنی فرقان از جمله کارهای من در دوره کارشناسی ارشد می باشد.
در صورت نیاز به توضیحات تکمیلی و یا هر گرونه سوال و ابهام در مورد موضوعات مطرح شده در وبلاگ با ایمیل زیر مکاتبه نمایید.

پست الکترونیکی من:
UniversityDataInfo{@}yahoo.com

آخرين مطالب بروز شده

موضوعات

پيوندها

کلی

Feeds