شناسایی موجودیت های نامدار(named entity recognition)

| | ارسال نظر | بازتاب (0) | بعدي |

با سلام.در این مطلب قصد دارم اطلاعات مختصری در ارتباط با شناخت موجودیت های نامدار را به اشتراک بگذارم.امیدوارم مورد استفاده شما قرار بگیرد.

موجوديت نامدار به کلمه و يا عبارتي گفته ميشود که براي ارجاع به نمونه هاي يک مقوله ي مشخص مانند شخص، شرکت يا موسسه، تاريخ، بيماري، گونه هاي باکتري و ساير بکار ميرود. این حجم عظیم از اطلاعات  که ساختار هم ندارند ( به این دلیل که برای مصرف انسان تولید شدند) به صورت مستقیم قابل پردازش توسط ماشین نیستند.

 

شناسایی موجودیت های نامدار عملیاتی است که طی آن اسامی مناسبی از متن استخراج شده و در گروه های از پیش تعیین شده تقسیم می شوند.

Input : Jim bought 300 shares of Acme Corp. in 2006.

Output : [Jim]Person bought 300 shares of [Acme Corp.] Organization in [2006]Time.

 

این مفهوم برای اولین بار در ششمین کنفرانس Message Understandingدر سال 1995 مطرح شد.

نيازبه شناسايي موجوديتهاي نامدار، در دنياي امروز که عصرارتباطات و اطلاعات است رو به رشد  ميباشد. شناسايي موجوديتهاي نامدار براي جستجوهاي معنادار، ترجمه ي خودکار، استخراج خودکار مفاهيم متن، کشف ارجاعات درمتن وبسياري ديگر از زمينه هاي مربوط به پردازش زبان هاي طبيعي کاربرد دارد.

اينکه سيستم چه نوع موجوديتي را تشخيص دهد و يا به بيان ديگر دسته هاي معنايي موردنظرش چه باشند، وابسته به زمينه ي کاربردي سيستم ميباشد.

شناسايي موجوديت نامداردر علم زيست شناسي ميتواند تشخيص اسامي وابسته به انواع پروتئین ها ،DNA  ها و نوع سلول ها و .... باشد

در حوزه ی پزشکی مي تواند تشخيص انواع بيماري ها، داروها، مراکز درماني و مانند اين ها و در حوزه تجارت نام شرکت ها و موسسات، تراکنش هاي مالي، بورس و غيره باشد.

همچنين اين امر مي تواند به صورت خيلي خاص مثلا فقط براي کشف اسامي شرکتهاي توليد کننده فولاد از روي متون مربوطه بکار رود.

يک دسته بندي عام در NER مورد استفاده قرار مي گيرد که در بسياري تحقيقات نيز ملاک مقايسه بوده است، دسته بندی بر اساس (شخص)(سازمان)(ناحیه) است.

 

کاربردها:

جستجوی معنایی

سیستم های پرسش و پاسخ

سیستم های خبره

کشف دانش

مدیریت دانش

نظر کاوی

بازیابی اطلاعات

 

مشکلات پایه ای:

تنوع موجودیت های نام دار

مثال :

John Smith, Mr Smith, John

ابهام در نوع موجودیت ها

مثال:

     John Smith (company vs. person)

     May (person vs. month)

     Washington (person vs. location)

     1945 (date vs. time)

ابهام در common words

مثال :

 

  May

نظرات

ارسال نظر
Info

توجه: از ارسال پيام هاي خصوصي در حالت لاگين براي نويسنده وبلاگ اجتناب نماييد.
در صورتی که در فرم ارسال نظر، نام شما توسط سیستم شناسایی شده باشد(در حالت لاگین) نظر شما بلافاصله منتشر خواهد شد.


در غیر اینصورت نظر شما پس از تایید توسط مالک وبلاگ منتشر خواهد شد.

 authimage