صفحه اصلی پرسش و پاسخ پشتیبانی تماس با ما
صفحه نخست  » فنی و مهندسی » کامپیوتر و IT  »  مقاله محاسبه ی رابطه ی معنایی بین کلمات با استفاده از مفاهیم ابری

مقاله محاسبه ی رابطه ی معنایی بین کلمات با استفاده از مفاهیم ابری

مقاله محاسبه ی رابطه ی معنایی بین کلمات با استفاده از مفاهیم ابری
چکیده:
تعیین ارتباط معنایی بین دو لغت به محاسبه ی اندازه های آماری شباهت بین دو لغت اشاره دارد. اندازه ی شباهت لغت در محدوده ی وسیعی از کاربردها مثل پردازش زبان طبیعی، پیشنهاد پرسش و پاسخ، استخراج رابطه، تصحیح املایی، مقایسه اسنادی، و روش های بازیابی اطلاعات دیگر بسیار مفید است. اگرچه روش های متعددی درگذشته برای حل این مشکل ارائه شده است. با این وجود هنوز محاسبه ی کارآمد ارتباط معنایی بین دو لغت امری چالش انگیز باقی مانده است.

در این مقاله ما تکنیک جدیدی برای محاسبه ی رابطه ی بین دو لغت ارائه خواهیم کرد. در این روش، ما به جای محاسبه ی ارتباط بین دو لغت به طور مستقیم، ابتدا محاسبه ی ارتباط بین توده های مفهوم بسط یافته آن ها را با استفاده از ضریب های ثابت وب محور مطرح کردیم. سپس اندازه های به دست آمده را برای تعیین ارتباط بین لغات اصلی به کار بردیم، روش ما به طور شدیدی برپایه ی الگوریتم استخراج مفهوم است که مفاهیم مرتبط به بحث موردنظر را استخراج می کند و یک حجم مفهوم را برای مفهوم بحث ارائه می دهد.

ما یک ارزیابی را در مورد داده های مارک تجاری میلر- چارلرز به عمل آوردیم و ضریب ثابت ۸۸۸/۰  را به دست آوردیم که نسبت به روش های هنتری موجود از ضریب ثابت بهتری برخوردار است، از این رو شواهدی را برای موثر بودن روش ما فراهم می آورد.

مقدمه:
ساخت سیستمی که بتواند به طور موثری شباهت بین دو لغت را تعیین کند، مشکل مورد توجه اکثر محققان در رشته های هوش مصنوعی و بازیابی داده ها است. یک راه حل درست برای این مشکل نه تنها تا اندازه وسیعی به کارایی هایی مثل مقایسه ی اسناد و تصحیح املایی، جستجوی اجتماعی کمک کند بلکه به صورت مهمتری مثل ویژگی های معنایی می تواند به کامپیوترها کمک کند تا قضاوت صحیحی از اطلاعات را در وب به دست آورند.

ویژگی های معنایی بین لغات مورد استفاده ی محققان بوده است تا بتوانند روابط معنایی، شباهت های معنایی و فاصله های معنایی را تعریف کنند. همانطور که در (گارسیا و منا در سال ۲۰۰۸) توصیف شده است، برای کامل تر شدن، ما در این جا تعریف خلاصه ای از این مفاهیم را ارائه کرده ایم، رابطه ی معنایی دو نوع رابطه ای را که بین دو لغت باشد (شامل هایپرنیمی، هیپونیمی ” یک لغت زیر شاخه یک معنی همانند مثلاً پدر یک هیپونیم از لغت والدین است” هم خانوادگی و مجاز که معمولاً یک مقیاس اندازه گیری آماری شباهت بین دو لغت است را دربر می گیرد.

شباهت های معنایی نتیجه ی خاص تری از روابط معنایی است که تنها روابط هم خانوادگی و هایپرنیم بین لغات را مورد توجه قرار می دهد. فاصله ی معنایی مقیاسی بر پایه ی فاصله است که در مورد روابط معنایی به کار گرفته می شود. از این رو دو لغت که رابطه بیشتری با هم داشته باشند، فاصله معنایی بین  آن ها کوچک تر خواهد بود. انسان در مقایسه با ماشین توانایی تشخیص شباهت بین دو لغت را بر اساس معلومات عقلانی خود دارد و این کار را به درستی و خوبی انجام می دهد. برای مثال به منظور تعیین این که لغات (computer, apple) رابطه نزدیک تری دارند یا دو لغت (apple, car) انسان ها ممکن است از معلومات خود استفاده کنند که apple نام یک کمپانی است که سخت افزار و نرم افزار کامپیوتر تولید می کند.

تا ثابت کند که لغت apple از نظر معنایی رابطه بیشتری به کامپیوتر دارد نسبت به لغت car. هدف ما فراهم آوردن ماشین هایی با چنین قدرتی است که با استفاده از توده های مفهومی خودکار براساس روشی خاص رابطه های معنایی را مشخص می کنند. روش ما رابطه های معنایی بین دو لغت را با محاسبه شباهت های بین توده های مفهومی آن ها بسیار دقیق تر محاسبه می کنند. ما برای تولید توده های مفهومی به طور خودکار از ابزار استخراج کننده ی مفهوم (CE) استفاده می کنیم، که اخیراً در (کول کارنی و کارگی ۲۰۰۹) مطرح کردیم. وظیفه ی استخراج کننده ی مفهوم، وارد کردن بحث لغت و تولید کردن توده ی مفهومی برای بحث در مورد لغت و همچنین استخراج مفاهیم مرتبط به آن از وب یا شبکه است.

بنابراین برای یک جفت لغت موردنظر، ما ابتدا مفاهیم مرتبط با هر لغت در یک زوج استخراج می کنیم و توده های مفهومی آن ها را بسط می دهیم، سپس رابطه ی معنایی بین دو توده ی مفهوم را محاسبه کرده و آن را برای تشخیص رابطه ی بین یک جفت لغت آغازین به کار می بریم. ادامه ی مقاله به این صورت سازماندهی شده است: بخش ۲ در مورد کارهای مرتبط بحث می کنند، بخش ۳ توصیف های کاملی از روش ما برای محاسبه ی رابطه معنایی و الگوریتم های زیرشاخه ی آن ارائه می دهد، بخش ۴ شامل نتایج عملی و ارزیابی ای از روش ما است که در مقایسه با روش های مشابه دیگر ارائه شده است. و در آخر در بخش ۵ ما نتیجه گیری تحقیق را ارائه خواهیم کرد.


تعداد صفحات : 16 | فرمت فایل : WORD

بلافاصله بعد از پرداخت لینک دانلود فعال می شود