شناسایی استعاره در زبان فارسی: برچسب‌گذاری، تحلیل داده، و ارزیابی پایایی برای ساخت پیکره‌ی استعاره‌ی فارسی

نوع مقاله : علمی-پژوهشی

نویسنده

گروه زبان‌شناسی، دانشکده‌ی ادبیات فارسی و زبان‌های خارجه، دانشگاه علامه طباطبائی، تهران، ایران

چکیده

با پیشرفت چشم‌گیری که در هوش مصنوعی و پردازش زبان طبیعی رخ داده است، نیاز به درک بیان‌های غیر تحت اللفظی توسط ماشین بیش از گذشته حس می‌شود. استعاره یکی از این بیان‌هاست که ماشین همواره در درک آن به مشکل برمی‌خورد. برای بهبود این فرایند باید دست به ساخت پیکره‌ی استعاره زد تا با آن بتوان استعاره را به ماشین آموخت. روال شناسایی استعاره‌ی دانشگاه آزاد آمستردام (MIPVU) یکی از روش‌های شناسایی و برچسب‌گذاری استعاره است. موضوع پژوهش حاضر ارزیابی این روال برای ساخت پیکره‌ی استعاره‌ی فارسی است. برای این منظور، پیکره‌ای از متون خبری و دانشگاهی گردآوری و بر اساس روال گفته‌شده توسط کارشناسان برچسب‌گذاری شد. سپس پایایی پژوهش با معیارهای آماری ضریب کاپا و Q کوکران حساب شد. نتایج حاصل از بررسی پیکره نشان می‌دهد که روال شناسایی استعاره توانسته است با پایایی مناسب (۰.۹۶۴=κ) استعاره‌های فارسی را شناسایی و برچسب‌گذاری کند و در نتیجه، روش مناسبی برای ساخت پیکره‌ی استعاره است.

کلیدواژه‌ها


عنوان مقاله [English]

Metaphor Identification in Persian: Annotation, Data Analysis, and Reliability Assessment for Compiling a Metaphor Corpus for Persian

نویسنده [English]

  • Mohammad Saeid Miri
Department of Linguistics,, Faculty of Persian Literature and Foreign Languages, Allameh Tabataba'i University, Tehran, Iran
چکیده [English]

This is becoming increasingly necessary for machines to be able to comprehend figurative language as artificial intelligence and natural language processing continue to advance. Metaphors are one of the figurative language forms that are difficult for machines to grasp. Developing metaphor corpora, which will enable machines to be trained using them, is the initial stage in the process of enhancing metaphor comprehension. The Metaphor Identification Procedure Vrije Universiteit, known as MIPVU, is a method that can be used to annotate metaphors. In the present study, MIPVU is evaluated in order to compile a Persian metaphor corpus. A collection of scholarly papers and news articles was gathered and annotated. The reliability of the procedure was subsequently evaluated using the Kappa coefficient and Cochran's Q. According to the results of the investigation, MIPVU can annotate Persian metaphors precisely and reliably (κ=0.964). Consequently, this procedure offers a reliable method for compiling a metaphor corpus.

کلیدواژه‌ها [English]

  • metaphor
  • metaphor corpus
  • reliability
  • semantic annotation