شناسایی استعاره در زبان فارسی: برچسب‌گذاری، تحلیل داده، و ارزیابی پایایی برای ساخت پیکره‌ی استعاره‌ی فارسی

نوع مقاله : علمی-پژوهشی

نویسنده
دانشجوی دکترای زبان‌شناسی، دانشکده‌ی ادبیات فارسی و زبان‌های خارجه، دانشگاه علامه طباطبائی، تهران، ایران
چکیده
با پیشرفت چشم‌گیری که در هوش مصنوعی و پردازش زبان طبیعی رخ داده است، نیاز به درک بیان‌های غیر تحت اللفظی توسط ماشین بیش از گذشته حس می‌شود. استعاره یکی از این بیان‌هاست که ماشین همواره در درک آن به مشکل برمی‌خورد. برای بهبود این فرایند باید دست به ساخت پیکره‌ی استعاره زد تا با آن بتوان استعاره را به ماشین آموخت. روال شناسایی استعاره‌ی دانشگاه آزاد آمستردام (MIPVU) یکی از روش‌های شناسایی و برچسب‌گذاری استعاره است. موضوع پژوهش حاضر ارزیابی این روال برای ساخت پیکره‌ی استعاره‌ی فارسی است. برای این منظور، پیکره‌ای از متون خبری و دانشگاهی گردآوری و بر اساس روال گفته‌شده توسط کارشناسان برچسب‌گذاری شد. سپس پایایی پژوهش با معیارهای آماری ضریب کاپا و Q کوکران حساب شد. نتایج حاصل از بررسی پیکره نشان می‌دهد که روال شناسایی استعاره توانسته است با پایایی مناسب (۰.۹۶۴=κ) استعاره‌های فارسی را شناسایی و برچسب‌گذاری کند و در نتیجه، روش مناسبی برای ساخت پیکره‌ی استعاره است.
کلیدواژه‌ها

عنوان مقاله English

Metaphor Identification in Persian: Annotation, Data Analysis, and Reliability Assessment for Compiling a Metaphor Corpus for Persian

نویسنده English

Mohammad Saeid Miri
Department of Linguistics,, Faculty of Persian Literature and Foreign Languages, Allameh Tabataba'i University, Tehran, Iran
چکیده English

This is becoming increasingly necessary for machines to be able to comprehend figurative language as artificial intelligence and natural language processing continue to advance. Metaphors are one of the figurative language forms that are difficult for machines to grasp. Developing metaphor corpora, which will enable machines to be trained using them, is the initial stage in the process of enhancing metaphor comprehension. The Metaphor Identification Procedure Vrije Universiteit, known as MIPVU, is a method that can be used to annotate metaphors. In the present study, MIPVU is evaluated in order to compile a Persian metaphor corpus. A collection of scholarly papers and news articles was gathered and annotated. The reliability of the procedure was subsequently evaluated using the Kappa coefficient and Cochran's Q. According to the results of the investigation, MIPVU can annotate Persian metaphors precisely and reliably (κ=0.964). Consequently, this procedure offers a reliable method for compiling a metaphor corpus.

کلیدواژه‌ها English

metaphor
metaphor corpus
reliability
semantic annotation
انوری، حسن. (۱۳۸۱). فرهنگ بزرگ سخن. تهران: سخن.
خانزاده، معصومه. (۱۳۹۲). بررسی چندمعنایی برخی حروف اضافۀ مکانی در زبان فارسی با رویکرد معنی‌شناسی شناختی [پایان‌نامۀ کارشناسی ارشد]. دانشگاه سمنان.
رضویان، حسین.، و خانزاده، م. (۱۳۹۳). «چندمعنایی حرف اضافة ”به“ در زبان فارسی با رویکرد معنی‌شناسی شناختی». مطالعات زبان‌ها و گویش‌های غرب ایران، ۲(۷)، ۵۷-۷۹.
عاصی، سید مصطفی. (۱۳۹۸). فرهنگ زبان‌آموز پیشرفتۀ فارسی. تهران: سمت.
عاصی، سید مصطفی، بختیاری، فرزانه، گلفام، ارسلان، و نعمت زاده، شهین. (۱۴۰۱). «کاربرد شیوه نامه میپفو برای شناسائی استعاره‌های زبان فارسی با تکیه بر داده‌هایی از گفتمان آموزشی». زبان پژوهی، ۱۴(۴۲) ۱۷۳۲۰۱.
علایی ابوذر، الهام، پاک‌نیت، نصرالله، حجت‌پناه، علی‌اصغر، زالی، مجتبی، و آقالویی آغمیونی، محمدهادی. (۱۴۰۰). «معرفی یک پیکرة متنی تخصصی: پیکرة پژوهش‌نامه». پژوهش‌های زبان‌شناسی تطبیقی، ۱۱(۲۲)، ۲۷۱-۲۸۹.
گلفام، ارسلان، عاصی، سید مصطفی، آقاگل‌زاده، فردوس، و یوسفی راد، فاطمه. (۱۳۸۸). «بررسیِ حرفِ اضافة (از) در چارچوب معناشناسیِ شناختی و مقایسة آن با رویکردِ سنتی». زبان و زبان‌شناسی، ۵(۱۰)، ۶۹-۸۰.
مختاری، شهره، و رضایی، حدائق. (۱۳۹۲). «بررسی شناختی شبکه معنایی حرف اضافه با در زبان فارسی». مجلۀ زبانشناسی و گویش‌های خراسان دانشگاه فردوسی مشهد، ۵(۲)، ۷۳-۹۴.
میرزائی، آزاده. (۱۳۹۸). «کارکردهای معنایی و دستوریِ حرف اضافة «از» در زبان فارسی». زبان و زبان‌شناسی، ۱۵(۲۹)، ۲۱-۳۸.
میری، محمدسعید. (۱۴۰۲). «ملاک‌های برچسب‌گذاری استعاره: گامی به‌سوی ساخت پیکرۀ استعاره». زبان پژوهی، ۱۴(۴۷)، ۲۶۳-۲۹۳.
 
Aleahmad, Abolfazl, Hadi Amiri, Ehsan Darrudi, and Farhad Oroumchian (2009). Hamshahri: A standard Persian text collection. Knowledge-Based Systems, 22, 382–387.
Antloga, Špela (2020). “Metaphor Corpus KOMET 1.0.” Slovenian language resource repository CLARIN.SI. http://hdl.handle.net/11356/1293
Aristotle. (1995). Poetics. Trans. Stephen Halliwell. Harvard University Press. (Original work published 330 B.C.E)
Badryzlova, Yulia, Natalia Shekhtman, Yekaterina Isaeva, and Ruslan Kerimov (2013). “Annotating a Russian corpus of conceptual metaphor: A bottom-up approach.” In Proceedings of the First Workshop on Metaphor in NLP (pp. 77–86). Association for Computational Linguistics.
Bort-Mir, Lorena (2019). Developing, applying and testing FILMIP: The filmic metaphor identification procedure [Ph.D. Thesis, Universitat Jaume I]. http://rgdoi.net/10.13140/RG.2.2.18345.03688
Cameron, Lynne Joan & Graham Low (Eds.) (1999). Researching and Applying Metaphor. Cambridge University Press.
Dorst, Aletta G. (2011). Metaphor in Fiction: Language, Thought and Communication [PhD-Thesis - Research and graduation internal, Vrije Universiteit Amsterdam]. Uitgeverij BoxPress. https://hdl.handle.net/1871/19629
Dorst, Aletta G., W. Gudrun Reijnierse, and Gemma Venhuizen (2013). “One small step for MIP towards automated metaphor identification?: Formulating general rules to determine basic meanings in large-scale approaches to metaphor”. Metaphor and the Social World, 3(1), 77–99.
Everitt, Brian & Anders Skrondal (2010). The Cambridge dictionary of statistics (4th ed). Cambridge, UK; New York: Cambridge University Press.
IBM Corp. (2019). IBM SPSS Statistics for Windows (26.0) [Computer software]. IBM Corp.
Kaal, Anna. (2012). Metaphor in conversation [PhD-Thesis - Research and graduation internal, Vrije Universiteit Amsterdam]. BOXPress. https://hdl.handle.net/1871/32987
Kövecses, Zoltán (2016). “Conceptual metaphor theory.” In Elena Semino & Zsófia Demjén (Eds.), The Routledge Handbook of Metaphor and Language. Routledge.
Krennmayr, Tina (2011). Metaphor in newspapers [PhD-Thesis - Research and graduation internal, Vrije Universiteit Amsterdam]. LOT. https://hdl.handle.net/1871/19774
Krennmayr, Tina & Gerard J. Steen (2017). “VU Amsterdam Metaphor Corpus.” In Nancy Ide & James Pustejovsky (Eds.), Handbook of Linguistic Annotation (pp. 1053–1071). Springer Netherlands.
Lakoff, George. (1993). “The contemporary theory of metaphor”. In Andrew Ortony (Ed.), Metaphor and Thought (2nd ed., pp. 202–251). Cambridge: Cambridge University Press.
Lakoff, George & Mark Johnson (1980). Metaphors we live by. University of Chicago Press.
Landis, J. Richard & Gary J. Koch (1977). “The Measurement of Observer Agreement for Categorical Data.” Biometrics, 33(1), 159.
Lu, Xiaofei & Ben Pin-Yun Wang (2017). “Towards a metaphor-annotated corpus of Mandarin Chinese.” Language Resources and Evaluation, 51(3), 663–694.
Nacey, Susan, Aletta G. Dorst, Tina Krennmayr, and W. Gudrun Reijnierse (Eds.) (2019). Metaphor Identification in Multiple Languages: MIPVU around the world (Vol. 22). John Benjamins Publishing Company.
Ortony, Andrew (1993). “Metaphor, language, and thought”. In Andrew Ortony (Ed.), Metaphor and Thought (2nd ed., pp. 1–16). Cambridge University Press; Cambridge Core.
Pragglejaz Group (2007). “MIP: A method for identifying metaphorically used words in discourse.” Metaphor and Symbol, 22(1), 1–39.
Shamsfard, Mehrnoush, Akbar Hesabi, Hakimeh Fadaei, Niloofar Mansoory, Ali Famian, and Somayeh Bagherbeigi, Elham Fekri, Maliheh Monshizadeh & Seyed Mostafa Assi (2010). “Semi automatic development of FarsNet: The Persian wordnet.” Proceedings of 5th Global WordNet Conference (GWA2010).
Šorm, Ester, and Gerard J. Steen (2018). “Chapter 3. VISMIP: Towards a method for visual metaphor identification.” In Gerard J. Steen (Ed.), Visual metaphor: Structure and process (pp. 47–88). John Benjamins Publishing Company.
Steen, Gerard J. (2007). Finding metaphor in grammar and usage: A methodological analysis of theory and research. John Benjamins Pub. Co.
_______ (2011). “The contemporary theory of metaphor—Now new and improved!” Review of Cognitive Linguistics, 9(1), 26–64.
_______  (2016). “Identifying metaphors in language.” In Elena Semino & Zsófia Demjén (Eds.), The Routledge Handbook of Metaphor and Language. Routledge.
Steen, Gerard J., Aletta G. Dorst, J. Berenike Herrmann, Anna A. Kaal, and Tina Krennmayr (2010). A method for linguistic metaphor identification: From MIP to MIPVU. John Benjamins Publishing Company.