بررسی افعال سبک در دو پیکرة تخصصی فارسی

نوع مقاله : علمی-پژوهشی

نویسنده

گروه پژوهشی زبان شناسی رایانشی - پژوهشکده علوم اطلاعات - پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) - تهران - ایران

چکیده

یکی از مقوله‌هایی که در چارچوب زبان‌شناسی پیکره‌ای مورد بررسی قرار گرفته، فعل مرکب است. افعال مرکب از دو بخش «جزء غیرفعلی» و «فعل سبک» تشکیل شده‌اند. در این پژوهش فراوانی افعال سبک از دو پیکرة تخصصی «پیکرة پژوهش‌نامه» و «پکا» (پیکرة کتاب‌های ایرانداک) استخراج شده است و فراوانی سه فعل سبک اول در این دو پیکره با فراوانی افعال سبک در یک پیکرة عمومی، یعنی «پیکرة متنی فارسی» مقایسه شده است. در این دو پیکرة تخصصی، که در مجموع نزدیک به هشت میلیون واژه در این پیکره‌ها موجود است، از میان افعال سبک «زدن»، «داشتن»، «کردن»، «سپردن»، «گرفتن»، «آمدن»، «دادن»، «افتادن»، «خوردن»، «کشیدن»، «آوردن»، «نمودن»، «رفتن»، «بردن» و «انداختن»، دو فعل سبک «کردن» با فراوانی 5848 و فعل «دادن» با فراوانی 5037، در رتبه اول و دوم از نظر فراوانی قرار دارند؛ فروانی این دو فعل سبک در پیکرة عمومی نیز بالا است و در رتبه‌های نخست قرار دارند. فعل سبک «گرفتن» با فراوانی 3246 در پیکره‌های تخصصی در رتبه سوم قرار دارد. حال آنکه در پیکرة عمومی، فعل سبک «گرفتن» ، از نظر فراوانی بعد از افعال سبک «کردن»، «دادن»، «داشتن» و «نمودن» قرار دارد. پس از استخراج فراوانی افعال سبک و بررسی آن‌ها، افعال مرکبی که با این سه فعل سبک (کردن، دادن و گرفتن) ساخته می‌شوند از نظر احتمال فاصله میان جزء غیرفعلی و فعل سبک در بافت تعریف‌شده (پنج نگاشت قبل و پنج نگاشت بعد از فعل سبک موردنظر) نیز مورد بررسی کلی قرار گرفتند. بررسی رفتار افعال مرکب پربسامد در پیکره‌های تخصصی نشان داد نویسندگان متون تخصصی، عمدتاً پژوهشگران، دانشجویان و استادان، کمتر تمایل دارند بین جزء غیرفعلی و فعل سبک فاصله بیاندازند و بنابراین، در بیشتر افعال مرکب جزء غیرفعلی و فعل سبک در کنار هم قرار می‌گیرند و مقوله و گروه نحوی میان آن‌ها قرار نمی‌گیرد. در حالیکه در متون عمومی احتمال اینکه نویسندگان گروه/ گروه‌های نحوی و مقولات گوناگون میان جزء غیرفعلی و فعلی قرار دهند بیشتر از متون تخصصی است.

کلیدواژه‌ها


عنوان مقاله [English]

Studying light verbs in two Persian specialized corpora

نویسنده [English]

  • Elham Alayiaboozar
Computational linguistic research group. Information Science Research Department. Iranian Research Institute for Information Science and Technology (IranDoc). Tehran.Iran.
چکیده [English]

One of the topics examined within the framework of corpus linguistics is the compound verb. Compound verbs consist of two parts: a "non-verbal element" and a "light verb." In this study, the frequency of light verbs was extracted from two specialized corpora, " PAZHUHESHNAME" and "PEKA" (the corpus of IranDoc books), and the frequency of the top three light verbs in these two corpora was compared with their frequency in a general corpus, namely the "Persian Text Corpus."
In these two specialized corpora, which together contain nearly eight million words, the light verbs "zadan" (to hit), "dashtan" (to have), "kardan" (to do), "sepordan" (to give), "gereftan" (to take), "amadan" (to come), "dadan" (to give), "oftadan" (to fall), "khordan" (to eat), "keshidan" (to pull), "avardan" (to bring), "nemoudan" (to do), "raftan" (to go), "bordan" (to carry), and "andakhtan" (to throw) were analyzed. Among these, the light verbs "kardan" with a frequency of 5848 and "dadan" with a frequency of 5037 ranked first and second in terms of frequency. The frequency of these two light verbs is also high in the general corpus, where they rank among the top. The light verb "gereftan" with a frequency of 3246 ranks third in the specialized corpora. However, in the general corpus, the light verb "gereftan" ranks after the light verbs "kardan," "dadan," "dashtan," and "namoudan" in terms of frequency.
After extracting and examining the frequency of light verbs, compound verbs formed with these three light verbs (kardan, dadan, and gereftan) were also analyzed in terms of the likelihood of a gap between the non-verbal element and the light verb within a defined context (five tokens before and five tokens after the target light verb). The analysis of the behavior of high-frequency compound verbs in specialized corpora showed that authors of specialized texts, mainly researchers, students, and professors, are less inclined to place a gap between the non-verbal element and the light verb. Therefore, in most compound verbs, the non-verbal element and the light verb appear together without any syntactic category or group intervening. In contrast, in general texts, the likelihood of authors inserting syntactic groups or various categories between the non-verbal element and the light verb is higher than in specialized texts

کلیدواژه‌ها [English]

  • compound verb
  • corpus
  • light verb
  • specialized corpus
  • frequency of light verbs