TY - JOUR ID - 8089 TI - بررسی تکوین مباحث مقالات فارسی‌زبان و زبان‌شناسی با کمک رایانه JO - زبان و زبان‌شناسی JA - LSI LA - fa SN - 23223847 AU - قیومی, مسعود AD - پژوهشگاه علوم انسانی و مطالعات فرهنگی Y1 - 2021 PY - 2021 VL - 17 IS - 33 SP - 99 EP - 130 KW - تکوین KW - پردازش زبان طبیعی KW - مدل‌سازی موضوع KW - زبان‌شناسی پیکره‌ای KW - مقاله علمی KW - تحلیل محتوایی DO - 10.30465/lsi.2021.8089 N2 - از زمان پیدایش اینترنت تاکنون، با حجم زیادی از داده‌هایی مواجه هستیم که در این بستر قرار گرفته است. این امر سبب شده است تا شیوۀ مطالعۀ داده‌ها و بررسی سیر تحول آنها از روش دستی به خودکار تغییر کند. هدف از انجام این پژوهش، استخراج موضوعات مطرح‌شده در مقالات رشتۀ زبان‌شناسی و روندشناسی تحول موضوعات در طول زمان با کمک الگوریتم مدل‌سازی موضوعی است. برای این هدف از الگوریتم تخصیص پنهان دیریشله استفاده می‌شود. پیکرۀ این پژوهش ازطریق خزش به‌دست آمده و پس‌از پالایش و پیش‌پردازش داده‌ها، تعداد ۵، ۱۰ و ۱۵ موضوع از مقالات استخراج شده و براساس واژه‌های هر موضوع به‌صورت دستی برچسب‌گذاری شده است. توزیع مقالات از سال ۱۳۰۶ تا ۱۳۹۹ سبب شد تا این مدت به ۵ مقطع زمانی تقسیم و موضوعات مربوط به هر برش زمانی پس‌از فرایند برچسب‌گذاری مشخص شود. رشد و افول موضوعات استخراج‌شده از مقالات در پردازش‌های با تعداد ۵، ۱۰ و ۱۵ موضوع در بازه‌های زمانی قابل مشاهده است. دستاورد کاربردی این پژوهش سیاست‌گذاری در حوزۀ علم است که علاوه‌بر مطرح‌کردن یک روش‌شناسی فناورانۀ کاربردی در پژوهش، می‌توان موضوعات داغ میان پژوهشگران یک رشتۀ علمی را مشخص کرد و خلأهای موضوعات پژوهشی را یافت و بر متنوع‌سازی و متوازن‌سازی موضوعات پژوهشی اهتمام ورزید. UR - https://lsi-linguistics.ihcs.ac.ir/article_8089.html L1 - https://lsi-linguistics.ihcs.ac.ir/article_8089_f7c50bfb93fd12a1a5b3f5404ccc1ed2.pdf ER -