عنوان : ( فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسیزبانان )
نویسندگان: زهرا علیزاده معمار , عطیه کامیابی گل , شهلا شریفی , امیرمسعود ایروانی محمدابادی ,
چکیده
ژوهش حاضر با هدف تدوین پیکره مطابق با همپوشانی واژگانی در سطوح مبتدی، میانه و پیشرفته منابع آموزش زبان فارسی به غیرفارسیزبانان در ایران، با رویکردی پیکرهآگاه و روشی رایانشی انجام شد. این مطالعه در سه مرحله صورت گرفت. در مرحله اول، دادگان پژوهش، شامل 14585 واحد واژگانی از 26 منبع آموزشی در سه سطح مبتدی، میانه و پیشرفته انتخاب شدند. این منابع شامل مجموعه کتابهای پرفا، مینا، شیراز، پارسا، رسا، نگارا، خوانا و آموزش نوین زبان فارسی بودند. سپس، تمامی واژگان بهصورت دستی تایپ شده، بهصورت رایانشی پیشپردازش شده و برچسب اجزاء کلام دریافت کردند. هنجارسازی عمدتا با ابزار دادماتولز (اعتزادی و همکاران، 2022) انجام پذیرفت. واحدسازی، بنواژهسازی و برچسبدهی اجزاء کلام با استفاده از استنزا (چی و همکاران، 2020) صورت پذیرفت. در مرحله دوم، با استفاده از برنامهنویسی پایتون، با کمک اجتماع و اشتراک بین مجموعههای واژگان هر کتاب، میزان همپوشانی واژگان در هر سطح و بین سطوح مختلف تعیین شد. در مرحله سوم، ماشینخوان کردن صورت پذیرفت بدین صورت که یک پیکره با استاندارد نشانهگذاری XML توسعه داده شد که برای هر واژه در سطوح مختلف دارای حرف الفبا، واحد، بنواژه، دامنه همپوشانی، برچسب اجزاء کلام و فراداده کتابهای منبع آن است. نتایج پژوهش نشان میدهد که با افزایش سطح زبانآموزی، میزان همپوشانی واژگان روندی ثابت و سپس کاهشی دارد؛ بهطوریکه در سطوح مبتدی و میانه، در حدود ۳۶ درصد و 36.5 درصد همپوشانی مشاهده شده اما در سطح پیشرفته این میزان به ۱۳ درصد کاهش یافته است. واکاوی اجزاء کلام در هر سطح نشان میدهد که اسم، فعل و صفت پرتکرارترین اجزاء کلام در تمامی سطوح هستند. همچنین، در مقایسه همپوشانی واژگان بین سطوح مختلف (مبتدی و میانه، میانه و پیشرفته، مبتدی و پیشرفته) مقوله اسم بالاترین سهم را داشت. این یافتهها گرچه بر طراحی نظاممند منابع آموزشی جهت پیشرفت تدریجی مهارتهای زبانی تأکید دارند.
کلمات کلیدی
, پیکره سطحبندیشده واژگان, آموزش فارسی به غیرفارسیزبانان, همپوشانی واژگانی, ساخت پیکره واژگان , ابزارهای رایانشی@article{paperid:1104458,
author = {علیزاده معمار, زهرا and کامیابی گل, عطیه and شریفی, شهلا and ایروانی محمدابادی, امیرمسعود},
title = {فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسیزبانان},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2025},
volume = {40},
number = {4},
month = {September},
issn = {2251-8223},
pages = {159--198},
numpages = {39},
keywords = {پیکره سطحبندیشده واژگان، آموزش فارسی به غیرفارسیزبانان، همپوشانی واژگانی، ساخت پیکره واژگان ،ابزارهای رایانشی},
}
%0 Journal Article
%T فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسیزبانان
%A علیزاده معمار, زهرا
%A کامیابی گل, عطیه
%A شریفی, شهلا
%A ایروانی محمدابادی, امیرمسعود
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2025