پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management, دوره (40), شماره (4), سال (2025-9) , صفحات (159-198)

عنوان : ( فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسی‌زبانان )

نویسندگان: زهرا علیزاده معمار , عطیه کامیابی گل , شهلا شریفی , امیرمسعود ایروانی محمدابادی ,
فایل: Full Text

استناددهی: BibTeX | EndNote

چکیده

ژوهش حاضر با هدف تدوین پیکره مطابق با هم‌پوشانی واژگانی در سطوح مبتدی، میانه و پیشرفته منابع آموزش زبان فارسی به غیرفارسی‌زبانان در ایران، با رویکردی پیکره‌آگاه و روشی رایانشی انجام شد. این مطالعه در سه مرحله صورت گرفت. در مرحله اول، دادگان پژوهش، شامل 14585 واحد واژگانی از 26 منبع آموزشی در سه سطح مبتدی، میانه و پیشرفته انتخاب شدند. این منابع شامل مجموعه کتاب‌های پرفا، مینا، شیراز، پارسا، رسا، نگارا، خوانا و آموزش نوین زبان فارسی بودند. سپس، تمامی واژگان به‌صورت دستی تایپ شده، به‌صورت رایانشی پیش‌پردازش شده و برچسب اجزاء کلام دریافت کردند. هنجارسازی عمدتا با ابزار دادماتولز (اعتزادی و همکاران، 2022) انجام پذیرفت. واحدسازی، بن‌واژه‌سازی و برچسب‌دهی اجزاء کلام با استفاده از استنزا (چی و همکاران، 2020) صورت پذیرفت. در مرحله دوم، با استفاده از برنامه‌نویسی پایتون، با کمک اجتماع و اشتراک بین مجموعه‌های واژگان هر کتاب، میزان هم‌پوشانی واژگان در هر سطح و بین سطوح مختلف تعیین شد. در مرحله سوم، ماشین‌خوان کردن صورت پذیرفت بدین صورت که یک پیکره با استاندارد نشانه‌گذاری XML توسعه داده شد که برای هر واژه در سطوح مختلف دارای حرف الفبا، واحد، بن‌واژه‌، دامنه‌ هم‌پوشانی، برچسب اجزاء کلام و فراداده کتاب‌های منبع آن است. نتایج پژوهش نشان می‌دهد که با افزایش سطح زبان‌آموزی، میزان هم‌پوشانی واژگان روندی ثابت و سپس کاهشی دارد؛ به‌طوری‌که در سطوح مبتدی و میانه، در حدود ۳۶ درصد و 36.5 درصد هم‌پوشانی مشاهده شده اما در سطح پیشرفته این میزان به ۱۳ درصد کاهش یافته است. واکاوی اجزاء کلام در هر سطح نشان می‌دهد که اسم‌، فعل و صفت پرتکرارترین اجزاء کلام در تمامی سطوح هستند. همچنین، در مقایسه هم‌پوشانی واژگان بین سطوح مختلف (مبتدی و میانه، میانه و پیشرفته، مبتدی و پیشرفته) مقوله اسم بالاترین سهم را داشت. این یافته‌ها گرچه بر طراحی نظام‌مند منابع آموزشی جهت پیشرفت تدریجی مهارت‌های زبانی تأکید دارند.

کلمات کلیدی

, پیکره سطح‌بندی‌شده واژگان, آموزش فارسی به غیرفارسی‌زبانان, هم‌پوشانی واژگانی, ساخت پیکره واژگان , ابزارهای رایانشی
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1104458,
author = {علیزاده معمار, زهرا and کامیابی گل, عطیه and شریفی, شهلا and ایروانی محمدابادی, امیرمسعود},
title = {فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسی‌زبانان},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2025},
volume = {40},
number = {4},
month = {September},
issn = {2251-8223},
pages = {159--198},
numpages = {39},
keywords = {پیکره سطح‌بندی‌شده واژگان، آموزش فارسی به غیرفارسی‌زبانان، هم‌پوشانی واژگانی، ساخت پیکره واژگان ،ابزارهای رایانشی},
}

[Download]

%0 Journal Article
%T فردوس-لکس: پیکره واژگانی از منابع آموزشی فارسی برای غیرفارسی‌زبانان
%A علیزاده معمار, زهرا
%A کامیابی گل, عطیه
%A شریفی, شهلا
%A ایروانی محمدابادی, امیرمسعود
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2025

[Download]