پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management, دوره (37), شماره (4), سال (2022-9) , صفحات (1245-1268)

عنوان : ( تجزیه ی متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان )

نویسندگان: نصراله پاک نیت , جلال الدین نصیری ,
فایل: Full Text

استناددهی: BibTeX | EndNote

چکیده

یک متن استنادی را می‌توان به‌عنوان مجموعه‌ای از مؤلفه‌ها مانند نام نویسندگان، عنوان، محل نشر، سال نشر، شماره صفحات و ... در نظر گرفت. در حالی که تجزیه متون استنادی موجود در انتهای یک مدرک علمی توسط کاربر انسانی به‌راحتی انجام‌پذیر است، تنوع موجود در شیوه‌های استناددهی در کنار اشتباهات رخ‌داده توسط نویسندگان در نگارش این متون، خودکارسازی انجام این عملیات را دشوار نموده است. روش‌های زیادی برای خودکارسازی تجزیه متون استنادی ارائه شده، اما این روش‌ها وابسته به زبان بوده و امکان به‌کارگیری یک روش ارائه‌ شده برای یک زبان در زبانی دیگر منجر به نتایجی اشتباه می‌شود. تحقیقات صورت‌گرفته بیانگر آن است که تاکنون هیچ روشی برای خودکارسازی تجزیه متون استنادی در زبان فارسی ارائه نشده است. با توجه به این مهم و نقش گسترده این مسئله در ساخت خودکار شبکه‌های استنادی مدارک علمی و فرایندهای بازیابی اطلاعات، در این مقاله به این مسئله پرداخته شده و با استفاده از روش یادگیری ماشین بُردار پشتیبان به‌عنوان یک دسته‌بند چنددسته‌ای، یک روش هوشمند برای مسئله تجزیه متون استنادی در زبان فارسی ارائه شده است. با توجه به اهمیت انتخاب ویژگی‌های مناسب برای استفاده در دسته‌بند ماشین بُردار پشتیبان، در این پژوهش این مهم با توجه به ویژگی‌های استفاده‌شده در زبان انگلیسی و ویژگی‌های زبان فارسی و ارجاع‌دهی در این زبان انجام شده است. نتایج پیاده‌سازی و آزمایش روش پیشنهادی با استفاده از مجموعه داده‌ای ایجادشده در این پژوهش نشانگر مقدار 95/0 برای پارامترهای دقت، فراخوانی و اف-1 است.

کلمات کلیدی

تجزیه متون استنادی دسته‌بندی دسته‌بندی چند دسته‌ای ماشین بردار پشتیبان ساخت خودکار شبکه‌های استنادی
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1100425,
author = {نصراله پاک نیت and نصیری, جلال الدین },
title = {تجزیه ی متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2022},
volume = {37},
number = {4},
month = {September},
issn = {2251-8223},
pages = {1245--1268},
numpages = {23},
keywords = {تجزیه متون استنادی دسته‌بندی دسته‌بندی چند دسته‌ای ماشین بردار پشتیبان ساخت خودکار شبکه‌های استنادی},
}

[Download]

%0 Journal Article
%T تجزیه ی متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان
%A نصراله پاک نیت
%A نصیری, جلال الدین
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2022

[Download]