عنوان : ( تجزیة متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان )
نویسندگان: نصراله پاک نیت , جلال الدین نصیری ,چکیده
یک متن استنادی را میتوان بهعنوان مجموعهای از مؤلفهها مانند نام نویسندگان، عنوان، محل نشر، سال نشر، شماره صفحات و ... در نظر گرفت. در حالی که تجزیه متون استنادی موجود در انتهای یک مدرک علمی توسط کاربر انسانی بهراحتی انجامپذیر است، تنوع موجود در شیوههای استناددهی در کنار اشتباهات رخداده توسط نویسندگان در نگارش این متون، خودکارسازی انجام این عملیات را دشوار نموده است. روشهای زیادی برای خودکارسازی تجزیه متون استنادی ارائه شده، اما این روشها وابسته به زبان بوده و امکان بهکارگیری یک روش ارائه شده برای یک زبان در زبانی دیگر منجر به نتایجی اشتباه میشود. تحقیقات صورتگرفته بیانگر آن است که تاکنون هیچ روشی برای خودکارسازی تجزیه متون استنادی در زبان فارسی ارائه نشده است. با توجه به این مهم و نقش گسترده این مسئله در ساخت خودکار شبکههای استنادی مدارک علمی و فرایندهای بازیابی اطلاعات، در این مقاله به این مسئله پرداخته شده و با استفاده از روش یادگیری ماشین بُردار پشتیبان بهعنوان یک دستهبند چنددستهای، یک روش هوشمند برای مسئله تجزیه متون استنادی در زبان فارسی ارائه شده است. با توجه به اهمیت انتخاب ویژگیهای مناسب برای استفاده در دستهبند ماشین بُردار پشتیبان، در این پژوهش این مهم با توجه به ویژگیهای استفادهشده در زبان انگلیسی و ویژگیهای زبان فارسی و ارجاعدهی در این زبان انجام شده است. نتایج پیادهسازی و آزمایش روش پیشنهادی با استفاده از مجموعه دادهای ایجادشده در این پژوهش نشانگر مقدار 95/0 برای پارامترهای دقت، فراخوانی و اف-1 است.
کلمات کلیدی
تجزیه متون استنادی دستهبندی دستهبندی چند دستهای ماشین بردار پشتیبان ساخت خودکار شبکههای استنادی@article{paperid:1100425,
author = {نصراله پاک نیت and نصیری, جلال الدین },
title = {تجزیة متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2022},
volume = {37},
number = {4},
month = {September},
issn = {2251-8223},
pages = {1245--1268},
numpages = {23},
keywords = {تجزیه متون استنادی دستهبندی دستهبندی چند دستهای ماشین بردار پشتیبان ساخت خودکار شبکههای استنادی},
}
%0 Journal Article
%T تجزیة متون استنادی در زبان فارسی با استفاده از ماشین بُردار پشتیبان
%A نصراله پاک نیت
%A نصیری, جلال الدین
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2022