عنوان : ( جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش )
نویسندگان: سعیده انبایی فریمانی , حمید طباطبایی , مجتبی کفاشان کاخکی ,چکیده
سازماندهی و بازیابی دانش منتشر شده در محیط وب بعنوان یکی از مهمترین کاربردهای متنکاوی مطرح شده است. از جمله چالش های سازماندهی مجموعه عظیمی از متون در قالب یک پیکره متنی، ابعاد زیاد ویژگی ها و خلوت بودن ماتریس ویژگی ها است. نحوه ی انتخاب ویژگی ها و نحوه ی کاهش ویژگیها در این مسئله تاثیر بسزایی در بالاتر رفتن دقت سازماندهی و بازیابی متون دارد. در بسیاری از پژوهش ها به بررسی منفک این دو چالش پرداخته شده است. این پژوهش با رویکرد توجه همزمان به این دو چالش شرح یافته است. پس از تعیین متون مرتبط با 20 گروه خبری وبی و پس از فاز پیشپردازش متون با استفاده از الگوریتم الگوسازی عنوان الدیای ، کیسهای -تجمیعی- از مفاهیم معنایی برای پیکره ی متنی مورد نظر ساخته شد. به منظور بررسی میزان تاثیر واژههای پیکره متون در هر مفهوم پنهان، به بررسی نحوه ی وزندهی واژگان یک پیکره، در مفاهیم استخراج شده توسط الگوریتم الدیای پرداخته شد. از این رو، برای هر متن یک توزیع احتمال رخداد حول هر عنوان استخراج گردید که برای سازماندهی و بازیابی دانش موجود در آن مورد استفاده قرار گرفت. برای سازماندهی آن از الگوریتم نزدیکترین K همسایه با معیار شباهت واگرای کولبک لیبلر که میزان فاصله دو توزیع احتمال را میسنجد؛ استفاده شد. نتایج آزمونها نشان داد که میزان صحت سازماندهی روش پیشنهادی در صورتی که از معیار وزندهی واکشی اطلاعات متقابل نقطه ای و الگوریتم KL-KNN استفاده شده باشد 5/82% است. نتایج تحلیلها نشان داد که این روش دارای دقت مشابهی با روش هایی است که از فنون یادگیری عمیق استفاده مینمایند. افزون بر این، روش بکارگرفته در این پژوهش نشان دهنده پیچیدگی کمتری در فرایند سازماندهی و بازیابی متون مورد مطالعه پژوهش بود.
کلمات کلیدی
, متنکاوی, طبقهبندی متن , الگوسازی عنوان , بازیابی, سازماندهی دانش, واکشی اطلاعات متقابل نقطه ای@article{paperid:1074214,
author = {سعیده انبایی فریمانی and حمید طباطبایی and کفاشان کاخکی, مجتبی},
title = {جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2019},
volume = {34},
number = {4},
month = {May},
issn = {2251-8223},
pages = {1879--1904},
numpages = {25},
keywords = {متنکاوی، طبقهبندی متن ، الگوسازی عنوان ، بازیابی، سازماندهی دانش، واکشی اطلاعات متقابل نقطه ای},
}
%0 Journal Article
%T جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش
%A سعیده انبایی فریمانی
%A حمید طباطبایی
%A کفاشان کاخکی, مجتبی
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2019