پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management, دوره (34), شماره (4), سال (2019-5) , صفحات (1879-1904)

عنوان : ( جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش )

نویسندگان: سعیده انبایی فریمانی , حمید طباطبایی , مجتبی کفاشان کاخکی ,
فایل: Full Text

استناددهی: BibTeX | EndNote

چکیده

سازماندهی و بازیابی دانش منتشر شده در محیط وب بعنوان یکی از مهمترین کاربردهای متن‌کاوی مطرح شده است. از جمله چالش های سازماندهی مجموعه عظیمی از متون در قالب یک پیکره متنی، ابعاد زیاد ویژگی ها و خلوت بودن ماتریس ویژگی ها است. نحوه ی انتخاب ویژگی ها و نحوه ی کاهش ویژگی‌ها در این مسئله تاثیر بسزایی در بالاتر رفتن دقت سازماندهی و بازیابی متون دارد. در بسیاری از پژوهش ها به بررسی منفک این دو چالش پرداخته شده است. این پژوهش با رویکرد توجه همزمان به این دو چالش شرح یافته است. پس از تعیین متون مرتبط با 20 گروه خبری وبی و پس از فاز پیش‌پردازش متون با استفاده از الگوریتم الگو‌سازی عنوان ال‌دی‌ای ، کیسه‌ای -تجمیعی- از مفاهیم معنایی برای پیکره ی متنی مورد نظر ساخته شد. به منظور بررسی میزان تاثیر واژه‌‌های پیکره متون در هر مفهوم پنهان، به بررسی نحوه ی وزن‌دهی واژگان یک پیکره، در مفاهیم استخراج شده توسط الگوریتم ال‌دی‌ای پرداخته شد. از این رو، برای هر متن یک توزیع احتمال رخداد حول هر عنوان استخراج گردید که برای سازماندهی و بازیابی دانش موجود در آن مورد استفاده قرار گرفت. برای سازماندهی آن از الگوریتم نزدیکترین K همسایه با معیار شباهت واگرای کولبک لیبلر که میزان فاصله دو توزیع احتمال را می‌سنجد؛ استفاده شد. نتایج آزمون‌ها نشان داد که میزان صحت سازماندهی روش پیشنهادی در صورتی که از معیار وزن‌دهی واکشی اطلاعات متقابل نقطه ای و الگوریتم KL-KNN استفاده شده باشد 5/82% است. نتایج تحلیلها نشان داد که این روش دارای دقت مشابهی با روش هایی است که از فنون یادگیری عمیق استفاده می‌نمایند. افزون بر این، روش بکارگرفته در این پژوهش نشان دهنده پیچیدگی کمتری در فرایند سازماندهی و بازیابی متون مورد مطالعه پژوهش بود.

کلمات کلیدی

, متن‌کاوی, طبقه‌بندی متن , الگوسازی عنوان , بازیابی, سازماندهی دانش, واکشی اطلاعات متقابل نقطه ای
برای دانلود از شناسه و رمز عبور پرتال پویا استفاده کنید.

@article{paperid:1074214,
author = {سعیده انبایی فریمانی and حمید طباطبایی and کفاشان کاخکی, مجتبی},
title = {جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش},
journal = {پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management},
year = {2019},
volume = {34},
number = {4},
month = {May},
issn = {2251-8223},
pages = {1879--1904},
numpages = {25},
keywords = {متن‌کاوی، طبقه‌بندی متن ، الگوسازی عنوان ، بازیابی، سازماندهی دانش، واکشی اطلاعات متقابل نقطه ای},
}

[Download]

%0 Journal Article
%T جستاری بر فرایند سازماندهی و بازیابی متون وبی مبتنی بر تجمیع مفاهیم معنایی در راستای سازماندهی دانش
%A سعیده انبایی فریمانی
%A حمید طباطبایی
%A کفاشان کاخکی, مجتبی
%J پژوهشنامه پردازش و مدیریت اطلاعات- Iranian Journal of Information Processing Management
%@ 2251-8223
%D 2019

[Download]