عنوان : ( نمایه سازی استخراجی خودکار با نگاهی گذرا به مشکلات نمایه سازی در زبان فارسی )
نویسندگان: حسین مرادی مقدم بیلندی ,بر اساس تصمیم نویسنده مقاله دسترسی به متن کامل برای اعضای غیر دانشگاه ممکن نیست
چکیده
در نمایه سازی استخراجی خودکار، بعنوان یکی از شیوه های نمایه سازی، استخراج کلمات یا عبارات موجود در متن به منظور نشان دادن محتوای موضوعی متن توسط رایانه انجام می گیرد. مبنای استخراج در این شیوه، بسامد تکرار واژه ها است. شیوه نمایه سازی موتورهای کاوش نیز بر اساس این شیوه می باشد. نمایه سازی استخراجی خودکار علی رغم فوایدی که دارد، مشکلاتی را نیز بوجود آورده است که در هنگام بازیابی اطلاعات نمود پیدا می کند. اما برای حل این مشکلات می توان از راهکارهایی همچون وزن دهی به کلمات و عبارات و نیز قراردادن حد نصاب برای تکرار واژه ها و در نهایت نمایه سازی انتسابی، به عنوان مکمل نمایه سازی استخراجی استفاده کرد. نارسایی شیوه های نمایه سازی در بازیابی اطلاعات مورد نیاز کاربران منابع اینترنتی به زبان و خط فارسی، مشکلات بسیاری را برای استفاده کنندگان از وب سایت های زبان فارسی ایجاد نموده است و این نقایص، باعث عدم دسترسی کاربران به همه صفحات وب موجود به زبان و خط فارسی می شود. برای رفع این مشکل می توان از راهکارهایی همچون: اعمال یک واسط هوشمند فارسی بر روی موتورهای کاوش که باعث کاهش ریزش کاذب ناشی از شیوه های نمایه سازی وب سایت های فارسی گردد، استفاده نمود.
کلمات کلیدی
, نمایه سازی استخراجی خودکار, مشکلات نمایه سازی در زبان فارسی, رسم الخط زبان فارسی, بازیابی اطلاعات@article{paperid:1029320,
author = {مرادی مقدم بیلندی, حسین},
title = {نمایه سازی استخراجی خودکار با نگاهی گذرا به مشکلات نمایه سازی در زبان فارسی},
journal = {مطالعات کتابداری و علم اطلاعات},
year = {2009},
volume = {3},
number = {2},
month = {September},
issn = {2008-5222},
pages = {135--165},
numpages = {30},
keywords = {نمایه سازی استخراجی خودکار، مشکلات نمایه سازی در زبان فارسی، رسم الخط زبان فارسی، بازیابی اطلاعات},
}
%0 Journal Article
%T نمایه سازی استخراجی خودکار با نگاهی گذرا به مشکلات نمایه سازی در زبان فارسی
%A مرادی مقدم بیلندی, حسین
%J مطالعات کتابداری و علم اطلاعات
%@ 2008-5222
%D 2009