عنوان : ( کاربرد نمونه گیری مجموعه-رتبه دار در تحلیل داده های بزرگ )
نویسندگان: محمدحسین زرین کلاه , هادی جباری نوقابی , محمد مهدی صابر ,
چکیده
یکی از اساسی ترین چالش ها در مدلسازی و تحلیل داده، برآورد دقیق پارامترهای مدل است. در تحلیل داده های بزرگ، به دلیل حجم بالا و پیچیدگی، پردازش کل مجموعه داده ها از نظر محاسباتی و زمانی غیرعملی یا بسیار پرهزینه است. در چنین شرایطی، استفاده از نمونه های معرف به عنوان جایگزینی برای کل داده ها، علاوه بر کاهش هزینه های محاسباتی و افزایش سرعت آموزش مدل ها، به مدیریت محدودیت های حافظه و منابع نیز کمک می کند. در این مقاله، از روش نمونه گیری مجموعه-رتبه دار میانه ای Median Ranked-Set Sampling برای انتخاب نمونه های نماینده و برآورد پارامترهای مدل استفاده شده است. برای برآورد پارامترهای مدل در داده های درآمدی مرکز آمار ایران، روش های نمونه گیری تصادفی ساده Simple Random Sampling و نمونه گیری مجموعه-رتبه دار میانه ای MRSS به کار گرفته شد. نتایج نشان داد که در مواردی که داده ها نامتقارن هستند، استفاده از MRSS منجر به برآوردهایی با دقت بیشتر نسبت به SRS می شود.
کلمات کلیدی
, نمونه گیری مجموعه-رتبه دار, داده های بزرگ, بررسی های نمونه ای@inproceedings{paperid:1102424,
author = {زرین کلاه, محمدحسین and جباری نوقابی, هادی and محمد مهدی صابر},
title = {کاربرد نمونه گیری مجموعه-رتبه دار در تحلیل داده های بزرگ},
booktitle = {سومین سمینار تخصصی علم داده ها و کاربردهای آن},
year = {2024},
location = {مشهد, ايران},
keywords = {نمونه گیری مجموعه-رتبه دار، داده های بزرگ، بررسی های نمونه ای},
}
%0 Conference Proceedings
%T کاربرد نمونه گیری مجموعه-رتبه دار در تحلیل داده های بزرگ
%A زرین کلاه, محمدحسین
%A جباری نوقابی, هادی
%A محمد مهدی صابر
%J سومین سمینار تخصصی علم داده ها و کاربردهای آن
%D 2024