عنوان : ( تحلیل شدت تصادفات جاده ای ایران با ارائه یک رویکرد یکپارچه پیش پردازش داده ها مبتنی بر الگوریتم های یادگیری ماشین )
نویسندگان: سیدایمان محمدپور , ابوالفضل محمدزاده مقدم ,بر اساس تصمیم نویسنده مقاله دسترسی به متن کامل برای اعضای غیر دانشگاه ممکن نیست
چکیده
ا وجود اهمیت پیش پردازش داده ها در اعتبار نتایج مدلهای تحلیل شدت تصادفات، این مهم اغلب مورد بی توجهی قرار گرفته است. هدف این پژوهش ارائه یک رویکرد پیش پردازش یکپارچه جهت شناسایی مهمترین عوامل موثر بر شدت تصادفات جاده ای ایران طی سالهای 1397-1393است. پس از تجمیع داده ها، نمونه ای از کلان داده به روش نمونه برداری خوشه ای تصادفی انتخاب شد. این شیوه نمونه برداری، توزیع داده ها را حفظ کرده و از سوگیری نتایج جلوگیری میکند. سپس، داده های پرت شناسایی و به عنوان داده های گمشده معرفی شدند. متغیر های پیوسته با روش گسسته سازی مبتنی بر کمینه سازی آنتروپی به متغیر رسته ای تبدیل شدند. با استفاده از مدل یادگیری ماشین کا-نزدیکترین همسایه با میانگین وزن دار، از طریق یادگیری الگوی موجود در داده ها، مقادیر گمشده با محتمل ترین مقادیر جایگزین شدند. با روشهای نمونه برداری مصنوعی بیشتر از کلاس اقلیت ) (SMOTEو نمونه برداری کمتر از کلاس اکثریت، با مساله عدم توازن در داده ها برخورد شد. سپس، با الگوریتم جنگل تصادفی متغیرهای کم اهمیت شناسایی و حذف شدند. مدل شدت تصادف درخت تصمیم، بدون پیشپردازش عدم توازن، دقتی معادل % 59دارد؛ درحالیکه شاخص دقت میانگین-جی در این حالت معادل %0است. در مقابل، شاخصهای دقت میانگین-جی و دقت برای مدل با داده های اصلاحی به روش نمونه برداری مصنوعی بیشتر از کلاس اقلیت، به ترتیب معادل %69و %68است. به خصوص، شایان توجه است که دقت پیش بینی تصادفات فوتی در مدل اصلاح نشده کمتر از %1است. این درحالیست که دقت پیش بینی تصادفات فوتی در مدل اصلاحی %67است. این نتایج به روشنی اهمیت توجه به عدم توزن در داده ها را در مرحله پیش پردازش نشان میدهند
کلمات کلیدی
, ایمنی ترافیک, شدت تصادف, عدم توازن, جانهی مقادیر گمشده, یادگیری ماشین@inproceedings{paperid:1098894,
author = {محمدپور, سیدایمان and محمدزاده مقدم, ابوالفضل},
title = {تحلیل شدت تصادفات جاده ای ایران با ارائه یک رویکرد یکپارچه پیش پردازش داده ها مبتنی بر الگوریتم های یادگیری ماشین},
booktitle = {19th.International Congress on Civil Engineering , Architecture and Urban Development},
year = {2023},
location = {تهران, ايران},
keywords = {ایمنی ترافیک، شدت تصادف، عدم توازن، جانهی مقادیر گمشده، یادگیری ماشین},
}
%0 Conference Proceedings
%T تحلیل شدت تصادفات جاده ای ایران با ارائه یک رویکرد یکپارچه پیش پردازش داده ها مبتنی بر الگوریتم های یادگیری ماشین
%A محمدپور, سیدایمان
%A محمدزاده مقدم, ابوالفضل
%J 19th.International Congress on Civil Engineering , Architecture and Urban Development
%D 2023