نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشکده مهندسی صنایع و سیستم ها، دانشگاه صنعتی اصفهان
2 دانشکده مهندسی صنایع و سیستمها، دانشگاه صنعتی اصفهان
چکیده
هدف: در این مقاله، یک متدولوژی جدید برای مدلسازیهای آماری ارائه گردیده است، که برخلاف تمامی مدلها و الگوریتمهای توسعهیافته معمول، قابلیتاعتماد بهنتایج را بهجای دقت حاصله بهحداکثر میرساند. بر این اساس در این مقاله، یک دسته جدید از رویکردهای مدلسازی آماری با جایگزینی فرآیندهای معمول با فرآیند پیشنهادی پیشنهاد گردیده است.
روششناسی پژوهش: در این مقاله، روش رگرسیون خطی چندگانه بهمنظور پیادهسازی متدولوژی پیشنهادی انتخاب شده است. برای ارزیابی جامع عملکرد مدل رگرسیون پیشنهادی، 10 مجموعه داده معیار از ادبیات موضوع مدلسازیهای آماری در نظرگرفته شده است.
یافتهها: بهطورکلی، نتایج حاصله نشان میدهد که در 65 درصد از مجموعه دادههای بررسیشده، مدل پیشنهادی توانایی تعمیم بیشتری نسبت به رگرسیون خطی چندگانه معمول ایجاد نموده است. مدل رگرسیون پیشنهادی، بهطور میانگین توانسته است دقت مدلسازیها را بهترتیب بهمیزان 571/5% و 466/6% در میانگین قدرمطلق خطا و میانگین مربعات خطا نسبت به نسخه کلاسیک خود بهبود بخشد. این نتایج، بهوضوح اثر قابل توجه اعتماد بهنتایج را بر میزان قابلیت تعمیم نشان میدهد که اساساً در فرآیندهای مدلسازی آماری معمول لحاظ نمیگردد.
اصالت/ارزش افزوده علمی: مدلسازیهای آماری یکی از مهمترین ابزارهای موجود بهمنظور شبیهسازی سیستمهای تحت مطالعه و مجموعه دادههای دنیای واقعی میباشد که اغلب بهمنظور تصمیمگیری در طیف وسیعی از علوم مورد استفاده قرار میگیرد. چندین رویکرد متفاوت در ادبیات موضوع با ویژگیهای متفاوت برای پوشش مسائل دنیای واقعی با دقت مطلوب توسعه یافتهاند. با این حال، اینگونه از روشها از یک مفهوم و ایده مشابه در فرآیند مدلسازی پیروی میکنند. اساس عملکردی در تمامی رویکردهای مدلسازی آماری معمول، بر پایه این فرض استوار بوده که حداکثر دقت در دادههای آزمایش و غیرقابل دسترس از مدلهایی با حداقلسازی میزان خطا در دادههای آموزش بدست خواهند آمد. اگرچه، این یک رویه منطقی و استاندارد در فضاهای مدلسازی آماری معمول میباشد، امّا تنها شیوه منحصر بهفرد برای دستیابی بهحداکثر قابلیت تعمیم محسوب نمیگردد. بهعبارت دیگر، قابلیت تعمیم مدل بهطور همزمان وابسته بهدقت مدل و همچنین سطح قابلیتاعتماد بهنتایج حاصله میباشد. در این مقاله، یک متدولوژی جدید برای مدلسازیهای آماری ارائه گردیده است، که برخلاف تمامی مدلها و الگوریتمهای توسعهیافته معمول، قابلیتاعتماد بهنتایج را بهجای دقت حاصله بهحداکثر میرساند.
کلیدواژهها
- فرآیندهای تصمیمگیری
- مدلسازی آماری
- دقت و قابلیتاعتماد
- قابلیت تعمیم نتایج
- پیشبینی
- رگرسیون خطی چندگانه
موضوعات
عنوان مقاله [English]
Proposing a new class of statistical reliability-based methods for modeling and decision-making
نویسندگان [English]
- Sepideh Etemadi 1
- Mehdi Khashei 2
1 Department of Industrial and Systems Engineering, Isfahan University of Technology
2 Department of Industrial and Systems Engineering, Isfahan University of Technology, Isfahan, Iran
چکیده [English]
Purpose: The purpose of this paper is to present a new methodology for statistical modeling, which, unlike all commonly developed models and algorithms, maximizes the reliability of the results instead of the resulting accuracy. Accordingly, a new class of statistical modeling approaches has been developed by replacing conventional processes with the proposed process.
Methodology: The multiple linear regression method has been selected to implement the proposed methodology in this paper. To comprehensively evaluate the performance of the proposed regression model, 10 standard datasets from the literature on statistical modeling have been considered.
Findings: Overall, the results show that in 65% of the studied data sets, the proposed model can generalize more than the usual multiple linear regression. The proposed regression model, on average, has been able to improve the accuracy of the modeling by 5.571% and 6.466% in mean absolute error and mean square error, respectively, compared to its classic version. These results clearly show the significant effect of reliability of the results on the degree of generalizability, which is basically not considered in the usual statistical modeling processes.
Originality/Value: Statistical modeling is one of the most important tools for simulating real-world systems and data sets that are often used to make decisions in a wide range of applications. Several different approaches have been developed in the literature with different features to cover real-world issues with the desired accuracy. However such methods follow a similar concept and idea in the modeling process. The performance basis in all conventional statistical modeling approaches is based on the assumption that maximum accuracy in experimental and inaccessible data will be obtained from models with minimization of error in training data. Although this is a logical and standard procedure in traditional statistical modeling spaces, it is not the unique way to achieve maximum generalizability. In other words, the generalizability of the model simultaneously depends on the model's accuracy and the level of results' reliability. In this paper, a new methodology for statistical modeling is presented, which, unlike all commonly developed models and algorithms, maximizes the reliability of the results instead of the resulting accuracy.
کلیدواژهها [English]
- Decision making processes
- Statistical modeling
- Accuracy and reliability
- Generalizability of results
- Prediction
- Multiple linear regression