نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده مهندسی صنایع و سیستم ها، دانشگاه صنعتی اصفهان

2 دانشکده مهندسی صنایع و سیستم‌ها، دانشگاه صنعتی اصفهان

10.22105/dmor.2022.311692.1514

چکیده

هدف: در این مقاله، یک متدولوژی جدید برای مدل‌سازی‌های آماری ارائه گردیده است، که برخلاف تمامی مدل‌ها و الگوریتم‌های توسعه‌یافته معمول، قابلیت‌اعتماد به‌نتایج را به‌جای دقت حاصله به‌حداکثر می‌رساند. بر این اساس در این مقاله، یک دسته جدید از رویکردهای مدل‌سازی آماری با جایگزینی فرآیندهای معمول با فرآیند پیشنهادی پیشنهاد گردیده است.

روش‌شناسی پژوهش: در این مقاله، روش رگرسیون خطی چندگانه به‌منظور پیاده‌سازی متدولوژی پیشنهادی انتخاب شده است. برای ارزیابی جامع عملکرد مدل رگرسیون پیشنهادی، 10 مجموعه داده معیار از ادبیات موضوع مدل‌سازی‌های آماری در نظر‌گرفته شده است.

یافته‎ها: به‌طو‌رکلی، نتایج حاصله نشان می‌دهد که در 65 درصد از مجموعه داده‌های بررسی‌شده، مدل پیشنهادی توانایی تعمیم بیشتری نسبت به رگرسیون خطی چندگانه معمول ایجاد نموده است. مدل رگرسیون پیشنهادی، به‌طور میانگین توانسته است دقت مدل‌سازی‌ها را به‌ترتیب به‌میزان 571/5% و 466/6% در میانگین قدرمطلق خطا و میانگین مربعات خطا نسبت به نسخه کلاسیک خود بهبود بخشد. این نتایج، به‌وضوح اثر قابل توجه اعتماد به‌نتایج را بر میزان قابلیت تعمیم نشان می‌دهد که اساساً در فرآیندهای مدل‌سازی آماری معمول لحاظ نمی‌گردد.

اصالت/ارزش افزوده علمی: مدل‌سازی‌های آماری یکی از مهم‌ترین ابزارهای موجود به‌منظور شبیه‌سازی سیستم‌های تحت مطالعه و مجموعه داده‌های دنیای واقعی می‌باشد که اغلب به‌منظور تصمیم‌گیری در طیف وسیعی از علوم مورد استفاده قرار می‌گیرد. چندین رویکرد متفاوت در ادبیات موضوع با ویژگی‌های متفاوت برای پوشش مسائل دنیای واقعی با دقت مطلوب توسعه یافته‌اند. با این حال، این‌گونه از روش‌ها از یک مفهوم و ایده مشابه در فرآیند مدل‌سازی پیروی می‌کنند. اساس عملکردی در تمامی رویکردهای مدل‌سازی آماری معمول، بر پایه این فرض استوار بوده که حداکثر دقت در داده‌های آزمایش و غیرقابل دسترس از مدل‌هایی با حداقل‌سازی میزان خطا در داده‌های آموزش بدست خواهند آمد. اگرچه، این یک رویه منطقی و استاندارد در فضاهای مدل‌سازی آماری معمول می‌باشد، امّا تنها شیوه منحصر به‌فرد برای دستیابی به‌حداکثر قابلیت تعمیم محسوب نمی‌گردد. به‌عبارت دیگر، قابلیت تعمیم مدل به‌طور همزمان وابسته به‌دقت مدل و همچنین سطح قابلیت‌اعتماد به‌نتایج حاصله می‌باشد. در این مقاله، یک متدولوژی جدید برای مدل‌سازی‌های آماری ارائه گردیده است، که برخلاف تمامی مدل‌ها و الگوریتم‌های توسعه‌یافته معمول، قابلیت‌اعتماد به‌نتایج را به‌جای دقت حاصله به‌حداکثر می‌رساند.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Proposing a new class of statistical reliability-based methods for modeling and decision-making

نویسندگان [English]

  • Sepideh Etemadi 1
  • Mehdi Khashei 2

1 Department of Industrial and Systems Engineering, Isfahan University of Technology

2 Department of Industrial and Systems Engineering, Isfahan University of Technology, Isfahan, Iran

چکیده [English]

Purpose: The purpose of this paper is to present a new methodology for statistical modeling, which, unlike all commonly developed models and algorithms, maximizes the reliability of the results instead of the resulting accuracy. Accordingly, a new class of statistical modeling approaches has been developed by replacing conventional processes with the proposed process.

Methodology: The multiple linear regression method has been selected to implement the proposed methodology in this paper. To comprehensively evaluate the performance of the proposed regression model, 10 standard datasets from the literature on statistical modeling have been considered.

Findings: Overall, the results show that in 65% of the studied data sets, the proposed model can generalize more than the usual multiple linear regression. The proposed regression model, on average, has been able to improve the accuracy of the modeling by 5.571% and 6.466% in mean absolute error and mean square error, respectively, compared to its classic version. These results clearly show the significant effect of reliability of the results on the degree of generalizability, which is basically not considered in the usual statistical modeling processes.

Originality/Value: Statistical modeling is one of the most important tools for simulating real-world systems and data sets that are often used to make decisions in a wide range of applications. Several different approaches have been developed in the literature with different features to cover real-world issues with the desired accuracy. However such methods follow a similar concept and idea in the modeling process. The performance basis in all conventional statistical modeling approaches is based on the assumption that maximum accuracy in experimental and inaccessible data will be obtained from models with minimization of error in training data. Although this is a logical and standard procedure in traditional statistical modeling spaces, it is not the unique way to achieve maximum generalizability. In other words, the generalizability of the model simultaneously depends on the model's accuracy and the level of results' reliability. In this paper, a new methodology for statistical modeling is presented, which, unlike all commonly developed models and algorithms, maximizes the reliability of the results instead of the resulting accuracy.

کلیدواژه‌ها [English]

  • Decision making processes
  • Statistical modeling
  • Accuracy and reliability
  • Generalizability of results
  • Prediction
  • Multiple linear regression