نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشکده اقتصاد دانشگاه علامه طباطبائی
2 عضو هیئت علمی دانشکده اقتصاد دانشگاه علامه
چکیده
مقاله حاضر به بررسی کاربرد الگوهای خانواده شبکه عصبی بازگشتی (مشتمل بر RNN، LSTM و GRU) در پیشبینی شاخص صنایع بورسی انرژی با استفاده از دادههای سری زمانی از 1 مه 2020 تا 1 مه 2024 پرداخته است. دادههای روزانه به دو قسمت دوره آموزش یا یادگیری (80 درصد) و دوره آزمون (20 درصد) تقسیم شدند و در گام اول، معماری بهینه الگوها (برآورد ابرپارامترها) برای پیشبینی 1، 2، 5 و 20 روز کاری با استفاده از دادههای دوره یادگیری انجام شد و سپس، خطاهای پیشبینی سه الگوی غیرخطی یادگیری ماشین با الگوی خطی اقتصادسنجی ARIMA در افقهای مختلف زمانی مقایسه شدند. یافتهها در دو حوزه اعتبارسنجی متقابل مدلهای یادگیری ماشین و همچنین خطای پیشبینی حاکی از آن است که: نخست، با افزایش افق پیشبینی، اندازه رسته لازم برای حصول به بهترین پیشبینی برای هر سه الگوی یادگیری ماشین کاهش مییابد و هر چه اندازه حجم نمونه ورودی یادگیری بزرگتر باشد، اندازه رسته کوچکتر خواهد بود. دوم، در افقهای پیشبینی کوتاهمدت 1، 2 و 5 روز کاری، مدلهای یادگیری ماشین خصوصاً LSTM، خطای پیشبینی کمتری در مقایسه با ARIMA دارند، درحالیکه در افق پیشبینی 20 روز کاری (1 ماه)، دقت پیشبینی ARIMA نزدیک به مدلهای غیرخطی هوش مصنوعی میشود. سوم، به موازات با افزایش افق پیشبینی، بر مقدار خطا افزوده میشود به طوریکه دقت پیشبینی از حدود 5/98 درصد (برای افق 1 روزه) به 5/92 درصد (برای افق 20 روزه) کاهش مییابد. چهارم، انتخاب روش مناسب در پیشبینی شاخص صنایع بورسی انرژی، بستگی به افق پیشبینی و مشخصات دادهها دارد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Validation of Machine Learning Methods in Predicting Stock Indices of Iranian Energy Industries
نویسندگان [English]
- reza taleblou 1
- parisa Mohajeri 2
1 Allameh Tabataba'i University, Faculty of Economics
2 allemeh Tabataba'i University, Associate professor
چکیده [English]
This study investigates the application of recurrent neural network (RNN) models—specifically RNN, long short-term memory (LSTM), and gated recurrent unit (GRU)—in predicting the stock indices of the Iranian energy industry. Using daily time series data from May 1, 2020, to May 1, 2024, the dataset was divided into a training period (80%) and a testing period (20%). In the first step, the optimal architectures of each model (estimating hyper-parameters) were determined for prediction horizons of 1, 2, 5 (one week), and 20 trading days (one month). Subsequently, prediction errors of the three machine learning models were compared with the linear econometric model (ARIMA) across various forecast horizons. The findings in two areas of cross validations of machine learning models as well as predication error reveal the following insights: First, as the forecast horizon increases, the batch size of optimal prediction decreases for all three machine learning models, and the larger the input training sample size leads to the smaller batch size. Second, in short-term forecast horizons (1, 2, and 5 trading days), machine learning models—particularly LSTM—demonstrate lower prediction errors than ARIMA, while in the 20-trading-day (1-month) forecast horizon, ARIMA's predictive accuracy approaches to the nonlinear machine learning models. Third, forecast accuracy decreases as the horizon lengthens, with accuracy dropping from approximately 98.5% (for a 1-day horizon) to 92.5% (for a 20-day horizon). Finally, selecting the appropriate forecasting method for the stock market indices of energy industries depends on the forecast horizon and data characteristics.
کلیدواژهها [English]
- Machine Learning
- Artificial Intelligence
- Recurrent Neural Network
- Stock Market Forecasting