نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشکده اقتصاد دانشگاه علامه طباطبائی

2 عضو هیئت علمی دانشکده اقتصاد دانشگاه علامه

10.22054/jiee.2025.82899.2120

چکیده

مقاله حاضر به بررسی کاربرد الگوهای خانواده شبکه عصبی بازگشتی (مشتمل بر RNN، LSTM و GRU) در پیش‌بینی شاخص صنایع بورسی انرژی با استفاده از داده‌های سری زمانی از 1 مه 2020 تا 1 مه 2024 پرداخته است. داده‌های روزانه به دو قسمت دوره آموزش یا یادگیری (80 درصد) و دوره آزمون (20 درصد) تقسیم شدند و در گام اول، معماری بهینه الگوها (برآورد ابرپارامترها) برای پیش‌بینی 1، 2، 5 و 20 روز کاری با استفاده از داده‌های دوره یادگیری انجام شد و سپس، خطاهای پیش‌بینی سه الگوی غیرخطی یادگیری ماشین با الگوی خطی اقتصادسنجی ARIMA در افق‌های مختلف زمانی مقایسه شدند. یافته‌ها در دو حوزه اعتبارسنجی متقابل مدل‌های یادگیری ماشین و همچنین خطای پیش‌بینی حاکی از آن است که: نخست، با افزایش افق پیش‌بینی، اندازه رسته لازم برای حصول به بهترین پیش‌بینی برای هر سه الگوی یادگیری ماشین کاهش می‌یابد و هر چه اندازه حجم نمونه ورودی یادگیری بزرگتر باشد، اندازه رسته کوچکتر خواهد بود. دوم، در افق‌های پیش‌بینی کوتاه‌مدت 1، 2 و 5 روز کاری، مدل‌های یادگیری ماشین خصوصاً LSTM، خطای پیش‌بینی کمتری در مقایسه با ARIMA دارند، درحالیکه در افق پیش‌بینی 20 روز کاری (1 ماه)، دقت پیش‌بینی ARIMA نزدیک به مدل‌های غیرخطی هوش مصنوعی می‌شود. سوم، به موازات با افزایش افق پیش‌بینی، بر مقدار خطا افزوده می‌شود به طوری‌که دقت پیش‌بینی از حدود 5/98 درصد (برای افق 1 روزه) به 5/92 درصد (برای افق 20 روزه) کاهش می‌یابد. چهارم، انتخاب روش مناسب در پیش‌بینی شاخص صنایع بورسی انرژی، بستگی به افق پیش‌بینی و مشخصات داده‌ها دارد.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

Validation of Machine Learning Methods in Predicting Stock Indices of Iranian Energy Industries

نویسندگان [English]

  • reza taleblou 1
  • parisa Mohajeri 2

1 Allameh Tabataba'i University, Faculty of Economics

2 allemeh Tabataba'i University, Associate professor

چکیده [English]

This study investigates the application of recurrent neural network (RNN) models—specifically RNN, long short-term memory (LSTM), and gated recurrent unit (GRU)—in predicting the stock indices of the Iranian energy industry. Using daily time series data from May 1, 2020, to May 1, 2024, the dataset was divided into a training period (80%) and a testing period (20%). In the first step, the optimal architectures of each model (estimating hyper-parameters) were determined for prediction horizons of 1, 2, 5 (one week), and 20 trading days (one month). Subsequently, prediction errors of the three machine learning models were compared with the linear econometric model (ARIMA) across various forecast horizons. The findings in two areas of cross validations of machine learning models as well as predication error reveal the following insights: First, as the forecast horizon increases, the batch size of optimal prediction decreases for all three machine learning models, and the larger the input training sample size leads to the smaller batch size. Second, in short-term forecast horizons (1, 2, and 5 trading days), machine learning models—particularly LSTM—demonstrate lower prediction errors than ARIMA, while in the 20-trading-day (1-month) forecast horizon, ARIMA's predictive accuracy approaches to the nonlinear machine learning models. Third, forecast accuracy decreases as the horizon lengthens, with accuracy dropping from approximately 98.5% (for a 1-day horizon) to 92.5% (for a 20-day horizon). Finally, selecting the appropriate forecasting method for the stock market indices of energy industries depends on the forecast horizon and data characteristics.

کلیدواژه‌ها [English]

  • Machine Learning
  • Artificial Intelligence
  • Recurrent Neural Network
  • Stock Market Forecasting