پیش بینی روند سهام با استفاده از الگوریتم ژنتیک و جنگل تصادفی

  • 2022-12-10

این مقاله به مشکل پیش‌بینی روند روزانه سهام می‌پردازد. ملاحظات کلیدی این است که پیش بینی کنیم که آیا یک سهم معین در روند صعودی فردا با توجه به قیمت بسته شدن امروز بسته می شود یا خیر. ما یک مدل پیش‌بینی را پیشنهاد می‌کنیم که شامل یک مدل انتخاب ویژگی‌ها، بر اساس الگوریتم ژنتیک (GA)، و طبقه‌بندی‌کننده جنگل تصادفی (RF) است. در مطالعه خود، چهار شاخص سهام بین المللی را در نظر می گیریم که از مفهوم تحلیل تاخیر توزیع شده پیروی می کنند. ما یک رویکرد الگوریتم ژنتیک را برای انتخاب مجموعه‌ای از ویژگی‌های مفید از میان شاخص‌های این تاخیرها اتخاذ کردیم. پس از آن، ما از طبقه‌بندی‌کننده جنگل تصادفی برای آشکار کردن روابط پنهان بین شاخص‌های سهام و روند یک سهام خاص استفاده کردیم. ما مدل خود را با استفاده از آن برای پیش بینی روند 15 سهم آزمایش کردیم. آزمایش‌ها نشان داد که مدل پیش‌بینی ما دقت 80 درصدی داشت که به طور قابل‌توجهی بهتر از پیش‌بینی ساختگی بود. S& P 500 مفیدترین شاخص سهام بود، در حالی که CAC40 کمترین کاربرد را در پیش بینی روند روزانه سهام داشت. این مطالعه شواهدی از سودمندی به کارگیری شاخص های سهام بین المللی برای پیش بینی روند سهام ارائه می دهد.

1. مقدمه

حرکات بازار سهام تحت تأثیر بسیاری از متغیرهای برونزا، مانند رویدادهای سیاسی و ژئوپلیتیکی، نرخ ارز، حرکات سایر بازارهای سهام، محیط اقتصادی، سیاست‌های شرکت و روان‌شناسی سرمایه‌گذاران است (گیدوفالوی 2001؛ کمیته جایزه نوبل 2013؛ الچارانی. 2016؛ الچارانی 2019).

برای تئوری بازار کارآمد (فاما 1965؛ فاما 1970؛ فاما 1998)، تمام اطلاعات مرتبط باید در بازارهای سهام کارآمد منعکس شود. در کارایی بازار ضعیف، قیمت سهام منعکس کننده تمام اطلاعات قیمت های گذشته است. در شکل کارایی بازار نیمه قوی، قیمت سهام منعکس کننده تمام اطلاعات عمومی موجود است. ما از پیش‌بینی روند صعودی استفاده می‌کنیم که با کارایی بازار در تضاد است، زیرا شامل اطلاعات بلادرنگی است که شرایط تئوری را منعکس نمی‌کند.

بازارهای پویا با حرکات غیرخطی قیمت سهام، همراه با تعدد پیش بینی کننده ها، پیش بینی روند سهام را چالش برانگیز می کند. در واقع، یک راه حل پیش بینی کارآمد در بازار سهام می تواند نقش مهمی در ایجاد انگیزه در افراد به سمت معاملات سهام داشته باشد (Sharma et al. 2017).

شبکه های عصبی مصنوعی (ANN) و دستگاه بردار پشتیبانی (SVM) رایج ترین الگوریتم های یادگیری ماشین برای پیش بینی سهام هستند (Guresen et al. 2011 ؛ Hoseinzade 2019 ؛ Kara et al. 2011 ؛ Wang and Wang 2015). بسیاری از شبکه های عصبی مصنوعی تمایل دارند قیمت بسته شدن روز بعد را پیش بینی کنند (لی و لیائو 2017). برخی از مدل های مبتنی بر شبکه های عصبی مصنوعی با الگوریتم های دیگر برای تقویت دقت پیش بینی غنی شده اند (نیر و همکاران 2011). به همین ترتیب ، مدل های دستگاه بردار پشتیبانی برای پیش بینی روند سهام (Reddy and SAI 2018) تهیه شده اند. برخی از پیشنهادات دستگاه بردار پشتیبانی یا شبکه های عصبی مصنوعی را با تکنیک های پیش پردازش ، به دنبال الگوریتم های متا-هورستیک برای یافتن پارامترهای یادگیری بهینه ماشین ، معماری شبکه های عصبی مصنوعی و مجموعه ای از ویژگی های ورودی ترکیب کرده اند (Asadi et al. 2012 ؛ Sedighi etAl. 2019 ؛ ژانگ و وو 2009). به تازگی ، تکنیک های یادگیری عمیق مانند شبکه عصبی حلقوی (CNN) ، Perceptron چند لایه عمیق (MLP) ، شبکه اعتقاد عمیق (DBN) ، شبکه عصبی مکرر (RNN) ، حافظه کوتاه مدت بلند مدت (LSTM) و شبکه مخالف تولیدی (GAN) ثابت شده است که برای مطالعات سهام قابل اجرا است (با صدای بلند 2020 ؛ سانگ و دیپیررو 2019 ؛ سلوین و همکاران 2017 ؛ ژانگا و همکاران 2019). انتخاب ویژگی ها یک عامل اصلی برای فرآیند کشف دانش است. اهمیت آن از نقش آن در بهبود دقت و کارآیی مدل پیش بینی با انتخاب متغیرهای مربوطه و کاهش ابعاد مجموعه داده ها بدست آمده است (مائو و همکاران 2016 ؛ Sugunnasil و Somhom 2010). با این حال ، مدل های انتخاب ویژگی ها از اشکال استفاده از ویژگی های جدا شده برای پیش بینی روند رنج می برند. در ادبیات برای مدل های روند سهام شکاف وجود دارد که نه تنها از انتخاب ویژگی ها استفاده می کنند ، بلکه شامل شاخص های بین المللی سهام برای پیش بینی روند هستند ، زیرا این مدل ها به جای ویژگی های منزوی ، جوهر حرکات بازار جهانی را به خود اختصاص می دهند. این مقاله چنین مدلی را ارائه می دهد.

مجموعه ای از شاخص های سهام بین المللی را انتخاب کنید. در این کار ، تمرکز روی Nikkei 225 ، CAC 40 ، DAX و S& P 500 است.

برای انتخاب ویژگی از یک الگوریتم ژنتیکی استفاده کنید. هدف در اینجا تصمیم گیری این است که قیمت های تاریخی در پیش بینی روند سهام قابل توجه است.

سرانجام ، ما الگوریتم Random Forest (RF) را برای یافتن روابط پنهان بین ویژگی های انتخاب شده (از مرحله 3) و روند سهام در نظر می گیریم.

این باقیمانده این مقاله به شرح زیر سازماندهی شده است. بخش 2 مروری بر ادبیات است. بخش 3 رویکرد ما برای پیش بینی روند سهام را توصیف می کند. بخش 4 در مورد مواد و روش ها بحث می کند. بخش 5 نتایج را ارائه می دهد ، در حالی که نتیجه گیری در بخش 6 شرح داده شده است.

2. بررسی ادبیات منتخب

در این بخش ، ما به مطالعات متعددی پرداخته ایم که سعی در توسعه مدل های یادگیری ماشین برای پیش بینی قیمت سهام دارند. مدل های پیش بینی شبکه عصبی مصنوعی در بسیاری از کارهای تحقیقاتی مانند Chandan و همکاران ارائه شده است.(2016). با این حال ، رفتار پر سر و صدا از بازارهای سهام مانعی را برای شبکه های عصبی مصنوعی ایجاد می کند و منجر به همگرایی به راه حل های زیر قطبی می شود (Hoseinzade 2019). برای حل این مشکل ، کارا و همکاران.(2011) پیشنهاد کرد که یک مدل پیش پردازش ماشین فروشنده پشتیبانی می تواند در از بین بردن ویژگی های نامربوط کمک کند. با توجه به پیش بینی روند سهام ، Reddy و SAI (2018) یک دستگاه فروشنده پشتیبانی و رویکرد عملکرد مبنای شعاعی را برای پیش بینی قیمت سهام در بزرگ و همچنین در سرمایه های کوچک پیشنهاد دادند. پیش بینی کننده آنها بر اساس داده های تاریخی موجود برای پیش بینی داده های روز بعد آموزش داده می شود. در حالی که نتایج عددی به دست آمده راندمان بالایی از الگوریتم را نشان می دهد ، اشکال آن این است که راه حل چهار ویژگی ثابت را بدون هیچ گونه مهندسی یا بهینه سازی خاص فرض می کند. این آزمایش بدون پرداختن به کیفیت آن به داده های آنلاین متکی است.

Hoseinzade (2019) مدلی به نام CNNPRED را پیشنهاد کرد که می تواند برای جمع آوری داده ها از منابع مختلف ، از بازارهای مختلف استفاده شود. این رویکرد از استخراج ویژگی برای پیش بینی روند حرکت روز بعد برای شاخص های خاص ، از جمله S& P 500 ، NASDAQ ، DJI ، NYSE و Russell 3000 استفاده می کند. لایهبرای بهبود نتایج ، مدل پیشنهادی از داده های سهام از پیش پردازش شده به عنوان ورودی استفاده کرد. هدف کار پیش بینی قیمت سهام در بازار سهام چین بود. مدل پیشنهادی محدود به چهار ویژگی به عنوان قیمت های باز ، نزدیک ، بالا و پایین بود. محدودیت اصلی این بود که اعتبار سنجی به یک مجموعه داده محدود اعتماد داشت.

Karathanasopoulos و همکاران.(2019) چندین تکنیک بهینه سازی را برای یافتن سلسله مراتب بهینه شبکه عصبی برای پیش بینی 12 وجوه مبادله مبادله (ETF) ارائه داد. آنها سه رویکرد بهینه سازی ، یعنی الگوریتم ژنتیکی ، تکامل دیفرانسیل و بهینه ساز ذرات را در نظر گرفتند. آنها همچنین سه شبکه چند لایه ، شبکه های عصبی مکرر و شبکه های عصبی عملکرد پایه را در نظر گرفتند. نتایج آنها نشان داد که تکامل دیفرانسیل روش بهینه است ، با بالاترین دقت پیش بینی.< Span> Karathanasopoulos و همکاران.(2019) چندین تکنیک بهینه سازی را برای یافتن سلسله مراتب بهینه شبکه عصبی برای پیش بینی 12 وجوه مبادله مبادله (ETF) ارائه داد. آنها سه رویکرد بهینه سازی ، یعنی الگوریتم ژنتیکی ، تکامل دیفرانسیل و بهینه ساز ذرات را در نظر گرفتند. آنها همچنین سه شبکه چند لایه ، شبکه های عصبی مکرر و شبکه های عصبی عملکرد پایه را در نظر گرفتند. نتایج آنها نشان داد که تکامل دیفرانسیل روش بهینه است ، با بالاترین دقت پیش بینی. Karathanasopoulos و همکاران.(2019) چندین تکنیک بهینه سازی را برای یافتن سلسله مراتب بهینه شبکه عصبی برای پیش بینی 12 وجوه مبادله مبادله (ETF) ارائه داد. آنها سه رویکرد بهینه سازی ، یعنی الگوریتم ژنتیکی ، تکامل دیفرانسیل و بهینه ساز ذرات را در نظر گرفتند. آنها همچنین سه شبکه چند لایه ، شبکه های عصبی مکرر و شبکه های عصبی عملکرد پایه را در نظر گرفتند. نتایج آنها نشان داد که تکامل دیفرانسیل روش بهینه است ، با بالاترین دقت پیش بینی.

این مطالعه مشابه این مقاله توسط Jiao و Jakubowicz (2017) است. این مطالعه جهت گیری روزانه حرکت قیمت سهام را پیش بینی کرده است. نویسندگان پیش بینی حرکت سهام را به عنوان یک مشکل طبقه بندی باینری در نظر گرفتند. آنها 463 سهام ، ترکیبات S& P 500 و 8 شاخص بین المللی را مطالعه کردند. شاخص های بین المللی شامل سه شاخص آسیایی (Nikkei 225 ، Hang Seng ، و کلیه ORDS) ، دو شاخص اروپایی (DAX ، FTSE 100) و سه شاخص ایالات متحده (NYSE Composite ، میانگین صنعتی داو جونز و S& P500) بود. بنابراین ، هنگامی که بازده روزانه مثبت بود (بیشتر از صفر) ، میانگین جهت قیمت صعود کرد. هنگامی که بازده روزانه منفی بود (کمتر از صفر) ، میانگین جهت قیمت پایین تر بود. پس از آن ، آنها از یک اپراتور تاخیر برای استخراج ویژگی های بیشتر از شاخص های سهام ، علاوه بر بیش از 200 شاخص فنی ، به عنوان ویژگی های ورودی به طبقه بندی کننده استفاده کردند. سپس ، آنها از انتخاب ویژگی های مبتنی بر الگوریتم ژنتیکی استفاده کردند تا از ویژگی های انتخاب شده به عنوان ورودی به طبقه بندی کننده استفاده کنند. نویسندگان برای مقایسه عملکرد پیش بینی خود از چهار الگوریتم طبقه بندی استفاده کردند. الگوریتم های طبقه بندی مورد استفاده شامل جنگل تصادفی ، درختان تقویت شده شیب ، شبکه های عصبی مصنوعی و رگرسیون لجستیک است. با این حال ، Jiao و Jakubowicz (2017) سودمندی شاخص های بین المللی سهام را برای پیش بینی روند سهام ، که ما در مطالعه خود به آنها اعتماد داشتیم ، بررسی نکردند. علاوه بر این ، ما یک رویکرد مبتنی بر الگوریتم ژنتیکی را برای انتخاب تنها ویژگی های مفید پیشنهاد کردیم. ما 10 ویژگی تاخیر را از هر شاخص سهام بین المللی استخراج کردیم ، در کنار داده های تاریخی سهام سهام که روند آن آرزو داشتیم پیش بینی کنیم. علاوه بر این ، اگر تغییر قیمت روزانه مثبت (بیشتر از صفر) و پایین آمدن باشد ، اگر تغییر قیمت بازگشت روزانه منفی باشد (کمتر از صفر) ، روند سهام را به صعود طبقه بندی می کنند. در مطالعه ما ، اگر تغییر قیمت روزانه بیشتر از پنج درصد دهم (0. 5 ٪) باشد ، روند سهام را به عنوان صعود طبقه بندی کردیم. اگر تغییر قیمت روزانه کمتر از پنج درصد دهم (0. 5 ٪) باشد ، طبقه بندی به روز نشده بود. هدف ما این بود که اطمینان حاصل کنیم که معامله گر ضرر نمی کند. رویکرد ما به این سؤال پاسخ داد که آیا شاخص های سهام بین المللی می تواند در پیش بینی روند سهام مفید باشد ، در حالی که رویکرد Jiao و Jakubowicz (2017) نمی توانند چنین بینشی را ارائه دهند.

Sable et al.(2017) یک مدل پیش بینی کوتاه مدت ، با استفاده از الگوریتم ژنتیکی و استراتژی های تکاملی ، پیش بینی قیمت هشت اسکریپت را با شش ویژگی برای هر اسکریپت ارائه داد (قیمت باز ، قیمت بسته شدن ، بالاترین قیمت ، کمترین قیمت ، حجم و تنظیمقیمت بسته شدن). این هشت اسکریپت منعکس کننده شرکت های مستقر در ایالات متحده است. در این مقاله به سایر بازارهای بین المللی نمی پردازد. هیچ یک از دلایل خاص پشت شش ویژگی انتخاب شده را ذکر نمی کند.

شن و شفیق (2020) یک مدل پیش بینی برای روند قیمت سهام سهام ارائه دادند. این پیشنهاد به شخصی سازی مهندسی ویژگی و یادگیری عمیق متکی است. ستون های این پیشنهاد به جای فقط یک مدل یادگیری عمیق ، تکنیک های مختلفی از مهندسی ویژگی ها با یک سیستم تنظیم شده خوب است. ارزیابی کار فقط به بازار سهام چین متکی است. در حالی که این مقاله از ارزش علمی بالایی برخوردار است ، استفاده از همان رویکرد در سایر بازارهای بین المللی هنوز ارزیابی می شود.

Wanjawa و Muchemi (2014) ثابت کردند که مدل پیکربندی 5: 21: 21: 1 می تواند به دقت پیش بینی بسیار خوبی برسد. ارزیابی در 1000 سوابق آموزش دیده در چرخه 130 K انجام شد. درصد آموزش 80 ٪ بود. با استفاده از شبکه های عصبی مصنوعی (ANN) برای پیش بینی سه سهام در بورس اوراق بهادار نیویورک (NYSE) ، با Encog و Neuroph برای اعتبار سنجی ، پیش بینی با دامنه خطا [0. 71 ٪ -2. 77 ٪] بدست آمد.

سونی و همکاران.(2022) ، روف و همکاران.(2021) ، رحول و همکاران.(2020) ، و Tawarish و Satyanarayana (2019) نظرسنجی های جالبی را در مورد تکنیک های ML مورد استفاده برای پیش بینی بازار سهام ارائه می دهند. تقریباً همه این نظرسنجی ها نشان می دهد که درصد زیادی از پیشنهادات از دستگاه بردار پشتیبانی (SVM) استفاده می کنند ، کمتر از الگوریتم ژنتیکی استفاده می کنند و کمتر از جنگل تصادفی استفاده می کنند. در حالی که این نظرسنجی ها از تازگی رویکرد ما پشتیبانی می کنند ، آنها در مورد هیچ کاری که ترکیب الگوریتم ژنتیکی و جنگل تصادفی یا شاخص های بین المللی سهام باشد ، بحث نمی کنند. وانگ و همکاران.(2021) یک نظرسنجی دیگر انجام داد ، که بر کار انجام شده با استفاده از نقشه برداری شناختی فازی و شبکه عصبی عمیق متمرکز است. این بررسی محدود به کار تحقیقاتی با مجموعه داده ها یا چندین سال است ، یا مواردی که در دوره های کوتاه مدت اندازه گیری می شوند.

3. رویکرد ما برای پیش بینی روند سهام

3. 1فرمول مسأله

این تحقیق بر پیش بینی اینکه آیا سهام فردا با اشاره به قیمت سهام امروز ، یک صعود را نشان می دهد ، متمرکز شده است. به طور رسمی ، R T + 1 تغییر قیمت فردا را نسبت به قیمت بسته شدن امروز نشان داد. این مقدار R T + 1 همچنین توسط Δ P T + 1 همانطور که در معادله بیان شده است (1) نشان داده شده است.

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.