اگرچه اکثریت قریب به اتفاق تحلیلگران بنیادی معتقدند که برآوردهای تحلیلگران فنی و شاخص های فنی مورد استفاده در این تحلیل ها پاسخگو نیستند ، اما تحقیقات اخیر نشان داده است که هم متخصصان و هم معامله گران از شاخص های فنی استفاده می کنند. تخمین صحیح از جهت بازار مالی یک فعالیت بسیار چالش برانگیز است ، در درجه اول به دلیل ماهیت غیرخطی سری زمانی مالی. از طرف دیگر روشهای یادگیری عمیق و یادگیری ماشین در بسیاری از زمینه های مختلف که انسانها به چالش کشیده می شوند ، به نتایج بسیار موفقی رسیده اند. در این مطالعه ، شاخص های فنی در روشهای یادگیری عمیق و یادگیری ماشین ادغام شدند و رفتار معامله گران به منظور افزایش دقت پیش بینی جهت بازار مالی مدل سازی شد. مجموعه ای از شاخص های فنی بر اساس کاربرد آنها در تجزیه و تحلیل فنی به عنوان ویژگی های ورودی برای پیش بینی جهت پیش رو (یک دوره) از شاخص ملی بورس استانبول (BIST100) بررسی شده است. برای پیش بینی جهت شاخص ، شبکه عصبی عمیق (DNN) ، دستگاه بردار پشتیبانی (SVM) ، جنگل تصادفی (RF) و تکنیک های طبقه بندی رگرسیون لجستیک (LR) استفاده می شود. عملکرد این مدلها بر اساس معیارهای مختلف عملکرد مانند ماتریس سردرگمی ، بازگشت مرکب و حداکثر پیش بینی ارزیابی می شود.
1. مقدمه
کارآیی تجزیه و تحلیل فنی ، یکی از قدیمی ترین ابزارهایی که برای پیش بینی جهت بازار استفاده می شود ، مدتهاست که مورد بحث قرار گرفته است ، و به نظر می رسد بحث ادامه خواهد یافت. دلیل اصلی این امر این است که ، برای پیش بینی روند بازار آینده ، تجزیه و تحلیل فنی به احتمال زیاد از اطلاعاتی مانند قیمت گذشته و حجم گذشته استفاده می کند ، که مبتنی بر تجزیه و تحلیل اساسی نیست. این نظریه کارایی کلاسیک بازار را نقض می کند [1].
تصور می شود که سرمایه گذاران یکی از مهمترین محرک های نوسانات در قیمت سهام در نتیجه رفتار تجاری با الگوی تکراری هستند. این منجر به این ایده می شود که قیمت سهام روندهایی را که اساس تجزیه و تحلیل فنی را تشکیل می دهد ، دنبال می کنند [2]. اگرچه رفتار تجاری الگوی برای برخی به نظر منطقی نیست ، اما مشخص است که سرمایه گذاران از آن برای پیش بینی روند بازار استفاده می کنند و حرکات قیمت آینده را به طور مؤثر پیش بینی می کنند.
اطلاعات اساسی که تحلیلگران فنی از آن استفاده می کنند حجم و قیمت است. در مطالعات تجزیه و تحلیل فنی ، الگوهای موجود در سری بورس های تاریخی ناشی از فعالیتهای روزمره بازار به منظور پیش بینی حرکات آینده بازار بررسی شده است.
علیرغم بحث مداوم در مورد اثربخشی تجزیه و تحلیل فنی ، ظهور معامله گران استفاده از تجزیه و تحلیل فنی در عمل ممکن است حتی برای انجام مطالعات جدید در این زمینه انگیزه بیشتری داشته باشد [3-7]. به عنوان مثال ، یک نظرسنجی انجام شده در 692 مدیر صندوق نشان می دهد که 87 ٪ از آنها ضمن تصمیم گیری در مورد سرمایه گذاری به تجزیه و تحلیل فنی توجه می کنند [8].
در تجارت مالی ، تجزیه و تحلیل فنی و کمی از ابزارهای ریاضی و آماری برای تعیین مناسب ترین زمان برای سرمایه گذاران برای شروع و بستن سفارشات خود استفاده می کند ، این به معنای دستورالعمل خرید یا فروش در یک محل تجارت است. در حالی که این رویکردهای سنتی تا حدودی هدف آنهاست ، تکنیک های جدیدی که در اطلاعات محاسباتی مانند یادگیری ماشین و داده کاوی ظاهر می شوند نیز برای تجزیه و تحلیل اطلاعات مالی استفاده شده اند.
یکی از اصلی ترین اهداف روشهای یادگیری ماشین ، یافتن الگوهای پنهان در داده ها با استفاده از روشهای اتوماتیک یا نیمه خودکار است. الگوهای مفید به ما این امکان را می دهد تا در مورد داده های جدید تخمین های معنادار ارائه دهیم [9]. تکنیک های یادگیری ماشین مورد استفاده در زندگی واقعی ، مانند تجزیه و تحلیل سری زمانی [10] ، ارتباط [11] ، تجزیه و تحلیل ترافیک اینترنت [12] ، تصویربرداری پزشکی [13] ، نجوم [14] ، تجزیه و تحلیل اسناد [15] و زیست شناسی [16] ، عملکرد چشمگیر در حل مشکلات طبقه بندی نشان داده اند. در حالی که اکثریت قریب به اتفاق تحقیقات مهندسی مالی قبلی بر مدلهای محاسباتی پیچیده مانند شبکه های عصبی [17-20] و دستگاه های وکتور پشتیبانی [21 ، 22] متمرکز است ، همچنین بر اساس مدلهای جدید یادگیری عمیق انجام می شود که نتایج بهتری در کاربردهای غیر مالی به دست می آورند[23 ، 24].
یادگیری عمیق یکی از روشهای یادگیری ماشین است که از داده های گذشته برای آموزش مدل ها و پیش بینی از داده های جدید استفاده می کند. تحولات اخیر در یادگیری عمیق به رایانه ها اجازه داده است تا تصاویر را بشناسند و برچسب گذاری کنند ، گفتار را بشناسند و ترجمه کنند ، در بازی هایی که به مهارت نیاز دارند بسیار موفق باشند و حتی عملکرد بهتری نسبت به انسان داشته باشند [25]. در این برنامه ها ، هدف معمولاً آموزش یک کامپیوتر برای انجام کارهایی است که انسان نیز می تواند انجام دهد. روشهای یادگیری عمیق اجازه می دهد تا کار بدون مشارکت انسانی انجام شود. شاید کاری که می تواند متفاوت توسط شخص انجام شود بعید است که در یک دوره محدود با قدرت انسان به اتمام برسد ، یا در کارهایی که به عملکرد فوق طبیعی مورد نیاز است ، بیش از حد فواید زیادی وجود دارد ، همانطور که در مورد تشخیص پزشکی [26]
شیوه های پیشرفته فعلی یادگیری عمیق با مشکلات پیش بینی جهت بازار در بسیاری از جنبه ها متفاوت است. با این حال ، یکی از برجسته ترین جنبه ها این است که مشکلات پیش بینی بازار مواردی نیست که مردم از قبل می توانند به خوبی انجام دهند. بر خلاف تفسیر ، درک اشیاء در یک تصویر ، درک متون در تصاویر ، افراد توانایی ذاتی در انتخاب سهام ندارند که در برخی دوره های آینده عملکرد خوبی داشته باشد. با این حال ، تکنیک های یادگیری عمیق ممکن است برای چنین مشکلات انتخابی مفید باشد زیرا این تکنیک ها اساساً داده های نقشه برداری عملکرد را به مقدار بازده تبدیل می کنند. حداقل ، در تئوری ، یک یادگیرنده عمیق می تواند یک مقدار بازده برای رابطه بین داده ها پیدا کند ، مهم نیست که چقدر پیچیده و غیرخطی باشد. این دور از هر دو مدل فاکتور خطی ساده اقتصاد مالی سنتی و روشهای داوری آماری نسبتاً درشت و سایر تکنیک های مدیریت دارایی کمی است [27].
در این مطالعه ، ما مزایای شبکه عصبی عمیق (DNN) ، دستگاه بردار پشتیبانی (SVM) ، جنگل تصادفی (RF) و طبقه بندی کننده رگرسیون لجستیک (LR) را در تصمیم گیری در جهت بازار بررسی می کنیم. به طور خاص ، ما نشان می دهیم که آیا این رویکردهای طبقه بندی می توانند تجارت را برای مدت طولانی سازگار و سودآور کنند.
سهم اصلی این مطالعه در حال توسعه یک مدل یادگیری عمیق با در نظر گرفتن قیمت OHLC و هزینه های معاملات و همچنین مقایسه عملکرد طبقه بندی مدل توسعه یافته با متداول ترین روشهای یادگیری ماشین در تخمین جهت شاخص بورس سهام است. موفقیت روشهای یادگیری عمیق و یادگیری ماشین ممکن است با توجه به ناکارآمدی بازارها متفاوت باشد [28]. این مطالعه به بررسی پرونده بورس اوراق بهادار استانبول و بازارهای نوظهور می پردازد. سهم دیگر این مطالعه استفاده از مقادیر آستانه برای کنترل هزینه های معاملات در برآوردهای مالی است. در برخی مطالعات ، هزینه های معامله تحت پوشش قرار نمی گیرد ، اگرچه تخمین ها سودآور به نظر می رسند. مشخص است که وقتی هزینه های معامله گنجانده شده است ، سودآوری ممکن است از بین برود [23]. برای جلوگیری از این مشکل ، سطح آستانه با توجه به انحراف استاندارد توزیع سود به صورت پویا تنظیم می شود و مقادیر بهینه برای کاهش تعداد معاملات به منظور افزایش بازده (سود در یک سرمایه گذاری) در هر معامله انتخاب می شوند. بر این اساس ، هدف ایجاد عملیات سودآور در طولانی مدت با ترکیب مناسب مقادیر پارامتر و انتخاب خاصیت اندازه مجموعه آموزش است.
ساختار مقاله به شرح زیر سازماندهی شده است. بخش 2 کار مرتبط و مطالعات مشابه در مورد یادگیری عمیق و یادگیری ماشین را در تصمیم گیری در جهت بازار ارائه می دهد. بخش 3 به طور خلاصه روش شناسی ، مجموعه آزمایشی عمومی ، مجموعه داده ها ، انتخاب ویژگی برای تغذیه مدل ها ، تنظیمات پارامتر خاص برای ارائه اطلاعات جامع برای یادگیری عمیق و سایر الگوریتم های یادگیری ماشین مورد استفاده در آزمایشات و استفاده از آنها در کار آینده را شرح می دهد. نتایج تجزیه و تحلیل هر یک از سناریوهای معاملاتی در بخش 4 ارائه شده است. سرانجام ، بخش 5 با ارائه نتایج به دست آمده و ملاحظات آینده ، مطالعه را نتیجه می گیرد.
2. کار مرتبط
محققان مطالعات خود را در مورد جهت حرکات ابزارهای مختلف مالی با استفاده از مجموعه های زمانی و روشهای یادگیری ماشین تشدید کرده اند. هم محققان دانشگاهی و هم پزشکان استراتژی های معاملاتی مالی را برای ایجاد پیش بینی در مورد حرکات آینده شاخص بازار سهام و تبدیل پیش بینی ها به سود تهیه کرده اند. این بخش شامل خلاصه ای از تحقیقات در مورد پیش بینی سهام است که روش هایی را که از شاخص های فنی به عنوان ویژگی ها استفاده می کنند ، الگوریتم های یادگیری ماشین سنتی ، مطالعات انجام شده برای بورس استانبول (ISE) و روش های فعلی که از الگوریتم های یادگیری عمیق در امور مالی استفاده می کنند ، پوشش می دهد.
اکثر مطالعات مبتنی بر پیش بینی بازار سهام با الگوریتم های یادگیری ماشین از شاخص های فنی به عنوان بخشی از مجموعه داده های آموزش استفاده می کنند. شبکه های عصبی (NN) [17 ، 18] و دستگاه های بردار پشتیبانی (SVM) یکی از روشهای بیشتر استفاده از ماشین هستند. همچنین مطالعاتی وجود دارد که از روشهای طبقه بندی مانند درختان تصمیم گیری (DTS) [29] ، جنگل های تصادفی (RFS) [30] ، رگرسیون لجستیک (LR) [31] و نوه های ساده (NB) استفاده می کنند [32]. پاتل و همکاران.[33] متمرکز بر پیش بینی ارزش های آینده شاخص های بازار سهام هند با استفاده از رگرسیون بردار پشتیبانی (SVR) ، شبکه عصبی مصنوعی (ANN) و جنگل تصادفی (RF) بود. بهترین عملکرد پیش بینی کلی توسط مدل ترکیبی SVR-ANN حاصل می شود. دقت در محدوده 85-95 ٪ برای پیش بینی طولانی مدت در سهام مانند AAPL ، MSFT و سامسونگ با استفاده از طبقه بندی کننده جنگل تصادفی با ساختن یک مدل پیش بینی کننده در تحقیقات Khaidem بدست آمده است [34]. خرید ، نگه داشتن یا فروش پیش بینی تصمیم گیری در بورس اوراق بهادار تایلند (SET) توسط Boonpeng و Jeatrakul [35] انجام می شود ، و مقایسه عملکرد شبکه عصبی سنتی با یک در مقابل همه (OAA) و یک در مقابل یک (OAO)شبکه عصبی (NN). با دقت متوسط 72. 50 ٪ ، OAA-NN خروجی بهتری نسبت به مدلهای OAO-NN و NN سنتی نشان داد.
به منظور بهبود سودآوری و ثبات تجارت که شامل رویدادهای فصلی ، Booth و همکاران است.[36] یک سیستم معاملاتی خودکار را بر اساس گروه های وزنی عملکردی از جنگل های تصادفی معرفی کرد. آزمایشات روی نمونه بزرگی از سهام از DAX انجام می شود ، و آنها دریافتند که گروه های دارای وزن با وزن از جنگل های تصادفی نتایج برتر را به همراه دارند. این تحقیق در [37] روشهای پیش بینی جهت حرکت شاخص سهام و سهام سهام برای بازارهای سهام هند را با مقایسه چهار مدل پیش بینی یادگیری ماشین مورد بررسی قرار داده است: شبکه عصبی مصنوعی (ANN) ، دستگاه بردار پشتیبانی (SVM) ، جنگل تصادفی ،و خفاش های ساده لوحمشخص شد که جنگل تصادفی از سه مدل پیش بینی دیگر در عملکرد کلی بهتر است. به همین ترتیب ، یک چارچوب ترکیبی از دستگاه بردار پشتیبانی (SVM) با رویکرد K-Nearest همسایه برای پیش بینی شاخص های بازار سهام هند توسط نایاک و همکاران ارائه شده است.[38]در این مقاله به بررسی چگونگی ترکیب چندین تکنیک در مورد پیش بینی ارزش سهام آینده در افق 1 روز ، 1 هفته و 1 ماه پرداخته شده است. اشاره شده است که می توان از مدل هیبریدی پیشنهادی استفاده کرد که در آن نیاز به مقیاس بندی داده های با ابعاد بالا و قابلیت پیش بینی بهتر وجود دارد.
کارا و همکاران[39] دو مدل کارآمد را بر اساس دو تکنیک طبقهبندی، شبکههای عصبی مصنوعی (ANN) و ماشینهای بردار پشتیبان (SVM) توسعه دادند و عملکرد آنها را در پیشبینی جهت حرکت در شاخص روزانه 100 بورس اوراق بهادار استانبول (ISE) مقایسه کردند. ده شاخص فنی به عنوان ورودی مدل های پیشنهادی انتخاب شدند. مشخص شد که مدل ANN به طور قابل توجهی بهتر از مدل SVM عمل می کند. در مطالعه پکایا [40]، نتایج رگرسیون خطی و مدل NN برای پیشبینی ارز YTL/USD با استفاده از متغیرهای کلان به عنوان دادههای ورودی مقایسه شدهاند. نشان داده شده است که NN نتایج بهتری می دهد. در [41]، شاخصهای زیرمجموعه بهینه با رویکرد انتخاب ویژگی مجموعه به منظور افزایش عملکرد پیشبینی جهت قیمت سهام در روز بعد انتخاب میشوند. یک مجموعه داده واقعی از بورس اوراق بهادار استانبول (ISE) به دست آمده و زیر مجموعه با استفاده از شاخص های فنی و کلان اقتصادی تشکیل شده است. از نتایج این مطالعه، مشخص شده است که مجموعه داده کاهش یافته نسبت به تخمین جهت روز بعد بهبودی نشان می دهد. اثربخشی استفاده از شاخص های فنی، مانند میانگین متحرک ساده قیمت بسته شدن و حرکت، در بازار سهام ترکیه در مطالعه گوچکن [42] ارزیابی شده است. مدلهای شبکه عصبی مصنوعی ترکیبی (ANN) مانند جستجوی هارمونی (HS) و الگوریتم ژنتیک (GA) به منظور انتخاب مرتبطترین شاخصهای فنی در گرفتن رابطه بین شاخصهای فنی و بازار سهام استفاده میشوند. در نتیجه این مطالعه، مشخص شد که مدل ANN مبتنی بر HS در پیشبینی بازار سهام بهتر عمل میکند.
پیش بینی جهت حرکت سهام با شبکه های عصبی حلقوی (CNN) ، که یکی از روشهای DNN است که بیشتر برای تجزیه و تحلیل تصاویر بصری استفاده می شود [43] ، ابتدا در پیش بینی جهت داخلی سهام ISE توسط Gunduz و همکاران استفاده می شود.[44]مجموعه ویژگی از شاخص های مختلف تشکیل شده است. قیمت بسته شدن ، اطلاعات زمانی و داده های معاملاتی طبقه بندی کننده ها با استفاده از قیمت های بسته بندی ساعتی برچسب گذاری می شوند. طبقه بندی کننده پیشنهادی با هفت لایه از رگرسیون لجستیک و CNN بهتر است ، که از ویژگی های سفارش داده شده به طور تصادفی استفاده می کند. چونگ و همکاران.[24] یک مدل پیش بینی بازار سهام مبتنی بر یادگیری مبتنی بر ویژگی های عمیق را به عنوان یک مطالعه موردی با استفاده از بازده سهام از بازار KOSPI ، بازار اصلی سهام در کره جنوبی پیشنهاد کرد. برای ارزیابی عملکرد شبکه یادگیری عمیق در پیش بینی بازار در فرکانس های بالا ، یک دوره زمانی پنج دقیقه استفاده می شود. هدف این است که یک ارزیابی جامع و عینی از مزایا و اشکال الگوریتم های یادگیری عمیق برای تجزیه و تحلیل بازار سهام و پیش بینی ارائه شود. مدل پیشنهادی با تجزیه و تحلیل ساختار بازار مبتنی بر کواریانس آزمایش شده است و مشخص می شود که مدل پیشنهادی تخمین کواریانس را به طور مؤثر بهبود می بخشد. از نتایج تجربی ، جهت های عملی و بالقوه مفید برای بررسی بیشتر در مورد نحوه استفاده از شبکه های یادگیری عمیق پیشنهاد شده است.
یک روش ساده برای استفاده از اخبار مالی برای پیش بینی حرکات سهام با استفاده از کلمه محبوب تعبیه شده و تکنیک های یادگیری عمیق پیشنهاد شده است [45]. آنها از DNN تشکیل شده از 4 لایه پنهان و 1024 گره پنهان در هر لایه استفاده کرده اند تا حرکت قیمت سهام را بر اساس ویژگی های مختلف پیش بینی کنند. آنها با افزودن ویژگی های به دست آمده از اخبار مالی ، آنها موفق شده اند نرخ خطا را به میزان قابل توجهی کاهش دهند.
3. روش شناسی
هدف ما در این مطالعه استفاده از بهترین ویژگی ها و روش های یادگیری ماشین به منظور مدل سازی رفتار معامله گران است تا بتوانیم جهت بازار را پیش بینی کنیم. معامله گران بزرگ از جمله بانک های سرمایه گذاری ، صندوق های تامینی و شرکت های کارگزاری نرم افزار معاملات اختصاصی خود را برای تجارت سهام می سازند. روشهای استفاده شده توسط این بنگاهها به عنوان اسرار محرمانه و تجاری نگه داشته می شوند و این باعث می شود مقایسه آنها غیرممکن باشد. در اکتشاف بهترین روشها و استراتژی ها ، ما تصمیم گرفتیم علاوه بر الگوریتم های یادگیری ماشین سنتی ، به دلیل موفقیت آنها در بسیاری از زمینه ها ، از مجموعه ای غنی از ویژگی ها و روش های یادگیری عمیق استفاده کنیم. ما به عنوان یک چارچوب یادگیری عمیق ، ما از TensorFlow استفاده می کنیم که یک نرم افزار منبع باز و منبع باز است که توسط Google Brain Team ساخته شده است تا بسیاری از کارهای مختلف هوش مصنوعی را ارائه دهد [46]. مجموعه داده ما به عنوان ساختار داده TensorFlow برای برگزاری ویژگی ها ، برچسب ها و سایر پارامترها سازماندهی شده است.
شکل 1 مراحل انجام شده برای پیش بینی جهت بازار را با استفاده از چارچوب TensorFlow نشان می دهد. این با مرحله پیش پردازش شروع می شود که ویژگی ها را استخراج می کند و عادی سازی را انجام می دهد. هنگام خواندن مجموعه داده ، مجموعه ای از ویژگی ها و برچسب ها تعریف شده است. اگر متغیرهای رشته ای وجود داشته باشد ، آنها رمزگذاری می شوند. پس از این مرحله ، مجموعه داده ها به عنوان مجموعه داده های آموزش و آزمایش به دو بخش تقسیم می شوند. از روش اعتبار سنجی متقاطع سری K-fold برای ارزیابی استفاده می شود. در این مطالعه ، k-fold روی ده تنظیم شده است. داده های سری زمانی مالی همانطور که در شکل 2 نشان داده شده است به دو بخش تقسیم می شود. در هر مرحله اعتبار سنجی ، داده های آموزش بزرگتر می شوند و کلیه داده ها را قبل از داده های آزمایش شامل می شوند در حالی که اندازه داده های آزمایش یکسان است. در آخرین چرخه اعتبارسنجی متقاطع ، اندازه مجموعه داده های آموزش نه برابر بزرگتر از مجموعه داده های آزمون است. پس از شکل گیری یک مدل با مجموعه داده های آموزش در هر مرحله ، مدل با مجموعه داده تست و دقت ، دقت ، بازده تجمعی ، حداکثر کاهش و بازده سرمایه گذاری آزمایش می شود. در اینجا ، هدف نهایی دستیابی به بالاترین دقت ، دقت ، بازده تجمعی و کمترین حداکثر کاهش است. از این رو ، پارامترهای بهینه بر اساس تجارت بین دقت و بازده تجمعی بدست می آیند.