<株進捗>9/7 学習の途中経過(360銘柄中50銘柄完了)

目次

  1. 1日学習させ続けてみた
  2. その他

1. 1日学習させ続けてみた

昨日のブログで

過去400日の値動きから翌5日、過去200日の値動きから翌3日、などいろいろな数字をチューニングした160パターンで学習テストしてみます。
次のブログでは良かったパラメータランキングを出してみようと思います。

と書いていました。
(結局パターンは320に増えました。)
ブログを書いたあと、処理を流したのですが、メモリ不足で止まっていました。夜動かして翌朝は動いてたんですが…。
なので、50パターンくらいしか学習テストできていません。

所見

  • 層は4,8,15の3つでテストしました。15にすると、あまり良い結果が得られませんでした。
  • 過去N日の値動きから翌M日 のNの値を大きくすると、あまり良い結果が得られない傾向ありでした。

メモ:試した50パターンのうち比較的良かったデータ

  • ①<4層、隠れノード30><過去200日→翌5日><売買のしきい値:3%>
    • 「買い」タイミングで正しく「買い」予想できた率: 67/394 = 17%
    • 「買い」でないタイミングで誤って「買い」予想した率: 41/108 = 38%
  • ②<8層、隠れノード100><過去200日→翌10日><売買のしきい値:3%>
    • 「買い」タイミングで正しく「買い」予想できた率: 109/575 = 19%
    • 「買い」でないタイミングで誤って「買い」予想した率: 37/146 = 25%
  • ③<8層、隠れノード100><過去300日→翌5日><売買のしきい値:10%>
    • 「買い」タイミングで正しく「買い」予想できた率: 7/32 = 22%
    • 「買い」でないタイミングで誤って「買い」予想した率: 5/12 = 42%

①②はそれぞれ108回、146回取引しているのに対して③は12回しか取引していません。
が、③は10%以上の上げを的中率22%で当てています。

どっちがいいのか・・・と言われると、売買シュミレーションにかけてみてどれだけ利益でるかを試してみるしかないですね。
感覚的には、②は①の上位互換。③と②はそれぞれ性質が異なる。んじゃないかと思ってます。
③は一発あてちゃうタイプ、②はこつこつタイプって感じでしょうか。
①②のように取引回数を重ねると手数料がバカにならないので、1回取引あたりの利益率はあげたいところですが・・・。

あと300パターンも学習させて結果を見ます!
そのあと、よい結果を残したパラメータ(ベスト5くらい)に対して、さらに大量の銘柄で学習させてみてどうなるかをためします。

2.その他

画像認識、はじめました

今、知り合いの手伝いで画像認識も手をつけています。今やっていることはAutoEncoderの実装。
例えるなら…日本語の再和訳がどれだけ正しくできるのか、精度を上げていくようなイメージでしょうか。

日本語を英訳し、英訳したものを再度日本語訳するともとの日本語に戻るかと言われると、そんなことはないと思います。
「これはペンだよ」 → "This is a pen.“ → 「これはペンです。」
みたいな感じで。

コレをなんとか、
「これはペンだよ」 → "★" → 「これはペンだよ」 となるような英語を探すイメージです。

実際には、 りんごの画像(50px×50px)→ 100次元の行列 → りんごの画像(50px×50px)になります。

「りんごの画像」 → "★" → 「りんごの画像」
となるような100次元の行列★を学習する、ということをやっています。

なぜそんなよくわからないことをするのか?
また機会があれば説明しますが、一言で言うなら「特徴量抽出」を行うためです。
(自分もちゃんと理解していないので難しい言葉で逃げました。)

ソースコード公開しています

github.com