＜メモ＞DeepLearning ニューラルネットワークのチューニング観点

これまで株価予測(RNN)、強化学習(DQN)、画像認識(DNN)と３つやってみました。これまでの経験で、どのハイパーパラメータをチューニングすると効果があるのかメモしました。 ※ほとんど主観と断片的な知識で語っているので、間違いがあればご指摘ください。 …

2017-10-25

＜その他＞10/24 Microsoft主催の「DeepLearningLab」に行ってきた

Deep Learning Lab コミュニティイベント第4回（オンライン配信あり！） - connpass コレに行ってきました。話は結構ビシネス寄りで、とても勉強になりました。聞いたことを箇条書きで記事にしました。（1.取ったメモ内の自分の考えは青文字で書いてま…

2017-10-24

＜メモ＞ゼロから作るDeepLearningの章立て

本記事の目的「DeepLearning初心者による初心者のための読書会」参加者に向けた記事です。随時修正予定です。本記事は、書籍「ゼロから作るDeepLearning」のアジェンダです。書いてあること各章が終わると何ができるようになるか ※私自身は文系でDeepLe…

2017-10-22

＜基礎学習＞10/22 【完成】cartpole問題を強化学習で攻略する7 （＋雑記）

以下の記事の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com 1.やったこと Q-Tableの更新のされかたをデバッグしながら、Q-Tableが-1〜1の間に収まらなくなったらバグとみなしていろいろな…

2017-10-21

＜基礎学習＞10/19-20 cartpole問題を強化学習で攻略する6（＋雑記）

以下の記事の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com 考察 Q-Tableをデバッグ→チューニング報酬を-1〜1にClippingしているのに、Q-Table(報酬の期待値)が-1〜1の間になっていません…

2017-10-18

＜基礎学習＞10/16-18 cartpole問題を強化学習で攻略する5

以下の前回記事の続きです。 kurupical.hatenablog.com cartpoleについては以下をご参照ください。 kurupical.hatenablog.com やったこと割引率の変更(0.95→0.99) ※割引率とは、「将来報酬の期待値をどの程度評価するか」です。結果 timestep(赤線)がゲー…

2017-10-15

＜基礎学習＞10/12-14 cartpole問題を強化学習で攻略する4

前回記事（以下）の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com やったこと TargetNetworkの実装 Q-Tableの更新について、これまでは1gameごとに行っていたのを1epochごとに行うようにし…