2017-10-01から1ヶ月間の記事一覧

<メモ>DeepLearning ニューラルネットワークのチューニング観点

これまで株価予測(RNN)、強化学習(DQN)、画像認識(DNN)と3つやってみました。 これまでの経験で、どのハイパーパラメータをチューニングすると効果があるのかメモしました。 ※ほとんど主観と断片的な知識で語っているので、間違いがあればご指摘ください。 …

<その他>10/24 Microsoft主催の「DeepLearningLab」に行ってきた

Deep Learning Lab コミュニティ イベント 第4回(オンライン配信あり!) - connpass コレに行ってきました。 話は結構ビシネス寄りで、とても勉強になりました。 聞いたことを箇条書きで記事にしました。 (1.取ったメモ内の自分の考えは青文字で書いてま…

<メモ>ゼロから作るDeepLearningの章立て

本記事の目的 「DeepLearning初心者による初心者のための読書会」参加者に向けた記事です。 随時修正予定です。 本記事は、書籍「ゼロから作るDeepLearning」のアジェンダです。 書いてあること 各章が終わると何ができるようになるか ※私自身は文系でDeepLe…

<基礎学習>10/22 【完成】cartpole問題を強化学習で攻略する7 (+雑記)

以下の記事の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com 1.やったこと Q-Tableの更新のされかたをデバッグしながら、Q-Tableが-1〜1の間に収まらなくなったらバグとみなしていろいろな…

<基礎学習>10/19-20 cartpole問題を強化学習で攻略する6(+雑記)

以下の記事の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com 考察 Q-Tableをデバッグ→チューニング 報酬を-1〜1にClippingしているのに、Q-Table(報酬の期待値)が-1〜1の間になっていません…

<基礎学習>10/16-18 cartpole問題を強化学習で攻略する5

以下の前回記事の続きです。 kurupical.hatenablog.com cartpoleについては以下をご参照ください。 kurupical.hatenablog.com やったこと 割引率の変更(0.95→0.99) ※割引率とは、「将来報酬の期待値をどの程度評価するか」です。 結果 timestep(赤線)がゲー…

<基礎学習>10/12-14 cartpole問題を強化学習で攻略する4

前回記事(以下)の続きです。 kurupical.hatenablog.com cartpoleについては、以下の記事を参照ください。 kurupical.hatenablog.com やったこと TargetNetworkの実装 Q-Tableの更新について、これまでは1gameごとに行っていたのを1epochごとに行うようにし…

<基礎学習>10/11 強化学習topics(+雑記)

cartpole問題やっているのですが、いかんせん学習の待ち時間が長いのでその間に強化学習をいろいろ調べていました。 世に出ているスライド読んでみた 深層強化学習の動向 speakerdeck.com 面白かったところ 強化学習をブーストさせる考え方 学習に有用な経験…

<基礎学習>10/8-10/10 cartpole問題を強化学習で攻略する3

前回の記事に引き続き、cartpole問題に取り組んでいます。 kurupical.hatenablog.com 前回からおよそ4時間費やしています。 (最近、「時間家計簿」をつけるようにしています。 ちょっとバタバタしたり怠惰したりして、あまりできませんでした。 時間家計簿…

<基礎学習>10/7 cartpole問題を強化学習で攻略する2 (+雑記)

強化学習を進めました。 (前回の記事:プログラムの骨組みができた) kurupical.hatenablog.com 今日やったこと 以下を行いました。 プログラムの凡ミスを修正 1000データあるなかの1つのデータのみを繰り返し学習させていたという痛恨の凡ミス。 重みの初期…

<基礎学習>10/5-6 cartpole問題を強化学習で攻略する(+雑記)

以前書いた記事の続き kurupical.hatenablog.com 前回は、cartpoleのゲームをテスト的に動かしてみました。 前回に続いて、cartpoleのゲームを強化学習(DQN)で攻略することを目標にプログラムを作ってみました。 ソース構成の考察 ソース構成は以下です。 ag…

<その他>10/4 小ネタ(読書会/AIが演奏会)

読書会やりました 10/4 19:00-22:00に、ゼロから作るDeepLearningの読書会をやりました。 参加者6人でした。 第3章4節まで進みました。 以下、質問について回答いたします。 活性化関数にReLUとかSigmoidとか出てきたけど結局何を使えばいいの? www.proc…

<基礎学習>10/1-3 強化学習 OpenAI Gymでcartpoleゲームのチュートリアル

今は強化学習を勉強しています。 AlphaGoのアルゴリズムにも使われている激アツなやつです。 強化学習を勉強する目的 ロボットの動作を強化学習でやってみたい(知人の手伝い) 投資で強化学習を動かしてみたい(自分がやってるやつ) 今日書くこと 以下について…

<その他>9/28 大阪pythonの会に参加+LTやってみた

退職関係でバタバタしたり卓球の試合でたりでバタバタして、全然更新できていませんでした。。 9/28に、大阪pythonの会に参加しました。 osakapython.connpass.com LTやってみた LT(ライトニングトーク)というものをやってみたので、スライドあげときます…