re:Invent 2018 3日目 AWS DeepRacer!

f:id:a-shibata_fenrir:20181130173144j:plain

インフラ担当の柴田です! さて、3日目ですが私もフェンリルのロゴにチャレンジしてみたのですが、難しいですね。

今日は、Andy Jassy の Keynote から始まりました!

Andy Jassy Keynote

今年も多くの新サービスが発表されました。 発表されたサービスに付いては木村のブログに任せるとして、私は会場で感じたことについて少しだけ書こうと思います。

AWSが、顧客の本当のニーズは何かについて考え、対話し、そしてサービスを作っているというメッセージを強く感じました。 AWSには多数のサービスがありますが、それぞれ流行っているから用意したではなく、顧客と対話をした結果、本当に求められているのはコレだと分かったのでそれをサービス化したというところに、AWSの人気の秘密があるのかと思いました。

また、面白いと思ったのがハウスバンドが歌う歌詞の中にキーワードがあるという演出

All want it all and I want it now. というキーワードでストレージ周りの発表があったり I’ve been waiting [waiting] And I want to [have you]というキーワードでベストプラクティス系のツールの発表があったり 非常にアメリカっぽいと思いました。

AWS DeepRacer!

さて、Keynoteの中で異彩を放っていたのがAWS DeepRacerでは無いでしょうか? 強化学習を実際に体験できるように、自動運転車のモデルカーを作って、さらにリーグを開催するなんて!

コレは触らないとということで、発表されたばかりのDeepRacerのワークショップに参加しました。

作業内容としては機械学習とDeepRacerについて解説があり、https://github.com/aws-samples/aws-deepracer-workshopsにアップされているドキュメントを元に、提供されたAWSアカウント上で作業していく形でした。(夕方からのワークショップに参加したので実際のマシーンに触る時間は取れませんでした。)

順序通りに進めると途中同じ席にいる人たちとディスカッションする時間があるのですが、幸運なことに私の付いた席は1名を除いて日本語を話せる方々だったので会話もなんとかなりました。

さてDeepRacerの学習ですが、すごく簡単に言うと適当な戦略を実行した結果を、評価関数で評価して評価が良くなる様に戦略を何回も繰り返すというものです。

実際は、用意されている変数を元にpythonのコードでreward(報酬=評価値)を決めるのですが、とりあえず動かす分にはサンプルコードで十分です。 f:id:a-shibata_fenrir:20181201214620p:plain

評価関数が用意できれば、どのぐらいの時間学習させるのかを選択するのですが、大体150分ぐらい試行するのがちょうど良いとのことです。 f:id:a-shibata_fenrir:20181201215014p:plain

Start Trainingを押すと学習が始まります。ml.c5.xlargeのSageMakerインスタンスが立ち上がるのですが、立ち上がりまで6分ほど掛かるようです。

学習中は以下の様にトライをしている様子が動画で配信されます。

f:id:a-shibata_fenrir:20181201214625p:plain

また、学習が終わればEvaluationから、実際作成したモデルでコースを周回するのに掛かる時間を出してくれます。

f:id:a-shibata_fenrir:20181201214629p:plain

実行結果は……遅いですね……

さらに、Workshop参加者にはDeepRacerが貰えると言うことで明日受け取ろうと思います!

現場からは以上です!