[AWS re:Invent 2018] Build, Train, and Deploy ML Models with Amazon SageMaker – AIM410-R #reinvent

AWS

2018.11.28

Topics

 こんにちは。データサイエンスチームのtmtkです。
 11月25日よりはじまったAWS re:Invent 2018に、当社からは私を含む若手エンジニア4人が参加しています。
 この記事では、「Build, Train, and Deploy ML Models with Amazon SageMaker」というワークショップの内容をレポートします。

概要

 セッションカタログから概要を引用します。

Come and help build the most accurate text classification model possible. A fully managed machine learning (ML) platform, Amazon SageMaker enables developers and data scientists to build, train, and deploy ML models using built-in or custom algorithms. In this workshop, you learn how to leverage Keras/TensorFlow deep learning frameworks to build a text classification solution using custom algorithms on Amazon SageMaker. You package custom training code in a Docker container, test it locally, and then use Amazon SageMaker to train a deep learning model. You then try to iteratively improve the model to achieve a higher level of accuracy. Finally, you deploy the model in production so different applications within the company can start leveraging this ML classification service. Please note that to actively participate in this workshop, you need an active AWS account with admin-level IAM permissions to Amazon SageMaker, Amazon Elastic Container Registry (Amazon ECR), and Amazon S3.

 要約すると、SageMakerでテキスト分類モデルを作ってみようというワークショップです。講師はAWSのソリューションアーキテクトのAhmad Khan氏です。

内容

 ワークショップは前半30分ほどで講師からの解説があり、後半90分ほどが個人の作業時間でした。(私は用事があったため、後半30分ほどを残して途中退室しました。)

 解説では関連セッションの紹介、AWSの機械学習系サービスの全体像の紹介、機械学習の解説や、今回取り組む課題についての解説がありました。機械学習の解説としては、NLPとNLU(Natural Language Understanding)の違い(NLPの中で理解の要素があるものがNLU)や、word embedding、neural networkの解説がありました。今回使うword embeddingは学習済みのGloVeを重みを固定して使います。参加者の多くはTensorFlowなどのディープラーニングフレームワークを使ったことがない状態で参加していたようです。
 課題はニュースの分類で、タイトルをつかってビジネス、エンタメ、ヘルスケアなどのジャンルに分類するというものです。課題はGitHubに公開されており、README.mdの指示にしたがっていけばよいです。会場にはチューターが多数いるため、困ったときや疑問が出てきたときはいつでも質問できました。
 参加者にはAWSのクレジット$45分が配られました。

 たった2時間のワークショップでは、機械学習を一からよく理解することも、SageMakerを使いこなせるようになることも難しいと思いますが、私はSageMakerを使ってみる体験ができたため、SageMakerへの心理的な障壁を減らすことができたと思います。また、自分でSageMakerを覚えるときにも、今回の教材を参考にすることができそうです。

tmtk

データ分析と機械学習とソフトウェア開発をしています。 アルゴリズムとデータ構造が好きです。

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら