【AWS Summit Tokyo 2018】AWS の機械学習サービス入門 レポート

AWS

2018.6.4

Topics

先日お話しした通り、AWS Summit Tokyo 2018 で5月31日におこなわれた「AWS の機械学習サービス入門」セッションに参加してきました。

セッション紹介と登壇者

川村 誠
アマゾン ウェブ サービス ジャパン株式会社 技術統括本部 ソリューションアーキテクト
AWS re:Invent 2017 で拡張された機械学習/深層学習サービス群の今と、サービスレイヤーを中心としたアップデートについてご紹介します。
引用元:AWS Summit Tokyo 2018 セッション一覧

実際のアジェンダもAWSが提供する様々な機械学習サービスを簡単に説明する構成でした。
全体的なラインナップを表でまとめると以下のような感じになります。

大カテゴリ 小カテゴリ サービス名 リリース状況(東京) 日本語対応
コンピュータビジョン 画像認識 Amazon Rekognition Image
動画認識 Amazon Rekognition Video
音声 Text-to-Speech Amazon Polly
Speech-to-Text Amazon Transcribe
自然言語 自然言語理解 Amazon Comprehend
テキスト翻訳 Amazon Translate
チャットボット Amazon Lex

 
では、さっそく内容を紹介していきたいと思います。
 

Amazon Rekognition Image

深層学習に基づく画像認識サービスで、レスポンス(JSON形式)の中身にTimestampがついており、どの時点で認識されたのか把握可能。

・物体とシーンの検出:画像内の物体に対するラベルと信頼スコアを取得
・顔分析:画像内の顔の位置を検出し、感情・ポーズなど顔属性を分析
・顔照合:2つの画像の顔が同一人物である可能性を推定
・顔認識:大規模な顔コレクションと類似する特徴量を持つ顔を発見
・他に有名人認識やラベル認識等も可能

 

Amazon Rekognition Video

S3に蓄積された動画やライブストリーミング動画に対して様々な分析機能を提供するサービス。

・動画のリアルタイム解析
・個人の識別と追跡
・顔認識・分析
・物体、シーン、操作の検出
・動画にタグを付けて検索しやすくするユースケースあり

 

Amazon Polly

深層学習機能を利用した人間の声に近いテキスト読み上げ(Text-to-Speech)サービス。

・音声のカスタマイズが可能
・合成した音声の保存と配信や再利用が可能

 

Amazon Transcribe

音声をテキストに変換(Speech-to-Text)できるマネージドな自動音声認識サービスで、発話されたタイムスタンプと書き起こしの信頼度を出力。現在は英語とスペイン語のみ対応。

・S3に保存されているオーディオファイルからテキスト取得可能
・通常音声と電話音声の両方をサポート
・複数話者を認識
・ミーティング議事録を生成するユースケースあり

 

Amazon Comprehend

機械学習を利用してテキスト内でインサイトや関係性を検出する自然言語処理(NLP)サービス。英語とスペイン語のみ対応。

・エンティティの抽出:人、場所、位置などのエンティティを信頼スコア付きで取得
・キーフレーズの抽出:キーフレーズや会話のポイントを取得
・言語の認識:テキストの主要言語を取得
・感情分析:ドキュメントの感情(肯定的、否定的、中立的)を取得
・トピックモデリング:ドキュメントをトピックごとに整理

 

Amazon Translate

多言語間翻訳サービスで、通常のテキストに加えて、HTMLのような構造化テキストにも対応。

・30語以下であればリアルタイム翻訳可能
・IAMやSSL、S3暗号化などAWSのセキュリティが適用

 

Amazon Lex

音声やテキストを使用した対話型インターフェイス(チャットボット)を簡単に開発できる環境を提供するサービス。Amazon Alexaと同じ技術を採用。以下の5つの構成要素で構成。

・Intents:ユーザーの自然言語に応答するシナリオ
・Utterances:intentを発動させるフレーズ
・Slots:intentを満たすために要求されるデータ
・Prompt:slotを引き出すためのフレーズ
・Fulfillment:intentを実現するビジネスロジック

 
サービスの紹介は以上となりますが、おまけとして以下の商品が紹介されました。

Amazon DeepLens

世界初の開発者向け深層学習対応のビデオカメラ。

・クラウドに動画をストリーミングすること無しに、カメラ上で深層学習を実行することが可能
・Amazon SageMakerとAWS Lambdaと統合されている
・Apache MXNet / Tensorflow / Caffeを含む様々な深層学習フレームワークを実行できる

まとめ

Amazonは機械学習分野に継続的に投資し、様々な機械学習サービスを提供し続けています。
このようなサービスを利用してアプリケーションにインテリジェンスを追加しましょう。
 

jws

データサイエンスチームでBIや分析案件の対応を行っています。MMORPGを含め、Civilization、XCOM、Football Manager、League of Legendsなどのゲームが好きです。

Recommends

こちらもおすすめ

Special Topics

注目記事はこちら