機械学習「 SageMakerの強化」が目立つ

Amazon Web Services(AWS)はバーチャルイベントとして年次イベント「AWS re:Invent 2020」を開催しているが、12月7日(米国時間)、Machine Learning, Vice Presidentを務めるSwami Sivasubramanian氏が基調講演を行った。講演内容はAWSが提供する機械学習関連の機能に絞られており、機械学習にまつわる同社の取り組みや新しいサービスの発表が行われた。

機械学習は現在、IT業界においてホットなトピックのひとつだ。さまざまな業界が機械学習を利用している、または利用しようとして取り組みを進めている。これはAWSが提供してきた機械学習関連の新機能のリリース数に如実に現れている。

  • AWS、Machine Learning、Vice President、Swami Sivasubramanian氏

    AWS, Machine Learning, Vice President, Swami Sivasubramanian氏

AWSからリリースされる機械学習関連の新機能の数は年々増加している。AWS re:Invent 2020の開催時点で、機械学習関連の新機能数は2019年を上回っている状況だ。2020年は新型コロナウイルスインシデントの影響でこれまでとは異なる業務形態となった企業が多かったが、そんな状況でも機械学習の利用は拡大している。企業の機械学習に関する関心の高さが伺える。

そして、基調講演においてもいくつもの新機能が発表された。以下に紹介しよう。

SagaMakerの高速化と7つの新機能

Swami Sivasubramanian氏の基調講演で発表された新機能および注目点は、次のとおりだ。

  • Amazon SageMakerでマネージドデータを並列処理化し40%高速化と大規模対応化
  • Amazon SageMaker Clarify
  • Amazon SageMaker Debugger - Deep Profile
  • Amazon SageMaker Edge Manager
  • Amazon Redshift ML
  • Amazon Neptune ML
  • Amazon Lookout for Metrics
  • Amazon HealthLake (プレビュー版)

最後のAmazon HealthLakeはまだプレビュー版という位置づけだが、それ以外は正式なリリースとなる。

AWSは機械学習関連で多種多様なサービスを提供している。ハードウェアレベルからプラットフォームレベルまでさまざまだ。しかし、今年の基調講演からは機械学習のプラットフォームがSageMakerに集約されつつある印象を受けた。

機械学習を活用するには強力なプラットフォームが必要だ。そのプラットフォームとしてSageMakerへの集約が進んでいる感じがする。高速化はその代表的な取り組みであり、さらに新しい機能が追加されている。追加された機能はバイアス検出、ハードウェアリソースに起因する問題の発見、エッジデバイスにおける管理の簡素化など、SageMaker本来の機能を補完するものと言える。SageMakerがプラットフォームとして成熟してきている証に見える。

強化される機械学習

機械学習の問題のひとつに学習時間の長さがある。数時間で済めばよいが、大規模な分散トレーニングを実施しても数日かかるような学習もある。扱うデータが増えると、この問題はより深刻になってくる。機械学習を活用する上では、どのように学習時間を短縮するかが課題と言える。

今回AWSは、Amazon SageMakerで新しいデータ並列処理ライブラリをサポートするようになった。この機能の導入で数百GBから数千GBというデータセットでモデルを簡単にトレーニングできるようになったという。

Amazon SageMaker Clarifyは機械学習モデルのバイアスを検出する機能だ。機械学習ではモデルデータやアルゴリズムに起因するバイアスが発生する可能性がある。Amazon SageMaker Clarifyを使うことでデータの準備段階やモデルのトレーニング後、デプロイされたモデルなどの段階でバイアスを検出することができる。バイアスを検出できると、それに対処することも可能になる。

Amazon SageMaker Debuggerに導入されたDeep Profileはハードウェアリソースの使用で発生した問題を特定するための機能、Amazon SageMaker Edge Managerはエッジデバイスでの機械学習モデルを簡素化する機能だ。いずれも実際に機械学習を活用していくうえで発生する手間や問題を軽減する目的で使用される。

Amazon Redshift MLはSQLでデータウェアハウスから機械学習を予測する機能、Amazon Neptune MLはグラフアプリケーションへ機械学習をもたらす機能、Amazon Lookout for Metricsはメトリックスの異常を検出する機能、Amazon HealthLakeは機械学習機能を使って健康データを扱う機能とされている。

機械学習関連の機能追加が相次ぐ

AWS re:Inventは毎年のことだが、新しいサービスや機能が大量に発表される。Swami Sivasubramanian氏の基調講演では少なくとも7つの新機能が発表されたわけだが、機械学習に関連したサービスはSwami Sivasubramanian氏の基調講演よりも前の段階でいくつも発表されている。今回のre:Inventに限定しても、多くの機械学習関連の機能が追加されたことになる。

AWSはユーザーに対して選択肢をもたらすことを重視しており、必要があれば新しいサービスをローンチするというスタイルを取っている。今回の新機能もユーザーの要望から生まれたものなのだろう。機械学習の機能が要求される機能は今後も増加するものと見られる。