2024年6月20日(日本時間)に発表されたWhat's Newの記事についてまとめた。公式リリース内容を見て記事内容が正しいか確認することをおすすめする。
Amazon SageMaker now offers a fully managed MLflow Capability - AWS
結論
Amazon SageMakerにMLflowの完全管理機能が追加された。データサイエンティストはMLflowの機能を使ってML実験の管理、追跡、分析ができるようになり、管理者はスケーラビリティ、可用性、セキュリティの向上を図れる。
内容
対象サービスの概要
Amazon SageMakerは、機械学習モデルの構築、トレーニング、デプロイを容易に行えるサービス。 MLflowは、機械学習のライフサイクル管理を支援するオープンソースツール。
主な変更点
- SageMakerがMLflowの完全管理機能を提供するようになった
- データサイエンティストはMLflowのSDKを使ってローカルのノートブック、IDE、SageMaker Studioの管理IDEなどから実験を追跡できる
- SageMakerのトレーニングジョブ、プロセシングジョブ、パイプラインでの実験も追跡可能
- MLflowで登録したモデルがSageMaker Model Registryに自動的に表示され、SageMaker Inferenceでデプロイできる
今回の変更で嬉しいこと
- MLflowの設定、管理、セキュリティの手間が不要になる
- 実験の再現性が担保され、ベストなトレーニング反復を見つけやすくなる
- モデルのライフサイクル管理が一元化される
まとめ
Amazon SageMakerにMLflowの完全管理機能が追加されたことで、データサイエンティストの機械学習実験の管理が容易になり、モデルのライフサイクル管理も一元化できるようになった。これにより、機械学習開発の生産性が大幅に向上すると期待できる。
ネタ(会話でWhat's Newを理解しよう)
ワオ、AWSのWhat's newが更新されてますね。新しい機能が追加されたみたいですね。教えてください、どんな内容なんですか?
ほな、説明しとくわ。今回の更新では、SageMakerにMLflowの機能が統合されたんや。MLflowはデータサイエンティストが機械学習の実験を管理するのに使う人気のオープンソースツールやねん。
へぇ、SageMakerでMLflowが使えるようになったんですね。それってどんな効果があるんですか?
まあな、これまでMLflowを使うには、自分でサーバーの設定やアクセス制御を面倒くさいことに設定せなあかんかったんや。でも、今回の更新でSageMakerがMLflowの管理を代わりにしてくれるようになったから、ワンクリックでMLflowが使えるようになったんや。
なるほど、めっちゃ便利やん。それで、データサイエンティストはどんなことができるようになるんですか?
そうやな、データサイエンティストはこれまでと同じようにMLflowのSDKを使って、ローカルのノートブックやIDEから実験を管理できるようになったわ。SageMakerのトレーニングジョブやプロセシングジョブ、パイプラインなどでも実験を追跡できるようになったから、再現性の高い実験ができるようになったんや。
へぇ、めっちゃ便利やん。それと、モデルの管理とかも簡単になったんですか?
ほんまそうやな。MLflowで登録したモデルがSageMakerのモデルレジストリに自動的に反映されるから、一元的なモデルの管理ができるようになったわ。そして、MLflowのモデルをそのままSageMakerのインファレンスにデプロイできるようになったから、めっちゃ楽になったんや。