みなさん、こんばんは。小寺です。
Amazon SageMaker Python SDKのアップデート機能により、ローカルコードが高速変換できるようになりました。
https://aws.amazon.com/about-aws/whats-new/2023/04/amazon-sagemaker-local-ml-code-conversion-jobs/

Amazon SageMaker Python SDKに新しい機能が加わりました!

Amazon SageMaker Python SDK は、Amazon SageMaker で機械学習モデルをトレーニングおよびデプロイするためのオープンソースライブラリです。
先月のアップデートでAmazon SageMaker Python SDK では、IAM ロール、VPC、KMS キーといったパラメータのデフォルト値を設定できるようになりました。

今回ご紹介するアップデートでは、IDE(統合開発環境)とノートブックで作成された機械学習 (ML) コードを、関連するランタイム依存関係と共に、最小限のコード記載でローカルでの変更をAmazon SageMaker トレーニング ジョブとして実行できるようになりました。

アップデートで嬉しいこと

今までML活用される場合には、データ処理とトレーニングモデルの実験を何度か繰り返しアップデートしていくものですよね。 MLコードを実行するときに、使いやすくかつ最小限のコード変更でトライアルを行えると嬉しいのですが、このアップデートでなんと実現に近づきました。

Amazon SageMaker Model Training は、データ サイエンティストが AWS のコンピューティング インフラストラクチャで完全に管理された大規模なトレーニング ジョブを実行するのに役立ちます。
SageMaker Training は、Amazon SageMaker Debugger や Profiler などの高度なツールを使って、大規模なトレーニングジョブをデバッグおよび分析するのにも役立ちます。

本アップデートにより、MLコードを SageMaker Training プラットフォームに数分でオンボードできます。 MLコードに1行のコードを追加するだけで、SageMaker はコードをデータセットとワークスペース環境のセットアップができるようになっています。
また、ジョブを簡単にスケーリングする機能や、Debugger や Profiler などのその他の関連ツールなど、SageMaker Training プラットフォームの主要な機能を利用できます。
なお、前提条件としてローカルの機械学習 (ML) Python コードを、単一ノードの Amazon SageMaker トレーニング ジョブまたは複数の並列ジョブとして実行できます。
このアップデートでは複数のノードにまたがる分散トレーニング ジョブは、リモート関数ではサポートされていません。

まとめ

SageMakerトレーニングジョブとして、お好みのIDEでML コードを実行できるようにする新しい SageMaker Python SDK 機能を紹介させていただきました。