こんにちは。アイディーエスの大島です。
re:Invent2024のMatt GarmanのKynoteではAmazon Bedrockの新モデルとしてAmazon Novaが発表されました!
今回はそのAmazon Novaを使って画像生成と動画生成を試してみたいと思います。

はじめに

まず始めに、Amazon Novaについてです。
re:Invent2024では複数のNovaのモデルが発表されています。

  1. Amazon Nova Micro:低コストで最も低レイテンシー。テキスト入力のみをサポートする。
  2. Amazon Nova Lite:低コストでマルチモーダルなモデル。テキスト・画像・動画入力をサポートする。
  3. Amazon Nova Pro:精度、速度、コストの最適な組み合わせを備えた高性能なマルチモーダルモデル。 テキスト・画像・動画入力をサポートする。
  4. Amazon Nova Premier:※近日公開
  • Amazon Nova Canvas:画像生成モデル。 テキストと画像入力に対応。
  • Amazon Nova Reel:動画生成モデル。 テキストと画像入力に対応。

今回はこの中のNova CanvasとNova Reelを使って生成していきます。

画像生成

ではまずリージョンをバージニア北部(us-east-1)に変更します。
現在使用できるリージョンはバージニア北部のみとなっています。
はやく東京にも来てほしいですね…

[Amazon Bedrock] > [プレイグラウンド] > [Chat/Text] > [アクセスをリクエスト]を選択します。

希望するモデルを選択してリクエストを行うと、モデルが使用できるようになります。

リクエストを送信すると利用できるようになっていたので、まずは画像生成をしてみたいと思います。

「aws re:Inventの基調講演」として画像を生成してもらいました。15秒ほどで画像が生成され、個人的には ぽい!と思えるよう画像が出てきました。
awsのロゴが入っているのがポイント高いです。日本語もいけるようですね!

また、画像の入力ができたので自分の画像を入れてイラストを作成してもらいました。”イラスト”が伝わっているか微妙ですが、3パターンの顔・背景で作成してくれました。個人的には一番左を採用したいです..

画像のインプットのほかに、以下のパラメータが使用可能でした。

  • プロンプト
  • 画像サイズ
  • 画像数
  • 画像の色
  • プロンプト強度: 最終的な画像がプロンプトをどの程度描写するかを決定する。生成のランダム性を高めるには低い数値を使用する。
  • シード: 生成の「ランダム性」を導くために使用される特定の値。 (このパラメータは、省略するか、ランダムシードを使用する場合は0を渡す。) 範囲: 0 から 4294967295。

動画生成

続いてNova Reelを使用して動画を生成します。
モデルでReelを選択したところ、生成した動画を保存する用のS3が必要とのこと。ここで確認を押すと、自動でBedrockのバケットが作成されました。
作成した動画が自動で保存されるようです。

では動画を生成します。
re:InventのAWSのEXPOにいたS3をダンスさせたいと思います。インプットする画像は1280×720でなければなりません。作成には5分程度かかります。

https://www.sunnycloud.jp/wp-content/uploads/2024/12/S3ダンス.mp4

人が多いので難しそうでしたが、S3は一応ダンスしています(笑)
人や動物は少し難しいみたいですが、観光地の風景を動画にするなどは比較的綺麗に作成できた印象です。
激しい動きの際はプロンプトで細かく制御する必要がありそうですね。

料金

3~4時間ほどNova ReelとCanvasを触って $3.76 でした。
詳しい料金はこちらです。

Amazon Nova Canvas

画像解像度標準品質画像の一枚あたりの価格プレミアム品質画像の 一枚あたりの価格
1024×1024まで$0.04$0.06
2048×2048まで $0.06$0.08

Amazon Nova Reel

ビデオ解像度ビデオ生成1秒あたりの価格
720p, 24fps$0.08

さいごに

Bedrockのできる幅が増えてきましたね。
是非活用してシステムを動かしてみたいです。

最後までお読みいただきありがとうございました!
皆さんも是非re:invent2024アップデート内容を振り返ってみてください!