こんにちは。小寺です。インフォグラフィック動画を作ろうかと思い立ち過去に公開してある動画から、Transcribeで「トランスクリプション」を作ってみました。

利用した動画 です。22分26秒くらいの自社部分を抜き出します。

準備としてS3へmp4ファイルをアップロードしておきます。Amazon Transcribeから「トランスクリプションジョブ」を作成します。

ジョブ名は「mytranscription」にして、言語設定は「日本語」を選びます。モデルタイプについて、今回は「一般的なモデル」を選びました。

入力用にあらかじめS3にアップロードしておいたmp4ファイルを選びます。

出力データは、Transcribe側で指定したバケットにしました。字幕ファイルの形式は2つともチェックをつけます。

  • SRT(SubRip Text): 一般的に字幕ファイルと呼ばれる、テキスト形式のファイルで 動画編集ソフトに追加して利用できるようです。
  • VTT(WebVTT):  Web Video Text TrackはWebページ上で再生される音声や動画に、字幕やキャプションなどの時系列に表示する文字情報です。

開始インデックスは0か1が選べます。迷ったのですが、どの値を使用すべきか分からない場合に該当なので、「1」を選びました。

OutputStartIndex

Amazon Transcribe のデフォルトの開始インデックスはです。これは0、広く使用されている標準のとは異なります1。どの値を使用すべきかわからない場合は、他のサービスとの互換性が向上する可能性があるため1、選択することをお勧めします。

https://docs.aws.amazon.com/ja_jp/transcribe/latest/APIReference/API_Subtitles.html

オプション設定は特になしとします。「ジョブを作成」をクリックします。

トランスクリプションジョブが正常に作成されました。

数分待つと作成完了になります。トランスクリプションのプレビューの「テキスト」欄にテキスト表示がされます。

ダウンロードからファイルのダウンロードが可能です。

結果を確認します。「AWS」(エイダブリュエス)のところが滑舌が悪く、修正が必要な感じですが、その他は正確にテキストとして利用できるようになりました!

「AWSプレス」になっているパターンが一番多いですね。。

いつもLTなど登壇時にみなさんは、セリフとして文字書き起こしていますか?全く書いていなかったので、出来た動画から書き起こす作業をTranscribeで試してみました。

見返してみたら重複が多いので、LTのブラッシュアップ等に他の動画でも試してみようと思います。