AI Case Study Premiere Pro CEP Extension

LocalNarratorTTS

ローカルAIで自分の声のナレーションを生成する

v1.3.0 — テキスト自動分割・連続配置対応

shield

音声データは外部に送信されない。初回モデルDL後はインターネット不要。

record_voice_over

参照音声（自分の声）の声質を再現。汎用合成音声ではない、自分の声で生成。

payments

クラウドTTSの文字数課金なし。一度セットアップすれば何度でも生成可能。

speed

サーバーモードなら10〜15秒で生成完了。クラウドのキューイング待ちなし。

課題

ナレーションが必要になるたびに収録スケジュールを調整する。自宅収録でも、静かな環境の確保、マイクのセッティング、何テイクも録り直し。一般的なクラウドTTSには「自分の声ではない」「音声データが外部に送信される」という2つの問題がある。

自分の声をクローンして、完全にローカルで動作するTTSを作る。

参照音声を選択（自分の声の録音サンプル）

テキスト入力

300文字以上なら自動分割を提案

ローカルAIモデルで音声合成

WAV生成 → Premiere Pro に自動インポート

タイムラインに連続配置（隙間なし）

モード	初回	2回目以降	用途
通常モード	約25秒	約25秒	1〜2回の生成
サーバーモード	約25秒	10〜15秒	大量生成向け

300文字以上のテキストは句点「。」で自動分割。確認ダイアログでセグメント数を表示し、ユーザー確認後に順次生成。各セグメントはタイムラインに隙間なく連続配置される。

5秒ごとに進捗表示:「セグメント 3/10 (45秒経過、残り約105秒)」

日本語英語中国語韓国語フランス語スペイン語ドイツ語

参照音声の声質を保ったまま、異なる言語でナレーション生成が可能。

Apple Silicon / Intel 対応。install.command でワンクリックセットアップ。配布ZIP 約62KB。

Windows 10/11 対応。install_windows.bat でセットアップ。配布ZIP 約60KB。

必要なAIモデルはインストール時に自動ダウンロード。

Adobe拡張機能の開発・AI統合についてお気軽にどうぞ