2018年2月8日に Amazon が Amazon Polly を WordPress でも利用できるプラグインを発表しました。
上の音声バーが Amazon Polly を利用して生成された音声になります。
Amazon Polly を使えば上記のような音声バーが自動で生成されて、メディアを音声配信させることも可能となります。
今回は AI を活用した Amazon Polly を WordPress で音声化するための使い方についてご紹介させていただきます。
目次
Amazon Polly とは
画像引用 : Amazon Polly
Amazon Polly とは 文章やテキスト を AI によって自動で音声変換してくれるサービスで、 AWS ( Amazon Web Services )の機能として提供が行われています。
AWSとは、Amazon.comにより提供されているクラウドコンピューティングサービスで、世界的に利用者が多く日本でも個人、法人を問わず多くのユーザーに使われています。
Amazon Polly の 特徴
Amazon Polly の 特徴 は以下の5つがあります。
自然な声
Amazon Polly は数十におよぶ言語と自然な男女の音声を豊富に備えています。
Amazon Polly の流暢なテキスト読み上げで、世界中の皆様のユーザーに高品質の音声出力を提供できます。
音声は日本語の場合には、「Japanese Mizuki」の女性バージョンと「Japanese Takumi」の男性バージョンから選ぶことができます。
音声を保存、再配信
Amazon Polly では、生成した音声を追加料金なしで無制限に再生できます。
音声ファイルは MP3 や OGC などの標準フォーマットで生成し、クラウドで、またはローカルから、アプリやデバイスでのオフライン再生ができます。
リアルタイムストリーミング
リアルな声と会話型のユーザーエクスペリエンスの配信には一貫した速い応答時間が求められます。
Amazon Polly の API に文章を送ると音声をアプリケーションにストリームとして返すため、直ちに音声を再生できます。
音声出力のカスタマイズとコントロール
Amazon Polly の音声を修正してニーズに合わせる – Amazon Polly は辞書と SSML タグをサポートしており、発音、声量、声の高さ、速度などの音声の「相」をコントロールすることができます。
低コスト
Amazon Polly の従量課金制、文字あたり変換の低コスト、無制限の再生は、皆様のアプリケーションに高いコスト効果をもたらします。
使い始めて12ヶ月間は1ヶ月あたり500万文字まで無料ですので、利用を試してみても良いでしょう。
Amazon Polly を WordPress で音声化するための使い方
画像引用 : Amazon Polly WordPress Plugin
Amazon Polly は既に以前からサービスとしてありましたが、2月8日にWordPressのプラグインとして利用できるようになったことから、プログラミングなど不要で使えることになりました。
Amazon Polly のプラグインは、Amazon.comのAWSチームと、WordPressのプラットフォームプロバイダである WP Engine によって共同で設計されたもののようです。
使い方は、上記リンクからプラグインをダウンロードして WordPress の Plugin 画面からアップロードをするか、以下のように Plugin 画面から検索してインストールを行うかの2種類があります。
無事に設定が行えたら、WordPress管理画面の「設定」を押し、「Amazon Polly」を選択。
すると以下のような画面に遷移しますのでAWS access keyとAWS secret keyを入力します。
AWSのkeyを持っていない方は、Amazon Pollyのページ右上から「まずは無料で始める」ボタンを押して、AWSのアカウントを作成してみましょう。
入力フォームの指示通りに入力を行い、途中で認証のためにAmazonから電話着信がありますが、難しい手順はありませんので時間があるときに登録してみてはいかがでしょうか。
Amazon Polly のメリット
Amazon Polly を試してみてメリットになりそうだなと感じたことをまとめてみました。
テキストを自動で音声配信してくれるので手間がかからない
投稿ページの下の方に、上のようなチェックボックスが出てきます。ここにチェックを入れて Voice name を選択すると、保存の度にテキストを自動で音声化してくれるため手間がかからずに音声配信が可能となります。
ポッドキャスト にも対応
ポッドキャスト向けとして、プラグインに Pollycast という機能があり、iTunesのカテゴリ、画像、連絡先電子メール、RSSフィードに含まれるiTunesのパラメータを制御することができるようです。
こちらは試していないのですが、紹介文章として取り上げられておりました。
Amazon Polly のデメリット
一方でAmazon Polly を試してみてデメリットになりそうだなと感じたことをまとめてみました。
保存をするのに時間が長くなってしまう
テキストを自動で保存できる反面、毎回テキストを音声変換するため保存ボタンを押してから実際に保存されるまで時間が長くかかります。
テキストが多ければ多いほど変換時間が長くなる傾向があるでしょう。
一般の記事では音声で聞く人が少なさそう
Amazon Polly の事例では「Eラーニング」や「コンタクトセンター」が取り上げられています。
音声配信することを簡単にできるようになったものの、メディアのような一般の記事を音声として聞きたいユーザーがどれだけいるかが不明で、あまり利用されない可能性が高いのではないかと考えられます。
Amazon Polly に今後期待したいポイント
Amazon Pollyはまだ出始めてさほど時間が経っておらず、ユースケースも限られているため今後期待したいポイントについてまとめてみました。
ラジオ広告のような音声広告の挿入
メディアの場合には広告収入が入る仕組みがあると利用が上がるのではないかと思います。
例えばラジオ広告のような音声広告をアドネットワーク経由で差し込めるとメディア側にメリットが出て来るでしょう。
速度変更
現在の音声バーでは速度の変更が出来ません。実装するには自分で音声バーに速度変更機能を追加しなくてはなりません。
文字を読むよりも音声速度を早めて、早く情報を取得できるようになればユーザーメリットが高まると考えられます。
音声から文字起こし機能の追加
文字から音声変換の逆として、音声から文字起こしをするニーズは昔から多くあります。
既に文字起こしの ソフトウェア や アプリ などがありますが、認識率が低いものや高価なソフトウェアが多く、もっと良い機能で低コストで使えるものがあれば利用したいという方も多いのではないでしょうか。
両方の機能を実装できればさらに利用用途が広がり、サービスに厚みが出ると感じています。
簡単にプラグインで利用ができて、しばらくは無料で使えることからご関心があればインストールして利用してみてはいかがでしょうか。
コメントを残す