さくらのクラウドニュース

さくらのクラウドの最新情報や、開発に役立つ技術情報をお届けします。

おしらせ 新機能

【さくらのAI Engine】音声合成(TTS)API」を提供開始

平素よりさくらインターネットに格別のご愛顧を賜り、誠にありがとうございます。
生成AI向け推論API基盤「さくらのAI Engine」において、生成AI向け推論API基盤「さくらのAI Engine」において、テキストを自然な音声として生成する「音声合成(TTS)API(以下、音声合成API)」を、2026年2月26日(木)より提供開始します。

音声合成(Text to Speech)は、入力したテキストを音声として出力する音声生成技術です。音声アシスタントや案内システムなど、幅広い分野で利用が進んでいます。
「さくらのAI Engine」ではこれまで、音声入力および会話生成のAPIを提供してきました。 新たに「音声合成API」が加わったことで、対話型サービスに必要な、音声入力・会話生成・音声合成の一連の処理が国内基盤上で完結できるようになりました。

音声モデルには、第一弾として「ずんだもん」をはじめとするVOICEVOX音声モデルを採用し、多様な音声モデル(話者) から選択した音声合成が可能です。今後も、音声モデルの追加を予定しています。
また、「音声合成API」の提供開始に伴い、「さくらのAI Engine」Playground機能(※1)の改善を行い、ブラウザ上からも 音声合成をより手軽に体験できるようになりました。

詳細は下記をご参照ください。

(※1)生成AIの挙動をブラウザ上からチャット形式で試せる機能

「さくらのAI Engine」から提供開始する「音声合成API」について

概要

「音声合成API」は、実行エンジンにVOICEVOXを採用し、OpenAI Text to Speech API互換の形式で利用可能です。これにより、既存のOpenAI互換APIを利用しているアプリケーションにも組み込むことができます。

主な音声モデル

利用可能なVOICEVOX音声モデルは以下の通りです。
・ずんだもん
・四国めたん
・春日部つむぎ
・冥鳴ひまり
・東北ずん子
・東北きりたん
・東北イタコ
・あんこもん

デモ動画

音声生成デモをYouTubeにて公開しています。
https://youtu.be/I3tjks-SAGQ

詳細

詳細は下記のウェブページをご参照ください。
https://www.sakura.ad.jp/aipf/ai-engine/

「さくらのAI Engine」Playground機能の改善について

概要

「さくらのAI Engine」のPlayground機能は、ブラウザ上で複数モデルの応答を比較しながら確認できる機能です。このたびの「音声合成API」提供により、コード不要で音声合成を試せるようになりました。

追加機能

VOICEVOX開発者 ヒホ(ヒロシバ)さまからのコメント

さくらインターネット様の「さくらのAI Engine」を通じてVOICEVOXをご利用いただけるようになりましたことを、大変嬉しく思っております。VOICEVOXは、テキスト読み上げや歌声合成を提供する音声合成ソフトウェアであり、より手軽にお使いいただける環境を広げたいと、かねてより考えておりました。今回の提供をきっかけに、より多くの皆さまにVOICEVOXを活用いただけることを楽しみにしております。

関連リンク

さくらのAI Engine

引き続き「さくらのAI Engine」をよろしくお願い申し上げます。