本記事を10秒でまとめると
AI音声入力ツール「Aqua Voice」が音声で文章を編集できる新機能を発表した。「翻訳」「要約」「箇条書き化」などを声で指示できるようになり、キーボード操作なしで文章作成が可能になる。さらに新音声モデル「Avalon 1.5」を搭載し、ElevenLabs Scribe V2との比較テストで76%の勝率、3倍の速度を記録した。
AI音声入力ツール「Aqua Voice」とは
Aqua Voiceは、AIを活用した音声入力ツールです。MacやWindowsのアプリ上で話した内容をリアルタイムでテキスト化し、さらにAqua Voiceが文章を整形します。
例えば
- 文法の修正
- 句読点の自動追加
- 話し言葉を自然な文章へ変換
などを自動で行うため、単なる音声入力ではなくAIライティング補助ツールとして使われるケースが増えています。
入力速度は一般的なキーボード入力よりも速く、音声入力では1分あたり200ワード以上の入力が可能です。
Aqua Voiceの料金
Aqua Voiceには無料プランと有料プランがあります。
Freeプラン
- 約1000語までの音声入力が可能
- クレジットカード登録なしで利用可能
- 使用感を試すためのトライアル用途
Proプラン
- 月額12.99ドル
- 音声入力の制限がほぼ解除
- 長文執筆や業務用途に対応
- カスタム辞書や高度なAI整形機能を利用可能
無料プランは実質「体験版」に近く、日常的に使う場合はProプランが必要です。
音声で文章を編集する「Voice Editing」機能
今回のアップデートで追加された最大の特徴が、音声による文章編集機能です。
ユーザーは入力済みの文章に対して、次のような指示を声で出すことができます。
- 「スペイン語に翻訳して」
- 「短くまとめて」
- 「箇条書きにして」
従来は 音声入力 → キーボードで編集 という流れが一般的でした。
しかし今回の機能により
音声入力 → 音声編集
という完全音声ベースの執筆フローが可能になります。例えば
- メール作成
- 記事執筆
- AIプロンプト作成
などを、キーボードに触れずに完結できるようになりました。

新音声モデル「Avalon 1.5」搭載
今回のアップデートでは、さらに新しい音声認識モデル Avalon 1.5 が搭載されました。このAvalon 1.5は
- ElevenLabs Scribe V2とのブラインドテストで 76%の勝率
- 処理速度は約3倍
という結果も出ています。Avalonは特に
- AIプロンプト
- コーディング用語
- 専門用語
などの認識精度を高めるよう設計された音声モデルとされています。
Whisper・ElevenLabs・Avalonの違い
現在、音声AIの主要モデルは大きく3系統に分かれています。
Whisper(OpenAI)
特徴
- オープンソース
- 多言語対応
- ローカル実行可能
そのため
- 字幕生成
- 音声文字起こし
- 研究用途
などで最も広く使われる音声AIの基盤モデルです。
ElevenLabs Scribe
特徴
- 非常に高い認識精度
- 文脈理解が強い
- API用途に最適
メディア企業やSaaSで使われることが多く、高精度クラウド音声認識の代表格とされています。
Avalon(Aqua Voice)
特徴
- 音声入力UI特化
- コーディング用語に強い
- AI編集機能と統合
WhisperやScribeが文字起こし用途なのに対し、Avalonは音声入力インターフェースを前提に設計されている点が大きな違いです。
音声AIは「入力ツール」から「作業UI」へ
生成AIの普及により、文章を書く作業はむしろ増えています。生成AIを使いこなしていればいるほど、どうせなら入力の手間を省きたい。それを叶えるのが音声インターフェースです。
実際、現在は
- Whisper
- ElevenLabs
- Aqua Voice
- Wispr Flow
- Superwhisper
など多くの音声AIツールが登場していますが、
音声入力 → AI編集 → 作業完了
というワークフローがある点を考えるとAqua Voiceをまずは試してみることをお勧めします。
キーボード中心のPC操作そのものが変わり、さらなる業務効率化を体験できるはずです。
まとめ
私も以前から愛用しているAqua Voice。音声入力は長年存在する技術ですが、生成AIとの組み合わせによって便利な高性能「入力ツール」から「AIインターフェース」へ進化しました。
是非とも新しい生成AI体験をAqua Voiceとともにしてみるのはいかがでしょうか?
writer:佐伯 美月(AIインサイト編集部)

