「打つのが速いからいらない」とおもいがちな音声入力。実はタイピング派こそ、摩擦が減ったときの伸びしろが大きい。僕がMacで使うAqua Voiceを中心にしたワークフローについてお話しします。
音声入力の威力は「速さ」より「摩擦が消える」こと
「音声入力? 打つのが速いから、いまのままでいい」
僕もずっとそうでした。誤変換が気になる。テンポが崩れる。直すのがだるい。だから手を出さなかった。ですが、環境を整えてから一気に逆転した感覚があります。
タイピングが得意な人ほど、音声入力の「本当の効き目」を体験すると動き出すのだと、いまはおもっています。
音声入力の話をすると、「結局、打つのとどっちが速いの?」と聞かれることはあるもので… 正直、タイピングが速い人なら、打鍵スピードだけで比べたら互角か、打つのが上かもしれません。
なので、「速さ」で説得しようとしても、タイピング強者は動かないのですね。
ならば、僕が声を大にしたいのは、別のところです。音声入力は、 「思考の流れを止める摩擦」を減らす道具 だということ。
打鍵する手の動き、いちいち直すストレス、キーボードに向かう姿勢の固さ。そうした「ちょっとした止まり」が、発想の連続性を削いでいる。
音声なら、しゃべりながらそのまま流し込める。結果、発信のテンポが上がる。速さの競争ではなく、 「中断されにくい」体験 が変わるのだとおもっています。

主役/Aqua VoiceをMacで使う理由
僕がMacでメインに使っている音声入力は Aqua Voice です。
一言でいうと、ただの文字起こしじゃなくて「画面が辞書」のように、いま見ている情報を手がかりに精度を上げてくれる。だから固有名詞や文脈のある言い回しでも修正の手間が減って、続きやすい。
単なる文字起こしではなく、いまの作業にそのまま馴染む使い心地が気に入っています。
どのアプリでも自然に使える
Aqua Voiceは、いまフォーカスしている入力欄に、そのまま流し込めるのが強いです。
メモでも、ブログの下書きでも、Xの投稿欄でも、ブラウザの検索窓でも。アプリを切り替えずに、「しゃべる → 貼る」が成立する。
日常の入力の流れのなかで使えるので、 「音声入力モードに切り替える」という一手間がほぼない 感覚です。
加えて、話し言葉を整えてくれるような働きもあります。貼り付けたあと、いつのまにか自然な文章に近づいている。
その「貼り付けたら、いつの間にか直ってる」系の体験により、直す量が減るので、思考が途切れにくいです。
特筆ポイント「画面の情報を読んで精度を上げる」
いちばん「これだ」と感じているのは、 「いま開いている画面の内容を手がかりに、認識精度を上げてくれる」 ところです。
Aqua Voice側の表現を借りると、 “Your screen is its dictionary”(画面が辞書)と明記されています。
つまり、画面上の専門用語や固有名詞を参照して、取りこぼしを減らす方向に働くわけですね。
ブログの下書きを書いているとき、いままで出てきたキーワードや見出しが画面にある。その文脈を読んだうえで変換してくれるので、誤変換が減る。直す量が減る。思考が中断されにくい。
この3点が、僕にとっての「気持ちよさ」になっています。
精度の土台/マイク環境(僕が使っている道具)
音声入力は、 「ノイズを減らす」が正義 だと考えています。
環境を整えると、認識の安定度が一気に変わります。僕が使っている機材を、参考までに書いておきます。
マイク/FIFINE AmpliTank K688W
USB / XLR対応で、単一指向性(カーディオイド)のマイクです。ミュートやゲインまわりがまとまっていて扱いやすく、口元の声を拾いやすい。
余計な生活音をだいぶ削減できるので気遣い不要であり、長くしゃべっても疲れにくいです。
マイクアーム/FIFINE BM88W
ロープロファイル系のアームで、モニターの前を邪魔しにくいタイプです。イメージとして、マイクを上からぶら下げるのではなくて、下から持ち上げるような感じ。
机がすっきりするので、 「毎日使う」継続に効く と感じています。口元との距離がだいたい固定されるので、認識も安定しやすくなります。
仕上げは生成AIで「整形」すると完成が早い
音声入力で出てきたのは、あくまで下書き。ここに 生成AIを「編集者」 としてかませると、完成までの時間がぐっと短くなります。ここは、ChatGPTやGeminiなど、各自のお好きなツールで大丈夫です。
以下は、そのまま貼れる指示の例です。
- 「誤字脱字を直して、話し言葉を自然な文章に整えて」
- 「見出しを付けて、重複を削って、要点が先に来るように並べ替えて」
- 「X投稿用に140字版、ブログ用に1,500字版で書き分けて」
ツールに依存しすぎず、「下書き(ヒト) → 整形(AI)」の役割分担を意識するだけで、クオリティとスピードのバランスが取りやすくなりますね。
ワークフロー例(そのまま真似できる形で)
ブログ
- Aqua Voiceで5〜15分くらいしゃべって、テーマを一気に吐き出す
- 生成AIで整形(見出し・重複削除・語尾の統一など)
- 見出しと流れ(構成)は、じぶんで整える。 ここが僕の味になる部分 なので、手を抜かずにやっています
X・メルマガ
おもいついたら即しゃべる → 整形 → 投稿、の流れです。 「鮮度が落ちないうちに出す」 のが強い。メモでためてから書くより、浮かんだ瞬間に声にしておくと、あとがラクです。
まとめ:タイピング勢ほど、音声入力で発信が加速する
- 速さではなく「摩擦が減る」 ことで、思考の流れが止まりにくくなる
- Aqua Voiceの「画面が辞書」 で、誤変換ストレスが減り、直す量が少なくなる
- マイク環境+生成AI で、下書きから完成までが一気に短くなる
「打つのが速いからいらない」ではなく、打つのが速い人ほど、 「しゃべる → 整える」 に切り替えたときの伸びしろが大きいとおもいます。まずは短いメモやXの下書きから試してみるのがおすすめです。
いま現在、音声入力が主体で発信している方が、はたしてどれほどいるのか? どちらかといえば、少数派な気がします。
今回のお話に関心を持っていただけたようでしたら、あなた自身のワークフローも考えてみるのはいかがでしょうか。
ちなみに、日々の発信については、3日にいちど配信の メルマガ(発信LAB) のほうでもいろいろと話しています。
よかったら、のぞいてみてください(登録無料です!)。

