タイピング派こそ、音声入力で発信が加速する

タイピング派こそ、音声入力で発信が加速する

「打つのが速いからいらない」とおもいがちな音声入力。実はタイピング派こそ、摩擦が減ったときの伸びしろが大きい。僕がMacで使うAqua Voiceを中心にしたワークフローについてお話しします。

目次

音声入力の威力は「速さ」より「摩擦が消える」こと

「音声入力? 打つのが速いから、いまのままでいい」

僕もずっとそうでした。誤変換が気になる。テンポが崩れる。直すのがだるい。だから手を出さなかった。ですが、環境を整えてから一気に逆転した感覚があります。

タイピングが得意な人ほど、音声入力の「本当の効き目」を体験すると動き出すのだと、いまはおもっています。

音声入力の話をすると、「結局、打つのとどっちが速いの?」と聞かれることはあるもので… 正直、タイピングが速い人なら、打鍵スピードだけで比べたら互角か、打つのが上かもしれません。

なので、「速さ」で説得しようとしても、タイピング強者は動かないのですね。

ならば、僕が声を大にしたいのは、別のところです。音声入力は、 「思考の流れを止める摩擦」を減らす道具 だということ。

打鍵する手の動き、いちいち直すストレス、キーボードに向かう姿勢の固さ。そうした「ちょっとした止まり」が、発想の連続性を削いでいる。

音声なら、しゃべりながらそのまま流し込める。結果、発信のテンポが上がる。速さの競争ではなく、 「中断されにくい」体験 が変わるのだとおもっています。

主役/Aqua VoiceをMacで使う理由

僕がMacでメインに使っている音声入力は Aqua Voice です。

一言でいうと、ただの文字起こしじゃなくて「画面が辞書」のように、いま見ている情報を手がかりに精度を上げてくれる。だから固有名詞や文脈のある言い回しでも修正の手間が減って、続きやすい。

単なる文字起こしではなく、いまの作業にそのまま馴染む使い心地が気に入っています。

どのアプリでも自然に使える

Aqua Voiceは、いまフォーカスしている入力欄に、そのまま流し込めるのが強いです。

メモでも、ブログの下書きでも、Xの投稿欄でも、ブラウザの検索窓でも。アプリを切り替えずに、「しゃべる → 貼る」が成立する。

日常の入力の流れのなかで使えるので、 「音声入力モードに切り替える」という一手間がほぼない 感覚です。

加えて、話し言葉を整えてくれるような働きもあります。貼り付けたあと、いつのまにか自然な文章に近づいている。

その「貼り付けたら、いつの間にか直ってる」系の体験により、直す量が減るので、思考が途切れにくいです。

特筆ポイント「画面の情報を読んで精度を上げる」

いちばん「これだ」と感じているのは、 「いま開いている画面の内容を手がかりに、認識精度を上げてくれる」 ところです。

Aqua Voice側の表現を借りると、 “Your screen is its dictionary”(画面が辞書)と明記されています。

つまり、画面上の専門用語や固有名詞を参照して、取りこぼしを減らす方向に働くわけですね。

ブログの下書きを書いているとき、いままで出てきたキーワードや見出しが画面にある。その文脈を読んだうえで変換してくれるので、誤変換が減る。直す量が減る。思考が中断されにくい。

この3点が、僕にとっての「気持ちよさ」になっています。

精度の土台/マイク環境(僕が使っている道具)

音声入力は、 「ノイズを減らす」が正義 だと考えています。

環境を整えると、認識の安定度が一気に変わります。僕が使っている機材を、参考までに書いておきます。

マイク/FIFINE AmpliTank K688W

Amazonの商品リンクはこちら

USB / XLR対応で、単一指向性(カーディオイド)のマイクです。ミュートやゲインまわりがまとまっていて扱いやすく、口元の声を拾いやすい。

余計な生活音をだいぶ削減できるので気遣い不要であり、長くしゃべっても疲れにくいです。

マイクアーム/FIFINE BM88W

Amazonの商品リンクはこちら

ロープロファイル系のアームで、モニターの前を邪魔しにくいタイプです。イメージとして、マイクを上からぶら下げるのではなくて、下から持ち上げるような感じ。

机がすっきりするので、 「毎日使う」継続に効く と感じています。口元との距離がだいたい固定されるので、認識も安定しやすくなります。

仕上げは生成AIで「整形」すると完成が早い

音声入力で出てきたのは、あくまで下書き。ここに 生成AIを「編集者」 としてかませると、完成までの時間がぐっと短くなります。ここは、ChatGPTやGeminiなど、各自のお好きなツールで大丈夫です。

以下は、そのまま貼れる指示の例です。

  • 「誤字脱字を直して、話し言葉を自然な文章に整えて」
  • 「見出しを付けて、重複を削って、要点が先に来るように並べ替えて」
  • 「X投稿用に140字版、ブログ用に1,500字版で書き分けて」

ツールに依存しすぎず、「下書き(ヒト) → 整形(AI)」の役割分担を意識するだけで、クオリティとスピードのバランスが取りやすくなりますね。

ワークフロー例(そのまま真似できる形で)

ブログ

  1. Aqua Voiceで5〜15分くらいしゃべって、テーマを一気に吐き出す
  2. 生成AIで整形(見出し・重複削除・語尾の統一など)
  3. 見出しと流れ(構成)は、じぶんで整える。 ここが僕の味になる部分 なので、手を抜かずにやっています

X・メルマガ

おもいついたら即しゃべる → 整形 → 投稿、の流れです。 「鮮度が落ちないうちに出す」 のが強い。メモでためてから書くより、浮かんだ瞬間に声にしておくと、あとがラクです。

まとめ:タイピング勢ほど、音声入力で発信が加速する

  • 速さではなく「摩擦が減る」 ことで、思考の流れが止まりにくくなる
  • Aqua Voiceの「画面が辞書」 で、誤変換ストレスが減り、直す量が少なくなる
  • マイク環境+生成AI で、下書きから完成までが一気に短くなる

「打つのが速いからいらない」ではなく、打つのが速い人ほど、 「しゃべる → 整える」 に切り替えたときの伸びしろが大きいとおもいます。まずは短いメモやXの下書きから試してみるのがおすすめです。

いま現在、音声入力が主体で発信している方が、はたしてどれほどいるのか? どちらかといえば、少数派な気がします。

今回のお話に関心を持っていただけたようでしたら、あなた自身のワークフローも考えてみるのはいかがでしょうか。

ちなみに、日々の発信については、3日にいちど配信の メルマガ(発信LAB) のほうでもいろいろと話しています。

よかったら、のぞいてみてください(登録無料です!)。

この記事を書いた人

1975年生まれ、横浜在住。税理士、発信者、習慣家。2016年に独立以来、きょうまでブログは毎日更新中。近年は、銀行融資支援を得意な仕事にしている。借りれるうちに借りれるだけ借りよ、が口グセ
現在は1日1万歩以上、ひと月150kmほど走る。趣味は、コーヒーとサウナ、読書、散歩、アニメ。スタバでMacがマジカッコいい!と思い続けてる
くわしいプロフィールはこちら

目次