何が起きたか
OpenAIが2026年6月26日、ChatGPTの音声入力(ディクテーション)に新しい音声認識モデルを導入したと発表した。公式のリリースノートによると、主要な言語で「word error rate—a standard measure of transcription accuracy—was at least 10% lower」、つまり文字起こしの正確さを測る指標である誤認識率が、少なくとも10%低くなったとされている。あわせて、騒がしい環境や、複数の言語が混じった話し方でも聞き取りやすくなったという。この改善は特定の有料プランに限らず、全プラン(across all plans)に適用される。
生活で何が変わるか
音声入力は、料理や洗い物で手がふさがっているときや、歩きながら思いついたことをメモしたいときに便利な機能。ただ、これまでは固有名詞や早口だと誤変換が多くて、結局あとで打ち直すこともあった。今回は「誤認識が減る」方向の地味な改善なので、話しかけてメモを取る・下書きを作るといった使い方の当たり外れが少し減ることが期待できる。うちだと、献立や買い物メモを口頭で放り込む場面で試してみたい。無料プランでも使えるというのが、気軽に試せてありがたいところ。
親方の一言
音声入力って「便利そうだけど誤変換の直しが面倒」で、結局使わなくなりがちな機能だと思う。だから精度が上がるという地味な改善は、実は使い続けられるかどうかを左右する大事なところだなと感じる。まずはいつものメモ書きを声でやってみて、打ち直しの回数が本当に減るか、様子を見てみようと思う。
