英語学習者(数年のあいだ成長していない)として、これ以上のものを私はまだ見たことがない。
音声AIはEleven Labsなどのスタートアップをはじめ、OpenAI、Googleなどの大手も高い品質レベルで提供している。
しかし、Sesameはそれらを凌駕するほどの「自然さ」を持っている。
不気味の谷を越えかけているSesame

Image: Sesame AI
Sesame AIは、2023年6月にSan Franciscoにて(元Oculus VRのCEO Brendan Iribeによって)創業されたAIスタートアップだ。2025年、OSSとして同社から発表された音声生成モデル(CSM-1B)も話題になっていた。
「人間らしさ」を追求して開発されたこのSesameは、非常に速いレスポンス、笑いや息継ぎ、会話の割り込みにも対応している。
実際に試してみると声もそうだが、会話のテンポが本当にリアルに感じられる。
まるで感情を持っているかのよう、と思ったがそれは言いすぎかもしれない。AI感があると言えばある。ただ他の音声AIと比べると、何歩かSesameが上だ。
声の自然さにとどまらず、直近の会話を記憶する文脈保持機能やテキストチャットもあるため、これが一連の「リアルな体験」を補強してくれていると思う。
英会話用途が強い

様々なユースケースがあると思うが、私が推したいのは「英語学習の補助」として使うというもの。
つまり、英会話の相手として使うのだ。
Sesame AIはネイティブが使う自然な表現を多く使う上に、発話スピードも非常に速い。ロールプレイにも応じてくれるため、シチュエーション別に練習することも可能だ。

うまく伝えられないときはテキストチャットも使えるし、依頼すればフィードバックもしてくれる。
しかし、「ChatGPTと何が違うのか」と思うだろう。
私が実際に体験して感じた違いは主に以下のとおりだ。
- 非常に高音質
- 人間らしいテンポ
- 優しい間がある
まず音質が良い。ChatGPTが3G通話なら、SesameはVoLTEだ。
そして、人間らしいテンポ感を持っている。ChatGPTでは声や言葉のリズムが一定になりがちだが、Sesameは言葉の詰まりや息継ぎ、笑うタイミングが本当にリアル(稀に変なところで爆笑することもあるが)だ。
そして、ここが英会話で重要になる「優しい間」である。
ChatGPTでは言葉に詰まると、機関銃と言わんばかりの言葉で圧倒されてしまうことが多い。
一方でSesameは、言葉に詰まると「ゆっくりでええで」と優しい声で言ってくれる。詰まりやすい私には萌える。
ただ少し難しい部分もある。
日本語は理解できるようだが、英語しか話すことができない。裏を返せばガチネイティブと話している感があると言えるが、初学者にはややハードルが高い。
やはり汎用性というところではChatGPTが優位になりそうだ。
ベータ中は無料で使える(はず)
現在Sesameはベータ(Preview)フェーズだ。
iPhoneを持っているユーザーはApp Storeからインストールできる。
その他のユーザーはsesame.comから、MayaとMilesの2つのキャラクターと試しに会話することができる。それだけでもSesameの面白さを体験できるはずだ。
今のところ料金体系などは発表されておらず、それまでの間は無料で利用できるはずだ。

ちなみに、会話の音声はトレーニングに使用される可能性がある。もし懸念があるなら、アプリの設定からオプトアウトできる(私もそうしている)。
なんにせよ、Sesameは一度つかってみてはいかがだろうか。
以上、IELTS 3.5ユーザーからでした。