漢字・固有名詞の誤変換を極限まで抑えた、日本語特化モデル

日本語音声入力が、
やっと使えるようになった。

音声入力を一度試して、精度が微妙で諦めた人へ。Sonophieは日本人エンジニアが「日本語の誤変換をなくす」ために作った音声入力アプリです。漢字・固有名詞の変換精度を徹底的に高めており、話した内容がそのまま使える形になります。同じ精度が、ファイル文字起こしや会議議事録でも活きます。

すでにアカウントをお持ちの方はこちら

THREE MODES, ONE WORKFLOW

音声入力を諦めたのは、精度のせいだったはず。

「えーと」が変な漢字に変換される、社名が別の読みになる、技術用語がひらがなになる。その体験がSonophieを作った理由です。話した言葉を最小限の手直しで使える形に変える——それだけを追求しています。

VOICE INPUT

どのアプリでも、話した言葉がそのまま入る。

ショートカット一発でどのアプリにも音声入力できます。コードコメント、Issueの説明、PR説明文。変換ミスの手直しをほぼせずに、タイピングしていたものがしゃべるだけで済みます。

GmailGoogle DocsSlackNotion

FILE TRANSCRIPTION

同じ精度が、録音ファイルでも活きる。

30分の音声が10秒未満でテキストに変わります。MTGの録音、インタビュー、オンボーディング動画。誤変換が少ないぶん、あとの手直しも最小限で済みます。

MP4MOVMP3WAV

LIVE MEETING

同じ精度が、リアルタイムの会議でも活きる。

ZoomでもMeetでもTeamsでも動作します。高精度だからこそ、「あの発言、なんだっけ」がなくなります。会議後の議事録作業が消えます。

ZoomGoogle MeetMicrosoft TeamsWebex

PRIVACY FIRST

商談も採用面接も、音声で残していい。

LOCAL STORAGE

処理後はデバイスのみ。クラウドに蓄積しない。

音声はAI処理のためにクラウドへ送信されますが、処理後はサーバー側で保存しません。文字起こし結果と音声データはあなたのMac上にのみ存在します。クラウド上に会話データが積み上がることはありません。

NO AI TRAINING

学習には使いません。機密情報も話せます。

あなたの音声・テキストがAIの学習データになることはありません。採用面接、商談、社内MTG、人事評価。センシティブな会話も、Sonophieなら安心して録れます。

データセキュリティのイメージ

FEATURES

精度を高め、手直しをゼロに近づける仕組み。

CUSTOM DICTIONARY

社名・プロダクト名が別の読みになるストレス、ゼロに。

日本語特化モデルに加えて、社名・プロダクト名・人名・技術用語をカスタム辞書に登録できます。一度登録すれば以降の変換に自動で反映。固有名詞の誤変換がほぼなくなります。

カスタム辞書のイメージ

FILLER REMOVAL

「えーと」「あのー」を、なかったことに。

変換精度が高くても、話し言葉のノイズは残ります。フィラーワードを自動で除去し、文字起こし結果をそのままSlackに貼り付けられるクオリティに整えます。

フィラー削除のイメージ

PROMPT-BASED FORMATTING

「議事録にして」「3行でまとめて」で変形。

出力フォーマットをプロンプトで指定できます。議事録、要約、ToDoリスト、メール下書き。変換後の整形作業まで、自動で終わります。

プロンプト整形のイメージ

OFFLINE MODE

社内情報、クラウドに出したくない。

社内規定でクラウド利用が制限されている環境でも、ネット接続が使えない場所でも動くオフラインモードを搭載。Mac上のモデルだけで、同品質の文字起こしが完結します。

FULLY OFFLINE

Wi-Fiゼロでも動く

機内、移動中、ネット規制エリア。インターネット接続なしでAI文字起こしが完結します。

ON-DEVICE MODEL

データがMacの外に出ない

オンデバイス処理のため、音声・テキストはデバイス内で完結。クラウドへのデータ送信がゼロになります。

FLEXIBLE DEPLOYMENT

場面によってクラウドと切り替え

普段はクラウドモデルで高精度に。機密性の高い会議や外出先ではローカルモデルへ切り替えられます。

FAQ

よくある質問

日本語の変換精度は他のツールとどう違いますか?

日本語の固有名詞・漢字に特化したモデルを採用しています。一般的なWhisperベースのツールが誤変換しやすい社名・人名・業界用語の精度を重点的に改善しています。カスタム辞書登録と組み合わせることで、さらに精度を高められます。

30分の動画ファイルは何秒で処理できますか?

目安として、30分の動画ファイルでも10秒未満で処理できます。回線状況や音声品質で前後する場合はありますが、長尺でも待ち時間を極力抑えています。

文字起こし後にLLMで整形できますか?

はい。プロンプトを指定して、文字起こし後のテキストを好きな形に変換できます。議事録、要約、ToDoリスト、メール下書きなど、毎回やっていた整形作業を自動化できます。

オフラインでも本当に使用可能ですか?

はい。オープンソースのwhisper.cppをMac上で直接動かしているため、インターネット接続は不要です。音声データはデバイス外に送信されないため、プライバシーの面でも安心してお使いいただけます。

どんなファイル形式・長さでも使えますか?

はい。ファイル種別や長さの制約をできるだけ意識させないことを前提に設計しています。短いボイスメモから長時間の収録まで同じ流れで扱えます。

会議ツールや入力先アプリに制限はありますか?

特定の会議ツールやアプリに依存しないのが中核価値です。Google Meet、Microsoft Teams、Zoom などの違いに左右されず、音声入力もアプリを問わず使える体験を目指しています。

データは保存されますか?

音声と文字起こしデータは処理のためにクラウドへ送信されますが、保存しない設計です。成果物はユーザーのPC内で保持し、こちら側ではデータを管理しません。

APIやモデルの提供はありますか?

ご要望に応じてご提供できる場合がございます。自社サーバーで完結させたい、既存システムに組み込みたいといったご要件があれば、お問い合わせページよりご相談ください。

iPhoneやAndroid、Windowsでも使えますか?

現在はmacOS版のみ提供しています。iOS・Android・Windows版は開発中です。リリース時にご連絡を希望される方はお問い合わせページよりご登録ください。

PRICING

いまなら、全機能を無料で。

ベータ期間中はすべての機能を制限なしで使えます。使い続けるほどカスタム辞書が育ちます。早めに始めておくのがおすすめです。

BETA

¥0

ベータ期間中・無料・制限なし

  • ファイル文字起こし(無制限)
  • リアルタイム会議・議事録
  • 音声入力(全アプリ対応)
  • フィラー自動除去
  • プロンプト整形・カスタム辞書
  • オフラインモード
無料で始める

話した言葉が、そのまま仕事になる。
まず一度、試してみてください。