デプロイ選択表
製品、デモ、ベンチマーク、社内ワークフローに最短で合う FunASR の使い方を選びます。まず目的を満たす最小の構成から始め、スループット、レイテンシ、連携要件が明確になったら重い runtime に進みます。
クイック判断表
| パス | 向いている用途 | 開始地点 | 運用メモ |
|---|---|---|---|
| Colab notebook | ブラウザでの smoke test、初回評価、共有しやすいデモ | Colab quickstart | ローカル環境は不要。初回実行ではモデルをダウンロードし、GPU runtime の方が高速です。 |
| Python API | Notebook、オフライン処理、最初のモデル評価 | チュートリアル | 最も軽い開始方法。バッチ化、リトライ、ファイル管理は呼び出し側で制御します。 |
| OpenAI 互換 API | 社内音声 API、Agent、Dify/LangChain/AutoGen/n8n 形式のクライアント | OpenAI API · 日本語 quickstart · Python smoke test · JS/TS recipes · Workflow recipes · Gradio demo · Security guide · Postman collection · OpenAPI spec | OpenAI audio API や multipart HTTP node をすでに扱えるアプリ、ワークフローエンジンに最も接続しやすい構成です。 |
| Docker Compose API | 再現可能なローカル smoke test、小規模な社内サービス | OpenAI API Docker docs · Python smoke test | 既定は CPU。コンテナで CUDA を使う前に CUDA 対応の PyTorch/FunASR image を確認します。 |
| Kubernetes API | クラスタ内の社内向け音声 API | Kubernetes template · Python smoke test | 既定は private ClusterIP。広く公開する前に認証、TLS、network policy、GPU scheduling を追加します。 |
| Runtime WebSocket service | ライブ字幕、会議、コールセンターのストリーミング音声 | Runtime docs | 途中結果、endpointing、長時間音声ストリームが重要な場合に選びます。 |
| vLLM acceleration | Fun-ASR-Nano など LLM-based ASR の高スループット推論 | vLLM guide | LLM decoder のスループット向け。非自己回帰 Paraformer には使いません。 |
| MCP server | Claude/Cursor/desktop agent の音声ツール | MCP example | ASR 結果をローカル tool として公開したいときに便利です。 |
| Subtitle generator | 長時間音声や動画から SRT/VTT を生成 | Subtitle generator | 読みやすさが重要な場合は verbose segments と話者ラベルを利用します。 |
| Batch ASR script | アーカイブ、会議録、データセット、繰り返しオフライン処理 | Batch example | 本番運用では queue、manifest、retry log を追加します。 |
| Triton runtime | 専用の高性能 serving | Triton runtime docs | セットアップは重め。すでに Triton/GPU serving を運用しているチーム向けです。 |
よくある選択
5 分で FunASR を試す
ブラウザだけで smoke test するなら Colab quickstart を使います。ローカル作業ではチュートリアルの Python API が最短です。インストール、モデルダウンロード、device selection、出力形式を確認できます。どのモデルから始めるか迷う場合は モデル選択ガイド を見てください。
クラウド転写をローカル API に置き換える
OpenAI 互換 API を使います。まず sensevoice で bash smoke test または Python smoke test を通し、既存 SDK や HTTP クライアントを接続します。クラスタ展開は Kubernetes template から始めます。Dify、n8n、webhook worker には workflow recipes、GUI での API 確認には Postman collection や Gradio demo が使えます。gateway や developer portal には OpenAPI spec と security guide を参照します。
再現可能な container demo
cd examples/openai_api
cp .env.example .env
docker compose up --buildCUDA 対応の PyTorch/FunASR image が確定するまでは CPU mode のまま確認します。
リアルタイム音声を配信する
Runtime WebSocket service を使います。本番前に実音声で chunk size、VAD、endpointing、punctuation、speaker diarization、reconnect、client backpressure を検証してください。
本番前チェックリスト
- 利用する model alias を決め、deployment note に固定します。
- FunASR version、model version、device、CUDA/PyTorch version、Docker image tag、起動コマンドを記録します。
- 短い公開音声で Python smoke test を実行し、少なくとも 1 つの実データでも確認します。Kubernetes では deployment template を使い、まず
kubectl port-forwardで検証します。 - 各 request で audio duration、model、device、latency、response format、error type を記録します。
- 信頼ネットワーク外へ API を出す前に、upload size limit、authentication、TLS、rate limit を追加します。境界設計には security guide を使います。
- Streaming では silence、noise、overlapping speakers、long sessions、reconnect、slow clients をテストします。
issue を開くタイミング
Runtime、Docker、vLLM、Triton、Android、browser、agent integration の問題は Deployment Help を使ってください。deployment path、正確な command/config、logs、model、device、audio characteristics を含めると再現しやすくなります。