デプロイ選択表

製品、デモ、ベンチマーク、社内ワークフローに最短で合う FunASR の使い方を選びます。まず目的を満たす最小の構成から始め、スループット、レイテンシ、連携要件が明確になったら重い runtime に進みます。

クイック判断表

パス向いている用途開始地点運用メモ
Colab notebookブラウザでの smoke test、初回評価、共有しやすいデモColab quickstartローカル環境は不要。初回実行ではモデルをダウンロードし、GPU runtime の方が高速です。
Python APINotebook、オフライン処理、最初のモデル評価チュートリアル最も軽い開始方法。バッチ化、リトライ、ファイル管理は呼び出し側で制御します。
OpenAI 互換 API社内音声 API、Agent、Dify/LangChain/AutoGen/n8n 形式のクライアントOpenAI API · 日本語 quickstart · Python smoke test · JS/TS recipes · Workflow recipes · Gradio demo · Security guide · Postman collection · OpenAPI specOpenAI audio API や multipart HTTP node をすでに扱えるアプリ、ワークフローエンジンに最も接続しやすい構成です。
Docker Compose API再現可能なローカル smoke test、小規模な社内サービスOpenAI API Docker docs · Python smoke test既定は CPU。コンテナで CUDA を使う前に CUDA 対応の PyTorch/FunASR image を確認します。
Kubernetes APIクラスタ内の社内向け音声 APIKubernetes template · Python smoke test既定は private ClusterIP。広く公開する前に認証、TLS、network policy、GPU scheduling を追加します。
Runtime WebSocket serviceライブ字幕、会議、コールセンターのストリーミング音声Runtime docs途中結果、endpointing、長時間音声ストリームが重要な場合に選びます。
vLLM accelerationFun-ASR-Nano など LLM-based ASR の高スループット推論vLLM guideLLM decoder のスループット向け。非自己回帰 Paraformer には使いません。
MCP serverClaude/Cursor/desktop agent の音声ツールMCP exampleASR 結果をローカル tool として公開したいときに便利です。
Subtitle generator長時間音声や動画から SRT/VTT を生成Subtitle generator読みやすさが重要な場合は verbose segments と話者ラベルを利用します。
Batch ASR scriptアーカイブ、会議録、データセット、繰り返しオフライン処理Batch example本番運用では queue、manifest、retry log を追加します。
Triton runtime専用の高性能 servingTriton runtime docsセットアップは重め。すでに Triton/GPU serving を運用しているチーム向けです。

よくある選択

5 分で FunASR を試す

ブラウザだけで smoke test するなら Colab quickstart を使います。ローカル作業ではチュートリアルの Python API が最短です。インストール、モデルダウンロード、device selection、出力形式を確認できます。どのモデルから始めるか迷う場合は モデル選択ガイド を見てください。

クラウド転写をローカル API に置き換える

OpenAI 互換 API を使います。まず sensevoice で bash smoke test または Python smoke test を通し、既存 SDK や HTTP クライアントを接続します。クラスタ展開は Kubernetes template から始めます。Dify、n8n、webhook worker には workflow recipes、GUI での API 確認には Postman collectionGradio demo が使えます。gateway や developer portal には OpenAPI specsecurity guide を参照します。

再現可能な container demo

cd examples/openai_api
cp .env.example .env
docker compose up --build

CUDA 対応の PyTorch/FunASR image が確定するまでは CPU mode のまま確認します。

リアルタイム音声を配信する

Runtime WebSocket service を使います。本番前に実音声で chunk size、VAD、endpointing、punctuation、speaker diarization、reconnect、client backpressure を検証してください。

本番前チェックリスト

  • 利用する model alias を決め、deployment note に固定します。
  • FunASR version、model version、device、CUDA/PyTorch version、Docker image tag、起動コマンドを記録します。
  • 短い公開音声で Python smoke test を実行し、少なくとも 1 つの実データでも確認します。Kubernetes では deployment template を使い、まず kubectl port-forward で検証します。
  • 各 request で audio duration、model、device、latency、response format、error type を記録します。
  • 信頼ネットワーク外へ API を出す前に、upload size limit、authentication、TLS、rate limit を追加します。境界設計には security guide を使います。
  • Streaming では silence、noise、overlapping speakers、long sessions、reconnect、slow clients をテストします。

issue を開くタイミング

Runtime、Docker、vLLM、Triton、Android、browser、agent integration の問題は Deployment Help を使ってください。deployment path、正確な command/config、logs、model、device、audio characteristics を含めると再現しやすくなります。