デプロイ選択表

製品、デモ、ベンチマーク、社内ワークフローに最短で合う FunASR の使い方を選びます。まず目的を満たす最小の構成から始め、スループット、レイテンシ、連携要件が明確になったら重い runtime に進みます。

クイック判断表

パス	向いている用途	開始地点	運用メモ
Colab notebook	ブラウザでの smoke test、初回評価、共有しやすいデモ	Colab quickstart	ローカル環境は不要。初回実行ではモデルをダウンロードし、GPU runtime の方が高速です。
Python API	Notebook、オフライン処理、最初のモデル評価	チュートリアル	最も軽い開始方法。バッチ化、リトライ、ファイル管理は呼び出し側で制御します。
OpenAI 互換 API	社内音声 API、Agent、Dify/LangChain/AutoGen/n8n 形式のクライアント	OpenAI API · 日本語 quickstart · Python smoke test · JS/TS recipes · Workflow recipes · Gradio demo · Security guide · Postman collection · OpenAPI spec	OpenAI audio API や multipart HTTP node をすでに扱えるアプリ、ワークフローエンジンに最も接続しやすい構成です。
Docker Compose API	再現可能なローカル smoke test、小規模な社内サービス	OpenAI API Docker docs · Python smoke test	既定は CPU。コンテナで CUDA を使う前に CUDA 対応の PyTorch/FunASR image を確認します。
Kubernetes API	クラスタ内の社内向け音声 API	Kubernetes template · Python smoke test	既定は private `ClusterIP`。広く公開する前に認証、TLS、network policy、GPU scheduling を追加します。
Runtime WebSocket service	ライブ字幕、会議、コールセンターのストリーミング音声	Runtime docs	途中結果、endpointing、長時間音声ストリームが重要な場合に選びます。
vLLM acceleration	Fun-ASR-Nano など LLM-based ASR の高スループット推論	vLLM guide	LLM decoder のスループット向け。非自己回帰 Paraformer には使いません。
MCP server	Claude/Cursor/desktop agent の音声ツール	MCP example	ASR 結果をローカル tool として公開したいときに便利です。
Subtitle generator	長時間音声や動画から SRT/VTT を生成	Subtitle generator	読みやすさが重要な場合は verbose segments と話者ラベルを利用します。
Batch ASR script	アーカイブ、会議録、データセット、繰り返しオフライン処理	Batch example	本番運用では queue、manifest、retry log を追加します。
Triton runtime	専用の高性能 serving	Triton runtime docs	セットアップは重め。すでに Triton/GPU serving を運用しているチーム向けです。

よくある選択

5 分で FunASR を試す

ブラウザだけで smoke test するなら Colab quickstart を使います。ローカル作業ではチュートリアルの Python API が最短です。インストール、モデルダウンロード、device selection、出力形式を確認できます。どのモデルから始めるか迷う場合はモデル選択ガイドを見てください。

クラウド転写をローカル API に置き換える

OpenAI 互換 API を使います。まず sensevoice で bash smoke test または Python smoke test を通し、既存 SDK や HTTP クライアントを接続します。クラスタ展開は Kubernetes template から始めます。Dify、n8n、webhook worker には workflow recipes、GUI での API 確認には Postman collection や Gradio demo が使えます。gateway や developer portal には OpenAPI spec と security guide を参照します。

再現可能な container demo

cd examples/openai_api
cp .env.example .env
docker compose up --build

CUDA 対応の PyTorch/FunASR image が確定するまでは CPU mode のまま確認します。

リアルタイム音声を配信する

Runtime WebSocket service を使います。本番前に実音声で chunk size、VAD、endpointing、punctuation、speaker diarization、reconnect、client backpressure を検証してください。

本番前チェックリスト

利用する model alias を決め、deployment note に固定します。
FunASR version、model version、device、CUDA/PyTorch version、Docker image tag、起動コマンドを記録します。
短い公開音声で Python smoke test を実行し、少なくとも 1 つの実データでも確認します。Kubernetes では deployment template を使い、まず kubectl port-forward で検証します。
各 request で audio duration、model、device、latency、response format、error type を記録します。
信頼ネットワーク外へ API を出す前に、upload size limit、authentication、TLS、rate limit を追加します。境界設計には security guide を使います。
Streaming では silence、noise、overlapping speakers、long sessions、reconnect、slow clients をテストします。

issue を開くタイミング

Runtime、Docker、vLLM、Triton、Android、browser、agent integration の問題は Deployment Help を使ってください。deployment path、正確な command/config、logs、model、device、audio characteristics を含めると再現しやすくなります。