YAML Metadata Warning:empty or missing yaml metadata in repo card
Check out the documentation for more information.
Voice_Assistant.AXERA
ax650板端实时语音对话助手demo
特征
- 支持浏览器麦克风输入和浏览器播放。
- 支持 Web UI 一键启动 VAD / ASR / LLM / TTS 服务,各模块模型网页端切换(暂时只有LLM可选)。
- 支持 DeepSeek 云端大模型服务与本地大模型。
各模块模型
| 模块 | 模型 |
|---|---|
| VAD | SileroVAD / AX-FSMN-VAD |
| ASR | SenseVoiceSmall |
| LLM本地 | Qwen3.5-0.8B-AX650-C128-P1152-CTX2047 |
| LLM云服务 | DeepSeek API |
| TTS | MeloTTS |
LLM 模型
DeepSeek 云服务
需先自行获取 API Key:注册获取链接
本地 LLM
本地 Qwen3.5-0.8B 模型,请手动下载:
下载命令:
cd Voice_Assistant.AXERA
hf download AXERA-TECH/Qwen3.5-0.8B-AX650-C128-P1152-CTX2047 --local-dir models/Qwen3.5-0.8B
目录结构
Voice_Assistant.AXERA/
├── app.py
├── axllm
├── asr_server.py
├── tts_server.py
├── config/
│ └── board_config.yaml
├── models/
│ ├── SenseVoiceSmall/
│ ├── Vad/
│ └── melotts/
├── scripts/
│ ├── run_server.sh
│ ├── run_asr.sh
│ ├── run_llm.sh
│ └── run_tts.sh
├── stageflow/
├── web/
├── vendor/
├── requirements.txt
└── README.md
环境
安装依赖
cd Voice_Assistant.AXERA
pip install -r requirements.txt
安装 pyaxengine
pyaxengine Releases 下载对应版本的 .whl 文件,然后安装:
pip install axengine-x.x.x-py3-none-any.whl
启动 Web 服务
export DEEPSEEK_API_KEY=sk-*(换成你的API Key)
bash scripts/run_server.sh
结果举例:
Starting HTTPS server at https://10.126.29.109:8008
2026-06-30 20:48:25,027 - stageflow.core.gateway - INFO - HTTPS enabled with cert: /root/huyuan/workspace/Voice_Assistant.AXERA/stageflow/cert.pem
INFO: Started server process [110678]
INFO: Waiting for application startup.
INFO: Application startup complete.
INFO: Uvicorn running on https://10.126.29.109:8008 (Press CTRL+C to quit)
浏览器访问:
https://10.126.29.109:8008
网页使用步骤
- 打开 Web UI。
- 选择 VAD / ASR / LLM / TTS,暂时仅LLM可选,默认deepseek。
- 点击「一键启动服务」。
- 点击「开始对话」。
具体如下:
todo
- 增加各模块可选模型
参考
- Downloads last month
- 24
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
