YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

Voice_Assistant.AXERA

ax650板端实时语音对话助手demo

特征

  • 支持浏览器麦克风输入和浏览器播放。
  • 支持 Web UI 一键启动 VAD / ASR / LLM / TTS 服务,各模块模型网页端切换(暂时只有LLM可选)。
  • 支持 DeepSeek 云端大模型服务与本地大模型。

各模块模型

模块 模型
VAD SileroVAD / AX-FSMN-VAD
ASR SenseVoiceSmall
LLM本地 Qwen3.5-0.8B-AX650-C128-P1152-CTX2047
LLM云服务 DeepSeek API
TTS MeloTTS

LLM 模型

DeepSeek 云服务

需先自行获取 API Key:注册获取链接

本地 LLM

本地 Qwen3.5-0.8B 模型,请手动下载:

下载命令:

cd Voice_Assistant.AXERA
hf download AXERA-TECH/Qwen3.5-0.8B-AX650-C128-P1152-CTX2047 --local-dir models/Qwen3.5-0.8B

目录结构

Voice_Assistant.AXERA/
├── app.py
├── axllm
├── asr_server.py
├── tts_server.py
├── config/
│   └── board_config.yaml
├── models/
│   ├── SenseVoiceSmall/
│   ├── Vad/
│   └── melotts/
├── scripts/
│   ├── run_server.sh
│   ├── run_asr.sh
│   ├── run_llm.sh
│   └── run_tts.sh
├── stageflow/
├── web/
├── vendor/
├── requirements.txt
└── README.md

环境

安装依赖

cd Voice_Assistant.AXERA
pip install -r requirements.txt

安装 pyaxengine

pyaxengine Releases 下载对应版本的 .whl 文件,然后安装:

pip install axengine-x.x.x-py3-none-any.whl

启动 Web 服务

export DEEPSEEK_API_KEY=sk-*(换成你的API Key)
bash scripts/run_server.sh

结果举例:

Starting HTTPS server at https://10.126.29.109:8008
2026-06-30 20:48:25,027 - stageflow.core.gateway - INFO - HTTPS enabled with cert: /root/huyuan/workspace/Voice_Assistant.AXERA/stageflow/cert.pem
INFO:     Started server process [110678]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on https://10.126.29.109:8008 (Press CTRL+C to quit)

浏览器访问:

https://10.126.29.109:8008

网页使用步骤

  1. 打开 Web UI。
  2. 选择 VAD / ASR / LLM / TTS,暂时仅LLM可选,默认deepseek。
  3. 点击「一键启动服务」。
  4. 点击「开始对话」。

具体如下:

Web UI

todo

  • 增加各模块可选模型

参考

Downloads last month
24
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support