# aha **Repository Path**: dahai0421/aha ## Basic Information - **Project Name**: aha - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-19 - **Last Updated**: 2026-04-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README

English | 简体中文

# aha **轻量 AI 推理引擎 —— 文本、视觉、语音与 OCR 一站式解决方案** aha 是一款基于 Rust 和 Candle 框架构建的高性能跨平台 AI 推理引擎。将最先进的 AI 模型带到您的本地机器——无需 API 密钥，无需云依赖，纯粹、快速的 AI，直接在您的硬件上运行。 ### 支持的模型 | 类别 | 模型 | |------|------| | **文本** | Qwen3, MiniCPM4, LFM2, LFM2.5 | | **视觉** | Qwen2.5-VL, Qwen3-VL, Qwen3.5
LFM2.5-VL, LFM2-VL | | **OCR** | DeepSeek-OCR, DeepSeek-OCR-2, PaddleOCR-VL,
PaddleOCR-VL1.5, Hunyuan-OCR, GLM-OCR | | **ASR** | GLM-ASR-Nano, Fun-ASR-Nano, Qwen3-ASR | | **TTS** | VoxCPM, VoxCPM1.5, VoxCPM2 | | **图像** | RMBG-2.0 (背景移除) | | **嵌入** | Qwen3-Embedding, all-MiniLM-L6-v2 | | **重排序** | Qwen3-Reranker | ## 为什么选择 aha？ - **🚀 高性能推理** - 基于 Candle 框架，提供高效的张量计算和模型推理 - **🔧 统一接口** — 一个工具搞定文本、视觉、语音和 OCR - **📦 本地优先** — 所有处理在本地运行，数据不离境 - **🎯 跨平台** — 支持 Linux、macOS 和 Windows - **⚡ GPU 加速** — 可选 CUDA 支持以获得更快推理 - **🛡️ 内存安全** — Rust 构建，稳定可靠 - **🧠 注意力优化** - 可选 Flash Attention 支持，优化长序列处理 ## 更新日志 ### 2026-04-17 - Qwen3ASR 增加 vad 数据识别 ### 2026-04-16 - 修复 FireRedVAD fsmn 缓存问题 ### 2026-04-15 - 添加 FireRedVAD ### 2026-04-10 - 修复 LiquidAI/LFM2.5-VL-450M chat_template 加载bug ### 2026-04-08 - 添加 VoxCPM2 ### 0.2.5 (2026-04-06) - 添加 qwen3-embedding/qwen3-reranker/all-minilm-l6-v2 ### 2026-04-03 - CLI 更新: 必须指定子命令 - ChatCompletionParameters 新增 repeat_penalty 和 repeat_last_n 参数 - 生成添加重复惩罚代码 ### 2026-04-02 - 重构生成代码 - \...\ 思维链内容使用reasoning_content字段返回。 - 对话返回添加耗时信息 **[查看完整更新日志](docs/changelog.zh-CN.md)** → ## 快速开始 ### 安装 ```bash git clone https://github.com/jhqxxx/aha.git cd aha cargo build --release ``` **可选特性：** ```bash # CUDA (NVIDIA GPU 加速) cargo build --release --features cuda # Metal (Apple GPU 加速，适用于 macOS) cargo build --release --features metal # Flash Attention (更快推理) cargo build --release --features cuda,flash-attn # FFmpeg (多媒体处理) cargo build --release --features ffmpeg ``` ### CLI 快速参考 ```bash # 列出所有支持的模型 aha list # 仅下载模型 aha download -m Qwen/Qwen3-ASR-0.6B # 下载模型并启动服务 aha cli -m Qwen/Qwen3-ASR-0.6B # 直接运行推理（无需启动服务） aha run -m Qwen/Qwen3-ASR-0.6B -i "audio.wav" # 本地运行 all-MiniLM-L6-v2 向量模型（原生 safetensors） aha run -m all-minilm-l6-v2 -i "Rust embedding test" --weight-path D:\model_download\all-MiniLM-L6-v2 # 仅启动服务（模型已下载） aha serv -m Qwen/Qwen3-ASR-0.6B -p 10100 ``` ### 对话 ```bash aha serv -m Qwen/Qwen3-0.6B -p 10100 ``` 然后使用统一(兼容 OpenAI)的 API： ```bash curl http://localhost:10100/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "Qwen/Qwen3-0.6B", "messages": [{"role": "user", "content": "你好！"}], "stream": false }' ``` ## 文档 | 文档 | 描述 | |------|------| | [快速入门](docs/getting-started.zh-CN.md) | aha 入门指南 | | [安装指南](docs/installation.zh-CN.md) | 详细安装说明 | | [CLI 参考](docs/cli.zh-CN.md) | 命令行界面 | | [API 文档](docs/api.zh-CN.md) | 库与 REST API | | [支持的模型](docs/supported-models.zh-CN.md) | 可用的 AI 模型 | | [核心概念](docs/concepts.zh-CN.md) | 架构与设计 | | [开发指南](docs/development.zh-CN.md) | 贡献指南 | | [更新日志](docs/changelog.zh-CN.md) | 版本历史 | ## 开发 ### aha 作为库使用 > cargo add aha ```rust # VoxCPM示例 use aha::models::voxcpm::generate::VoxCPMGenerate; use aha::utils::audio_utils::save_wav; use anyhow::Result; fn main() -> Result<()> { let model_path = "xxx/openbmb/VoxCPM-0.5B/"; let mut voxcpm_generate = VoxCPMGenerate::init(model_path, None, None)?; let generate = voxcpm_generate.generate( "太阳当空照，花儿对我笑，小鸟说早早早".to_string(), None, None, 2, 100, 10, 2.0, false, 6.0, )?; let _ = save_wav(&generate, "voxcpm.wav")?; Ok(()) } ``` ### 扩展新的模型 - 在src/models/创建新模型文件 - 在src/models/mod.rs中导出 - 在src/exec/中添加支持cli运行模型推理 - 在tests/中添加测试和示例 ## 特性 - 基于 Candle 框架的高性能推理 - 多模态模型支持（视觉、语言、语音） - 简洁易用的 API 设计 - 最小化依赖，紧凑的二进制文件 - Flash Attention 支持长序列处理 - FFmpeg 支持多媒体处理 ## 许可证 Apache-2.0 — 详见 [LICENSE](LICENSE) ## 致谢 - [Candle](https://github.com/huggingface/candle) - 优秀的 Rust 机器学习框架 - 所有模型作者和贡献者 ## 微信 & 捐赠

| 微信群 | 捐赠 | |--------------|--------| | ![Wechat Group](./assets/img/aha_weixinqun.png) | ![Donate](./assets/img/donate.png) |

---

_{由 aha 团队用 ❤️ 构建}

_{我们持续扩展支持的模型列表，欢迎贡献！}

_{如果这个项目对你有帮助，请给我们一个 ⭐ Star！}