# distill-two **Repository Path**: cjy13/distill-two ## Basic Information - **Project Name**: distill-two - **Description**: 两阶段知识蒸馏 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-19 - **Last Updated**: 2025-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 🚀 AI驱动的个性化推荐理由生成系统
[![Python](https://img.shields.io/badge/Python-3.8+-blue.svg)](https://python.org) [![PyTorch](https://img.shields.io/badge/PyTorch-2.0+-red.svg)](https://pytorch.org) [![Transformers](https://img.shields.io/badge/🤗%20Transformers-4.30+-yellow.svg)](https://huggingface.co/transformers) [![FastAPI](https://img.shields.io/badge/FastAPI-0.100+-green.svg)](https://fastapi.tiangolo.com) [![License](https://img.shields.io/badge/License-MIT-purple.svg)](LICENSE) **基于大小模型协同的两阶段知识蒸馏架构,生成个性化推荐理由** [🎯 快速开始](#-快速开始) • [📖 文档](#-文档) • [🎬 演示](#-演示) • [🛠️ API](#️-api-文档) • [🤝 贡献](#-贡献)
--- ## ✨ 项目亮点 🎯 **智能个性化** - 基于用户画像、行为历史和偏好生成定制化推荐理由 🧠 **两阶段蒸馏** - 大模型标注 + 小模型推理,兼顾质量与效率 🚀 **极速推理** - 小模型ms级响应,支持实时推荐场景 📊 **多维评估** - BLEU、ROUGE、BERTScore等多指标评估体系 🔌 **即插即用** - 完整API服务,轻松集成到现有系统 📈 **生产就绪** - 包含监控、日志、缓存等企业级特性 ## 🏗️ 系统架构 ```mermaid graph TB A[用户查询] --> B[用户画像匹配] B --> C{推理模式} C -->|在线推理| D[小模型推理] C -->|离线标注| E[大模型标注] E --> F[Intern-VL3-78B
高质量标注] F --> G[标注数据集] G --> H[知识蒸馏训练] H --> I[Intern-VL3-1B
轻量推理] D --> J[个性化推荐理由] I --> D style F fill:#ff6b6b style I fill:#4ecdc4 style J fill:#45b7d1 ``` ## 🎯 核心特性 ### 🧩 模块化设计 - **阶段1**: 大模型离线标注 (Intern-VL3-78B) - **阶段2**: 小模型在线推理 (Intern-VL3-1B) - **多模态**: 支持文本+图像输入 - **可扩展**: 模块化架构,易于定制 ### 📈 性能优势 - **响应速度**: <100ms 推理延迟 - **吞吐量**: 1000+ QPS 并发处理 - **准确性**: BLEU-4 > 0.65, ROUGE-L > 0.70 - **多样性**: 推荐理由多样性 > 0.80 ### 🛠️ 企业级特性 - **RESTful API**: 完整的 FastAPI 服务 - **容器化**: Docker 一键部署 - **监控告警**: 实时性能监控 - **缓存机制**: Redis 缓存加速 - **日志系统**: 结构化日志记录 ## 🚀 快速开始 ### 环境要求 - Python 3.8+ - CUDA 11.8+ (GPU推理) - 16GB+ RAM - 50GB+ 磁盘空间 ### 一键安装 ```bash # 1. 克隆项目 git clone https://github.com/kngwyc3/recommendation_system123.git cd recommendation_system123 # 2. 创建环境 python -m venv venv source venv/bin/activate # Linux/macOS # venv\Scripts\activate # Windows # 3. 安装依赖 pip install -r requirements.txt # 4. 快速演示 python demo_annotation.py # 大模型标注演示 python demo_training.py # 小模型训练演示 ``` ### 5分钟体验 ```bash # 启动API服务 uvicorn src.api.recommendation_api:app --host 0.0.0.0 --port 8000 # 测试推荐接口 curl -X POST "http://localhost:8000/recommend" \ -H "Content-Type: application/json" \ -d '{ "user_profile": { "user_id": "demo_user", "demographics": {"age_group": "25-35", "gender": "女"}, "interests": ["美妆", "护肤"], "preferences": {"price_range": "中端"} }, "query_text": "推荐一款补水面霜", "doc_text": "这款面霜含有透明质酸,深层补水" }' ``` ## 🎬 演示效果 ### 个性化推荐示例 **👩 用户画像**: 25-35岁女性,护肤爱好者,偏好中高端产品 ```json { "query": "适合干性皮肤的保湿精华", "recommendation": "推荐理由:适合您这个年龄段的女性使用,与您的美妆护肤兴趣完美匹配,品质与价格平衡,性价比优秀。深层补水保湿效果显著。", "confidence": 0.92 } ``` **👨 用户画像**: 18-25岁男性,数码爱好者,注重性价比 ```json { "query": "性价比高的游戏笔记本", "recommendation": "推荐理由:符合年轻男性的需求,符合您对数码科技产品的偏好,价格实惠,适合日常使用。性能强劲,游戏体验出色。", "confidence": 0.88 } ``` ### 性能指标 | 指标 | 大模型标注 | 小模型推理 | 提升 | |------|------------|------------|------| | 响应时间 | 2.3s | 0.08s | **28.8x** | | GPU显存 | 24GB | 2GB | **12x** | | 吞吐量 | 10 QPS | 1200 QPS | **120x** | | 成本 | $0.05/次 | $0.0004/次 | **125x** | ## 📖 文档 - [📚 完整实施指南](docs/step_by_step_guide.md) - 8步详细部署教程 - [🔄 系统流程图](docs/system_flowchart.md) - 5个核心流程图解 - [🛠️ API 文档](http://localhost:8000/docs) - 启动服务后访问 - [📊 评估报告](outputs/evaluation/) - 模型性能评估 ## 🛠️ API 文档 ### 单个推荐 ```bash POST /recommend ``` ### 批量推荐 ```bash POST /recommend/batch ``` ### 健康检查 ```bash GET /health ``` ### 系统统计 ```bash GET /stats ``` 完整API文档: [http://localhost:8000/docs](http://localhost:8000/docs) ## 📁 项目结构 ``` recommendation_system123/ ├── 📂 src/ # 核心源代码 │ ├── 📂 stage1_annotation/ # 大模型标注 │ ├── 📂 stage2_distillation/ # 知识蒸馏训练 │ ├── 📂 api/ # API服务 │ ├── 📂 evaluation/ # 评估模块 │ └── 📂 inference/ # 推理引擎 ├── 📂 data/ # 数据目录 │ ├── 📂 raw/ # 原始数据 │ ├── 📂 processed/ # 处理后数据 │ └── 📂 annotations/ # 标注数据 ├── 📂 models/ # 模型文件 ├── 📂 configs/ # 配置文件 ├── 📂 docs/ # 文档 ├── 📂 scripts/ # 脚本 ├── 📄 demo_annotation.py # 标注演示 ├── 📄 demo_training.py # 训练演示 └── 📄 requirements.txt # 依赖包 ``` ## 🔧 高级配置 ### 自定义模型 ```yaml # configs/config.yaml stage1: model_name: "internlm/intern-vl3-78b" stage2: model_name: "internlm/intern-vl3-1b" distillation: temperature: 4.0 alpha: 0.7 ``` ### 性能调优 ```yaml inference: batch_size: 32 max_length: 512 use_cache: true api: workers: 4 timeout: 30 ``` ## 🧪 测试 ```bash # 运行所有测试 python -m pytest tests/ # 性能测试 python tests/test_performance.py # API测试 python tests/test_api.py ``` ## 📈 监控 ### 实时监控 ```bash # 查看API统计 curl http://localhost:8000/stats # 查看日志 tail -f logs/api.log ``` ### 性能指标 - 推理延迟分布 - QPS监控 - 缓存命中率 - 错误率统计 ## 🤝 贡献 我们欢迎各种形式的贡献! ### 贡献方式 1. 🐛 报告 Bug 2. 💡 提出新功能 3. 📝 改进文档 4. 🔧 提交代码 ### 开发指南 ```bash # 1. Fork 项目 # 2. 创建分支 git checkout -b feature/amazing-feature # 3. 提交更改 git commit -m "Add amazing feature" # 4. 推送分支 git push origin feature/amazing-feature # 5. 创建 Pull Request ``` ## 📄 许可证 本项目采用 MIT 许可证 - 查看 [LICENSE](LICENSE) 文件了解详情。 ## 🙏 致谢 - [Hugging Face Transformers](https://huggingface.co/transformers) - 模型基础框架 - [FastAPI](https://fastapi.tiangolo.com) - API服务框架 - [InternLM](https://github.com/InternLM/InternLM) - 基础大模型 ## 📞 联系我们 - 📧 Email: your.email@example.com - 💬 微信群: [扫码加入] - 🌟 Star 支持项目发展! ---
如果这个项目对您有帮助,请给我们一个 ⭐!