# OneNote **Repository Path**: du1in9/one-note ## Basic Information - **Project Name**: OneNote - **Description**: 一款基于 Tauri 2.0 + React + Vite 构建的现代化桌面端 AI 文档总结工具。支持 70+ 种主流文档格式,通过 AI 智能解析并一键生成精美的 PDF 总结报告。 - **Primary Language**: Unknown - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-04-23 - **Last Updated**: 2026-04-24 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # OneNote AI 总结工具 (OneNote Summary) 一款基于 **Tauri 2.0 + React 19 + Vite** 深度构建的高性能、多模态桌面端 AI 文档总结专家。 本项目旨在通过先进的本地解析技术与大语言模型(LLM)的结合,为用户提供一个极速、私密且排版精美的文档摘要解决方案。不同于市面上常见的网页端总结工具,OneNote Summary 充分利用了桌面端性能优势,实现了对 **70 种以上** 复杂文档格式的深度解析。 --- ## 💎 核心特性深度解析 ### 1. 全维度格式支持矩阵 (72 种细分格式) 项目内置自研的 **Unified File Processor (UFP)** 引擎,通过策略模式实现了对几乎所有常见文档格式的“原生级”文本提取。 - **专业 Office 支持**: 完美兼容微软 Office (`.docx`, `.pptx`, `.xlsx`) 与国产 WPS (`.wps`, `.dps`, `.et`),即使是包含复杂层级结构的文档也能精准提取。 - **开放文档标准**: 深度适配 OpenDocument 格式 (`.odt`, `.odp`, `.ods`),确保开源社区用户的文档无缝解析。 - **思维导图与绘图**: 支持 `.xmind`, `.drawio`, `.vsdx` 等格式,能够提取其中的节点文字与逻辑结构。 - **代码与配置文件**: 覆盖 20+ 种编程语言(`.js`, `.py`, `.rs`, `.go`, `.sql` 等)及配置文件(`.json`, `.yaml`, `.ini`, `.conf`)。 - **多媒体元数据**: 可识别音频 (`.mp3`, `.flac`) 与视频 (`.mp4`, `.mov`) 的基础信息及元数据。 ### 2. 多模态 AI 视觉理解 (Vision-First) 我们废弃了传统的、对网络环境依赖较强的本地 OCR 方案,转而采用 **Vision 多模态 AI** 技术: - **语义级理解**: AI 不再只是机械地识别图片中的文字,而是能够“观察”图片中的图表趋势、人物关系、场景氛围。 - **异步 Base64 处理**: 采用分片读取与 Base64 异步转换技术,即使是 4K 分辨率的高清大图,读取延迟也控制在 **100ms** 以内。 - **自动触发**: 当检测到图片格式(`.webp`, `.png`, `.jpg` 等)时,系统会自动重构 API 请求包,切换至视觉模型模式。 ### 3. 自研 DOM-Geometry Slicing 打印算法 针对“网页转 PDF 乱码、重复、内容截断”这一行业级痛点,本项目自研了基于 DOM 几何坐标感知的切片算法: - **物理坐标扫描**: 算法会实时扫描预览容器内数千个 DOM 节点的物理边界(Bounding Box)。 - **智能分页决策**: 在 PDF 每页 A4 纸的高度范围内,动态计算最合适的分割点,确保 **100% 消除跨页文字截断**,即文字行不会被从中间切开。 - **2.0x 视网膜采样**: 使用双倍像素缩放技术进行 Canvas 采样,结合 `image/jpeg` 0.95 高质量压缩,生成的 PDF 报告即使在 **400% 放大下** 依然字迹清晰,边缘平滑。 ### 4. 极致的桌面端性能体验 - **资源占用**: 归功于 Rust 与 Tauri 的底层优化,应用启动时间缩短至 **1.2 秒** 以内,空载内存占用仅为 **40MB** 左右。 - **并发调度**: 支持 **5 线程并发处理**,多文档总结时可充分利用多核 CPU 性能。 --- ## 🚀 技术架构与实现原理 ### 1. 前端架构 (React 19 + TypeScript) - **状态管理**: 采用高度解耦的自定义 Hooks (`useFileProcessor`, `useAiSummary`),实现 UI 展现与业务逻辑的彻底分离。 - **UI 设计**: 基于 **Glassmorphism (玻璃拟态)** 哲学,使用 Tailwind CSS 构建了深具沉浸感的半透明界面,配合 `framer-motion` 实现 60FPS 的流畅动画。 ### 2. 后端内核 (Tauri 2.0 / Rust) - **原生文件系统交互**: 利用 Rust 的 `fs` 能力安全地处理用户文件。 - **安全性**: 严格遵循 Tauri 的 `capabilities` 安全策略,所有 API 请求均经过沙箱处理。 ### 3. 数据隐私闭环 - **本地解析**: 所有格式的解析(Zip 解压、XML 过滤、CSV 转换)均在用户本地完成。 - **传输加密**: 仅通过 HTTPS 加密通道将纯文本摘要发送至 AI 接口,**原始二进制文件永远不会离开您的计算机**。 --- ## 📸 界面预览 | 沉浸式主界面 | 智能 API 配置 | | :--- | :--- | | ![主界面](pic/1.png) | ![设置界面](pic/2.png) | | *支持 70+ 格式拖拽导入,玻璃拟态 UI 设计* | *适配所有 OpenAI 兼容接口,配置本地加密存储* | | AI 深度总结中 | PDF 智能报告预览 | | :--- | :--- | | ![生成界面](pic/3.png) | ![结果界面](pic/4.png) | | *多线程并行处理,实时进度反馈* | *智能切片算法,解决 PDF 截断与乱码问题* | --- ## 🛠️ 技术栈清单 (Tech Stack) | 模块 | 技术选型 | 详细描述 | | :--- | :--- | :--- | | **底层内核** | **Tauri 2.0 (Rust)** | 负责跨平台窗口管理、文件系统安全访问 | | **前端框架** | **React 19** | 使用 Concurrent Mode 确保界面在高负载下依然响应灵敏 | | **编程语言** | **TypeScript 5.x** | 全链路类型安全,减少运行时异常 | | **文档处理** | `mammoth`, `pdfjs-dist`, `xlsx`, `jszip`, `epubjs` | 专业级解析库集群,覆盖全格式解析需求 | | **报告生成** | `jsPDF` + `html2canvas` | 配合自研分页算法,实现工业级 PDF 导出 | | **样式方案** | **Tailwind CSS 4.0** | 极速构建高度自定义的现代化视觉界面 | --- ## 🚀 快速开始 ### 开发环境要求 - **Node.js**: 18.0+ - **Rust**: 1.75+ (用于 Tauri 编译) ### 安装与启动 ```bash # 克隆仓库 git clone https://gitee.com/du1in9/one-note.git cd one-note # 安装依赖 npm install # 启动开发服务器 (自动打开预览窗口) npm run dev # 构建正式版本 (生成 .exe 或 .msi) npm run tauri build ``` --- ## 📄 开源协议 本项目基于 **MIT License** 协议开源。欢迎开发者提交 Pull Request 或 Issue,共同完善这款极致的 AI 总结工具。