# happy_llm **Repository Path**: arreboies/happy_llm ## Basic Information - **Project Name**: happy_llm - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-24 - **Last Updated**: 2025-10-27 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## chapter5 - GQA 是多个 Q 共享一个 KV - 旋转嵌入是 LLaMA2 模型中的一个重要组件,它可以为注意力机制提供更强的上下文信息,从而提高模型的性能 - 在旋转嵌入中,通过 torch.arange(0, dim, 2)[: (dim // 2)].float() 生成一个序列,其中 dim // 2 主要是为了保证在 dim 为偶数时,生成的序列长度为 dim // 2,在 dim 为奇数时,生成的序列长度为 (dim // 2) + 1 对比项,view(),reshape() 是否可能失败,✅ 可能(非连续时),❌ 不会失败 是否可能复制数据,❌ 不会(失败就报错),✅ 会(当非连续时) 安全性,低(需用户保证连续),高(自动处理) 性能,最优(零拷贝),可能有拷贝开销 推荐使用场景,内部确定连续的代码,通用接口、不确定输入时 - PyTorch 的广播规则要求:从后往前对齐,不匹配的维度必须是 1 或缺失 -