# spam_classification **Repository Path**: cserxzm/spam_classification ## Basic Information - **Project Name**: spam_classification - **Description**: 垃圾邮件分类 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 1 - **Created**: 2020-11-06 - **Last Updated**: 2025-05-13 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 垃圾邮件过滤的半监督分类
数据集1:spam 问题描述:train中仅有少量的标签数据,需要完成对test的预测 参考方案1:结合聚类和分类两个方法进行处理 以少量标签信息为中心点,对train中的未标签信息进行聚类,给未标签数据进行预标签; 基于train进行分类器构建,并对test预测 参考方案2: 以少量标签数据作为train,训练多个分类器 利用多个分类器对未标签数据进行预标签,选出其中最可信的标签作为其最终标签 基于train进行分类器构建,并对test预测