lxlpfff (lxlpfff) - Gitee.com

问题描述数据：Million Song Dataset(MSD) https://labrosa.ee.columbia.edu/millionsong/ 作业使用的数据集是公开音乐数据集 Million Song Dataset(MSD) ，它包含来自 SecondHandSongs dataset 、 musiXmatch dataset、Last.fm dataset、Taste Profile subset、 thisismyjam-to-MSD mapping、tagtraum genre annotations 和 Top MAGD dataset 七个知名音乐社区的数据。原始数据集包括： 1. train_triplets.txt：三元组数据（用户、歌曲、播放次数） 2. track_metadata.db：每个歌曲的元数据由于原始数据太大，作业用的数据集只是其中的子集（播放次数最多的10万个用户、播放次数最多的3万首歌曲。数据预处理过程请见DataProcessing.ipynb文件，最后得到的数据文件为：triplet_datase

1 5 0

一、数据说明： Capital Bikeshare （美国Washington, D.C.的一个共享单车公司）提供的共享单车数据。数据包含每天的日期、天气等信息，需要预测每天的共享单车骑行量。二、作业要求： 1. 对数据做数据探索分析（可参考EDA_BikeSharing.ipynb，不计分） 2. 适当的特征工程（可参考FE_BikeSharing.ipynb，不计分） 3. 对全体数据，随机选择其中80%做训练数据，剩下20%为测试数据，评价指标为RMSE。（10分） 4. 用训练数据训练最小二乘线性回归模型（20分）、岭回归模型、Lasso模型，其中岭回归模型（30分）和Lasso模型（30分）需采用5折交叉验证得到最佳正则超参数。 5. 比较用上述三种模型得到的各特征的系数，以及各模型在测试集上的性能。并简单说明原因。（10分）

Python

1 2 1

作业使用tensorflow，构造并训练一个神经网络，在测试机上达到超过98%的准确率。在完成过程中，需要综合运用目前学到的基础知识：深度神经网络激活函数正则化初始化卷积池化并探索如下超参数设置：卷积kernel size 卷积kernel 数量学习率正则化因子权重初始化分布参数数据集下载地址： http://yann.lecun.com/exdb/mnist/ 或 https://storage.googleapis.com/cvdf-datasets/mnist/train-images-idx3-ubyte.gz https://storage.googleapis.com/cvdf-datasets/mnist/train-labels-idx1-ubyte.gz https://storage.googleapis.com/cvdf-datasets/mnist/t10k-images-idx3-ubyte.gz https://storage.googleapis.com/cvdf-datasets/mnist/t10k-labels-id

2 1 0

请在 Pima Indians Diabetes Data Set（皮马印第安人糖尿病数据集）进行分类器练习。需要提交代码文件，并给出必要的结果解释。 1) 训练数据和测试数据分割（随机选择 20%的数据作为测试集）；（ 10 分）见文件：logistic_diabetes.ipynb、svm_diabetes.ipynb、 2) 适当的特征工程（及数据探索）;（10 分）见logistic_diabetes.ipynb、svm_diabetes.ipynb 3) Logistic 回归，并选择最佳的正则函数（L1/L2）及正则参数；（30 分）见logistic_diabetes.ipynb、 4) 线性 SVM，并选择最佳正则参数，比较与 Logistic 回归的性能，简单说明原因。（20 分）见svm_diabetes.ipynb 5) RBF 核的 SVM，并选择最佳的超参数（正则参数、RBF 核函数宽度）；（ 30 分）见svm_diabetes.ipynb

1 1 0

利用LightGBM/XGboost实现Happy Customer Bank目标客户（贷款成功的客户）识别一、任务说明：Happy Customer Bank目标客户识别 https://discuss.analyticsvidhya.com/t/hackathon-3-x-predict-customer-worth-for-happy-customer-bank/3802 1) 文件说明 Train.csv：训练数据 Test.csv：测试数据 2) 字段说明数据集共26个字段: 其中1-24列为输入特征，25-26列为输出特征。 1. ID - 唯一ID（不能用于预测） 2. Gender - 性别 3. City - 城市 4. Monthly_Income - 月收入（以卢比为单位） 5. DOB - 出生日期 6. Lead_Creation_Date - 潜在（贷款）创建日期 7. Loan_Amount_Applied - 贷款申请请求金额（印度卢比，INR） 8. Loan_Tenure_Applied - 贷款申请期限（单位为年） 9. Existi

1 1 0

问题描述学员自己实现一个densenet的网络，并插入到slim框架中进行训练。详情见：https://gitee.com/ai100/quiz-w7-2-densenet tinymind 使用说明：https://gitee.com/ai100/quiz-w7-doc 解题提示 1. 下载数据集：本数据集拥有200个分类，每个分类300张图片，共计6W张图片，其中5W张作为训练集，1W张图片作为验证集。图片已经预打包为tfrecord格式并上传到tinymind上。地址如下： https://www.tinymind.com/ai100/datasets/quiz-w7 2. 模型：模型代码来自： https://github.com/tensorflow/models/tree/master/research/slim；这里为了适应本作业提供的数据集，稍作修改，添加了一个quiz数据集以及一个训练并验证的脚本，实际使用的代码为： https://gitee.com/ai100/quiz-w7-2-densenet；其中nets目录下的densenet.py中已经定义了d

1 0 1

lxlpfff

热门项目

贡献度

动态（访客只能浏览公开仓库的动态）

lxlpfff

热门项目

贡献度

动态 （访客只能浏览公开仓库的动态）

搜索帮助

动态（访客只能浏览公开仓库的动态）