# tf-idf_predict_nextword **Repository Path**: Jackson0829/tf-idf_predict_nextword ## Basic Information - **Project Name**: tf-idf_predict_nextword - **Description**: Predict next word of a sentence using tf-idf - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-11-04 - **Last Updated**: 2021-11-04 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # TF-IDF Predict Next Word Predict next word using tf-idf ### File structure + /data 数据文件存放目录 + data.json 公文文件 + stopwords.txt 停用词文件 + load_utils.py 一些工具函数 + get_context_wrod.py 统计出all_word_info.json的程序 + predict_next_word_tfidf.py 利用all_word_info.json的统计数据计算tf-idf,预测下一个词 + all_word_info.json 整个近5w个公文文档(近200w个句子)的统计数据 + word_info.json 用10000个句子统计的缩略版数据,用于简单的测试,加载较快 + readme.md 说明文件,此文件