# question-answering **Repository Path**: bigear2021/question-answering ## Basic Information - **Project Name**: question-answering - **Description**: 智能问答系统 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 1 - **Forks**: 0 - **Created**: 2021-09-30 - **Last Updated**: 2022-04-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 智能问答系统 ## 作业要求 在这里我们来搭建一个轻量级智能问答系统,所需要的模块,包括: - 文本预处理:这部分已经帮大家写好,只需要看看代码就可以了。 - 搭建意图识别分类器:这部分也给大家写好了,使用fastText来做的意图识别器 - 倒排表:这部分大家需要自己去创建,同时也需要考虑相似的单词(课程视频中讲过) - 排序:基于倒排表返回的结果,我们再根据余弦相似度来计算query跟候选问题之间的相似度,最后返回相似度最高的问题的答案。这里,我们将使用BERT来表示句子的向量。 ## 文件说明 * QA_main.ipynb:主脚本。 * 智能客服对话系统实验手册.pdf:操作手册。 * fasttext.ipynb:基于FastText的意图分类脚本。 * preprocessor.ipynb:文本预处理脚本。 * Retrieve.ipynb:搭建倒排表脚本。 * 数据源:[project2-QA(阿里云盘)](https://www.aliyundrive.com/s/QrzQdiDbQFt)