软件质量评论信息挖掘工具的设计与实现的中期报告.docxVIP

下载本文档

2
0
约小于1千字
约 2页
2023-10-07 发布于上海
举报

软件质量评论信息挖掘工具的设计与实现的中期报告.docx

软件质量评论信息挖掘工具的设计与实现的中期报告本文为软件质量评论信息挖掘工具的中期报告，包括了工具设计、实现进度以及存在的问题与思考。设计思路该工具主要针对软件开发过程中涉及到的评论信息进行挖掘分析。设计思路如下： 1. 数据采集：通过爬虫技术，收集各种软件评论信息，并将其进行结构化处理。 2. 数据存储：将采集到的数据存储到数据库中，方便后续处理分析。 3. 基本特征提取：通过自然语言处理技术，提取评论信息中的基本特征，如情感极性、主题词等。 4. 高级特征提取：针对部分特殊场景下需要分析的问题，使用自然语言处理算法，提取对应的高级特征。 5. 数据分析展示：通过数据可视化技术，将分析的结果展示给用户，并提供相应的分析报告。实现进度目前，我们已经完成了数据采集和存储的部分，且提取了评论信息中的情感极性和主题词。我们使用了Python的爬虫框架Scrapy对各类软件应用商店中的评论信息进行了采集，并使用MySQL数据库对采集到的数据进行了存储。我们还实现了情感分析和主题词提取功能，其中情感分析使用了TextBlob库和VADER库进行了对比实验，并选择了VADER库进行结果分析。主题词的提取则是通过使用jieba分词库对评论信息进行了分词，并使用TF-IDF算法进行了关键词提取。存在的问题与思考目前，我们还未实现高级特征提取和数据分析展示的功能。同时，在实现过程中也

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

软件质量评论信息挖掘工具的设计与实现的中期报告.docxVIP