通用数据挖掘系统概要设计.pdfVIP

下载本文档

0
0
约9.67千字
约 11页
2025-05-02 发布于北京
举报
版权申诉

通用数据挖掘系统概要设计.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

/var/adm/wtmpx；在我们的程序中该文件也可以是程序外部指定的另一个文件。我们的程序

需要提取该文件的数据来匹配出用户登入/登出的记录，并将其作为将来的依据。

用户登入记录：在登录日志文件中记录的用户登入Unix系统的日志记录，该日志记录包含

用户的登录名，用户登入Unix的时刻，登录的终端机器IP等信息。

用户登出记录：在登录日志文件中记录的用户登出Unix系统的日志记录，该日志记录包含

用户的登录名，用户登出Unix的时刻，登录的终端机器IP等信息。我们需要将用户的登入

记录和登出记录匹配起来，得到一条条完整的登录信息，并计算出用户本次登录的时长。

用户的登录记录：将用户的登入记录和登出记录按照对应关系匹配起来，形成一条完整的登

录记录，登录记录中包含以下信息：用户登录名，登入时刻，登出时刻，登录时长，登录终

端机器IP等。

匹配的登入/登出记录：等同于用户的登录记录。

未匹配的登入记录：在登录日志文件中理论上一条登入记录跟一条登出记录匹配，但有可能

在我们数据时用户还没有登出，所以日志文件中可能出现没有登出记录与之匹配的登入

记录，这些登入记录其保存在一个指定的文件中，在下次时再。

用户登录记录明细：用来记录所有用户登录所有的登录记录明细的数据结构，当

并匹配好的数据发送给服务器后以用户登录记录明细的方式保存下来。该明细数据的主要数

据项有：用户id，ip，用户终端ip，登入时间，登出时间，登录时长等。

用户登录记录日报表：按日统计的某个用户登录某个的登录时长记录，该记录包含的

主要数据项有：用户id，ip，日登录时长，登录月份。

用户登录记录月报表：按月统计的某个用户登录某个的登录时长记录，该记录包含的

主要数据项有：用户id，ip，月登录时长，登录年份。

用户登录记录年报表：按年统计的某个用户登录某个的登录时长记录，该记录包含的

主要数据项有：用户id，ip，年登录时长，登录年份。

4.总体设计

4.1.业务流程

这个是项目的大体流程图，还没涉及到具体的细节。大体的流程如图所示，

先数据即把数据从日志文件中出来把放入内存集合中的数据进行

匹配成需要的数据，把匹配好的集合发送到服务端。服务端接收数据，保存数据

到数据库，数据进入数据库进行整合。

采采采采采采采采采采采采采采

开开

读读读读

匹匹读读

发发读读接接读读

保保读读

整整读读

您可能关注的文档

文档评论（0）

honglajiao + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

通用数据挖掘系统概要设计.pdfVIP