李湛mf143033.pptVIP

  • 0
  • 0
  • 约2.25千字
  • 约 27页
  • 2018-08-28 发布于江苏
  • 举报
李湛mf143033

李湛 mf1432033 Email Archives Based DSNs 目录 1、如何构建DSN? 2、如何构建EA-DSN? 构建DSN 构建DSN的首要任务,就是如何定义开发者之间的关系。 交流、协作、不同任务之间的合作…… 构建DSN的方法 基于项目参与的DSN 基于版本控制系统的DSN 基于Email档案的DSN 基于Bug追溯系统的DSN 构建DSN的方法 基于项目参与的DSN 基于版本控制系统的DSN 基于Email档案的DSN 基于Bug追溯系统的DSN 基于Email档案的DSN 在整个软件开发生命周期内,开发者之间的交流是非常重要的。交流的方式有很多,面谈、会议、电话等等。然而这些方式不适用于有些情况(OSS)。Email是一种被广泛应用在开发团队中的交流方式。 规则:如果两个开发者之间通过Email交流,那么他们在DSN中就有一条连接。 如何构建EA-DSN 怎么获取Email交流的数据? 构建EA-DSN有哪些问题? 如何解决这些问题? Email交流真的同开发活动密切相关? 怎么获取Email交流的数据? Software teams often use public email lists, which everybody can see and participate in. Anyone sends an email to this list and then all the people in the list can receive it. Anyone interested in this topic can reply and others can also see the reply email. This kind of communication form works in a similar way as a forum. Project leaders in a project can release announcements, developers can talk about technical problems, and users can report bugs. 怎么获取Email交流的数据? The entire trace of these mailing lists are archived and available for study. 构建EA-DSN有哪些问题? 1、一个开发者可能拥有多个Email地址 2、通过Email地址很难匹配到正确的使用者 3、获取到的数据含有噪声。 …… 如何解决这些问题 Unmasking Aliases Data Extraction Small World Unmasking Aliases 自动化处理提取所有信息的头部,生成一个name,email列表作为其标识符(ID)。 聚类分析,将较为相似的放在一类中。 聚类分析算法 为每一对name,email计算相似度,超过阈值则认为是相似的,归为一类。阈值的确定是基于经验集的学习。 (1)规范化格式 (2)选择相似度度量方法 name相似度 name-email相似度 email相似度 综合相似度 Unmasking Aliases 后续手工操作,进行聚类分割(随机抽样方法)。 如何解决这些问题 Unmasking Aliases Data Extraction Small World Data Extraction For every email, we extracted from the email header the message identifier, the sender, the sent time, and the identifier of the message (if any) to which this message was a reply. Data Extraction When a reply-to header was found, the sender s of the reply was someone who found the initial message of interest; and so the sender s was marked as a recipient of the original message.

文档评论(0)

1亿VIP精品文档

相关文档