- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MINE MIC captures relationship strength; MAS captures departure from monotonicity; MEV captures closeness to being a function; MCN captures complexity. How to use MINE Example java -jar MINE.jar?Spellman.csv 0 cv=0.7 6.Application of MINE to real data sets (1) Social, economic, health, and political indicators from the World Health Organization (WHO) and its partners. (2) Yeast gene expression profiles from a classic paper reporting genes whose transcript levels vary periodically with the cell cycle. 6. Application of MINE to real data sets 理解与心得 1. MIC具有广泛性,可以检测两个变量间是否有关系,不仅限于线性关系,还可以检测非线性关系,甚至是多种函数的叠加。 2. MIC具有公平性,对于不同关系类型,若噪声相同,则MIC值也相同。MIC近似等于R2,(这里R表示有噪声的数据与无噪声数据的相关系数。) 理解与心得 3. 对于广泛性,作者给出了严格的数学证明;对于公平性,作者通过数值模拟给出了直观的图像进行理解。 4. MIC属于MINE一个成员,作者提供了计算MINE的软件,可以快速计算出大数据集里变量间的关系。 5. 作者通过与其它方法进行对比,并且给出四个案例,显示出MINE的优越性。 评论 MINE可以快速准确找到大数据集里两个变量间是否有函数关系,不会漏检,具有抗干扰性,但是具体是什么关系还需要根据散点图观察,再用数学的方法计算出函数关系。(如一元线性回归和多元线性回归。) 应用展望 在生物医学、生物信息学领域,经常需要考察某两个变量间是否有影响,它们有什么关系,就可以用MINE对数据进行分析,得到的结果更准确,而且不会漏掉重要关系,这样才能真实地反映变量间的关系。 请多多指导 幻灯片放映结束! O(∩_∩)O谢谢大家耐心观看! 唐玄奘西天取经,西天为何方? 取何经? * Detecting Novel Associations in Large Data Sets David N. Reshef et al. Science 334, 1518 (2011); 方海泉 Imagine a data set with hundreds of variables, which may contain important, undiscovered relationships. There are tens of thousands of variable pairs-far too many to examine manually. Data sets of this size are increasingly common in fields as varied as genomics, physics, political science, and economics, making this question an important and growing challenge. 1. Two heuristic properties One way to begin exploring a large data set is to search for pairs of variables that are closely associated. To do this, we could calculate some measure of dependence for each pair, rank the pairs by their scores, and examine the top-scoring pairs.
您可能关注的文档
最近下载
- 中华人民共和国电力行业标准火电机组寿命评估技术导则.PDF
- 护理团队协作与沟通技巧在临床护理中的应用.pptx VIP
- (正式版)H-Y-T 150-2013 海水中有机碳的测定 非色散红外吸收法(正式版).docx VIP
- 冀教版小升初数学模拟试卷附答案(培优).docx VIP
- 医疗废物流失、泄漏事故紧急处理流程.doc VIP
- 三视图形成及投影规律PPT课件.ppt VIP
- 八年级物理探究串并联电路电压的规律练习题3.doc VIP
- 7九江金鑫辐射报告书(报批稿6).doc VIP
- 最新《平凡的世界》阅读测试题及参考答案.docx VIP
- 工程量清单及招标控制价编制、审核入库类服务工作方案.docx VIP
文档评论(0)