关于潜在链接分析的FTSVM网页分类.pdfVIP

  • 2
  • 0
  • 约 5页
  • 2017-07-29 发布于湖北
  • 举报
第32卷第10期 计算机工程 2006年5月 2006 VoL32№lo ComputerEngineering May ·1毒士论文· 文章编号I l∞o—3428(2006)lo__0012-_03文献标识码IA 中圈分类号tTP391.4 基于潜在链接分析的FTSVM网页分类 王哗,黄上蘑 (上海交通大学计算机系,上海200030) 方法。新方法提高了分析网页超链接信息的效率,避免了经验参数的影响,充分考虑了网页权重的贡献。试验表明,提出的方法在网页基 准测试数据上取得了优于FTSVM的分类效果。 关健词:网页分类;直推式支持向量机;模糊;潜在链接分析;网页权重 LatentLink FTSVMfor Analysis-basedHypertext WANG Ye,HUANGShangteng of JiaotongUniversity,Shanghai200030) (DepartmentComputer,Shanghai link thedeficienciesoftheFTSVM.Toovercomethese fllatent FTSVM ]Abstract]Thispaperanalyzes shortcomings,itproposes analysis—based classification.Thenewmethodtakestheinformationof of into results (LLA_FrSVM)forhypertext weightshypertexts showthatthe well. LLA—FrSVM performs link of [Key analysis;Weighthypertext words]Hypertextclassification;TSVM;Fuzzy;Latent 网页是具有带有结构信息并说明链接关系的文本,与纯 文本相比,网页的信息量更大、网页与网页之间的关系更密 特点是构建了新的目标函数。FTSVM的目标函数如式(3): 1 切,但同时也比纯文本分类问题更加难处理。 一 .x W。w+CZ考i+C’Zuf豸 (3) 本文是在刘宏、黄上腾提出的用于网页分类的直推式模 z i 』 糊支持向量机(FTSVM)…工作的基础上进一步深入研究,着 st.Yf(w。x/+6)≥1一毒,磊;抑; 重讨论了FTSVM在超链接分析和时间复杂度方面的不足, Yj(w7工,+6)≥1一g,劈≥o 并将网页权重信息结合到FTSVM训练过程中,使支持向量 其中,w是最优分界面的方向向量,b是阈值,x是样本向量, 机分界面的位

文档评论(0)

1亿VIP精品文档

相关文档