多维数据立方体与信息抽取的集成.pdfVIP

  • 3
  • 0
  • 约1.19万字
  • 约 4页
  • 2017-11-06 发布于湖北
  • 举报
第4l卷第靶期 山东大学学报(理学版) 2006年7月 Ⅷ.41 轴田.2 JOURNALOFSHANDONGUNl、咂RSnY Jul.2006 文章编号:167l-9=152(2006】鱼平p.二0口口3.甜 多维数据立方体与信息抽取的集成 万海平,朱强生,何华灿,周延泉 (北京邮电大学信息学院。北京10傩76) 摘要:敷据挖掘已经成为提升行业竞争力的重要的信息技术,它综合运用机器学习以覆信息科学的理论与技术。 挖掘臆藏大量敷据背后的模式与知识,为业务决蕈提供有意叉的参考信息.gl前仍存在许多遗留的信息系统.其 中走量的业务规则是以自然语言描述的形式存储在教据库中的.在这类遗留系统上进行数据挖掘,就越须解决如 何从速些不规则的自然语言描述中抽取信息的问题.我们讨论了如何从自然文奉中抽取业务规则。为了特这些信 息存储在多雏数据立方体中,我们提出了一种利用多堆索引建立多雏数据立方体的方法. 关键词:敷据挖掘;多雏数据立方体;信息抽取;B树;正则表达式 中图分类号:1Y391 文献标识码:A The ofmultidimensionaldatacubeand integration informationextraction WAN Hua-canandZHOU Hai—ping,ZHU Yah-qllall Qiang-she“g,HE ofInfommlion (sch:ol 0f附and 100876.Chitin) EII咖Ⅻ堍,Be.ij吨UniversityTeleecammdieation.Be“iIlg of A岫嘲:Dam sarl andtech- rainiIlgplay8蚰jn驴ma呲rolein严帅∞ti玛thecompetitionability h如slIy.It叩p矗i啤theory machine andirfformatlonselenoe and behindvolume0f 面畔d leaming tO鼎pl啪pauems kf蹦峙KdiIlgl盯gB data,tI呐 infommlidmhdecisicn therestillare infmmaticn w】蚍hIsil脚know[- pI们试凹m嘲llir】gfuI making.But manyk缈y systems ndee蛳de卵dbedinIl,eformofnatmal hastOextn帕tinfonn硝onino“lertO ed护and language,It pe妇data血Ilil_|g∞these di∞ImhowtOexlraetin幻mⅫi蛳fromfreetextandbuild indexesbased011 store Byste∞.We multidimensional Ihem.

文档评论(0)

1亿VIP精品文档

相关文档