- 3
- 0
- 约1.19万字
- 约 4页
- 2017-11-06 发布于湖北
- 举报
第4l卷第靶期 山东大学学报(理学版) 2006年7月
Ⅷ.41 轴田.2 JOURNALOFSHANDONGUNl、咂RSnY Jul.2006
文章编号:167l-9=152(2006】鱼平p.二0口口3.甜
多维数据立方体与信息抽取的集成
万海平,朱强生,何华灿,周延泉
(北京邮电大学信息学院。北京10傩76)
摘要:敷据挖掘已经成为提升行业竞争力的重要的信息技术,它综合运用机器学习以覆信息科学的理论与技术。
挖掘臆藏大量敷据背后的模式与知识,为业务决蕈提供有意叉的参考信息.gl前仍存在许多遗留的信息系统.其
中走量的业务规则是以自然语言描述的形式存储在教据库中的.在这类遗留系统上进行数据挖掘,就越须解决如
何从速些不规则的自然语言描述中抽取信息的问题.我们讨论了如何从自然文奉中抽取业务规则。为了特这些信
息存储在多雏数据立方体中,我们提出了一种利用多堆索引建立多雏数据立方体的方法.
关键词:敷据挖掘;多雏数据立方体;信息抽取;B树;正则表达式
中图分类号:1Y391 文献标识码:A
The ofmultidimensionaldatacubeand
integration
informationextraction
WAN Hua-canandZHOU
Hai—ping,ZHU Yah-qllall
Qiang-she“g,HE
ofInfommlion
(sch:ol 0f附and 100876.Chitin)
EII咖Ⅻ堍,Be.ij吨UniversityTeleecammdieation.Be“iIlg
of
A岫嘲:Dam sarl andtech-
rainiIlgplay8蚰jn驴ma呲rolein严帅∞ti玛thecompetitionability h如slIy.It叩p矗i啤theory
machine andirfformatlonselenoe and behindvolume0f
面畔d leaming tO鼎pl啪pauems
kf蹦峙KdiIlgl盯gB data,tI呐
infommlidmhdecisicn therestillare infmmaticn
w】蚍hIsil脚know[-
pI们试凹m嘲llir】gfuI making.But manyk缈y systems
ndee蛳de卵dbedinIl,eformofnatmal hastOextn帕tinfonn硝onino“lertO
ed护and language,It pe妇data血Ilil_|g∞these
di∞ImhowtOexlraetin幻mⅫi蛳fromfreetextandbuild indexesbased011 store
Byste∞.We multidimensional Ihem.
原创力文档

文档评论(0)