- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 24 卷第 5 期
2004 年 5 月
计算机应用
Computer Applications
Vol . 24 ,No . 5
May ,2004
文章编号 :1001 - 9081 (2004) 05 - 0056 - 03
基于 SOM 网络的随机映射文本降维方法
钱晓东 ,王正欧
(天津大学 系统工程研究所 ,天津 300072) (youran4319 @163. com)
摘 要 :文中针对在文本处理的高维矢量环境中 Kohonen 自组织特征映射神经网络的计算瓶颈
问题进行分析 ,引入 RM(随机映射) 方法并进行相应的理论分析 ,在此基础上提出可以运用 RM 方法 有效并且可控地解决上述计算瓶颈问题 ,降低了文本处理环境中 Kohonen 神经网络的规模和时间 、空 间代价 。文章通过实验证明了上述方法的有效性和正确性 ,从而达到提高自组织理论对于文本处理 的实时性和实际可行性的目的 ,并对其进一步应用进行展望 。
关键词 :文本处理 ;随机映射 ;自组织神经网络
中图分类号 : TP183 文献标识码 :A
Study of Text Dimensional Reduction
Using Random Mapping Based on SOM Net work
QIAN Xiao2dong ,WANG Zheng2ou
(Institute of Systems Engineering , Tianjin University , Tianjin 300072 ,China)
Abstract :This paper analyzes the bottleneck problems of calculation in Kohonen self2organizing map neutral network( SOM) in the high2dimensional vector environment of text processing , and introduces RM( Random Mapping) to make corresponding theoretic analysis ,on the basis of which it suggests that RM may be employed to settle above bottleneck problems of calculation in an efficient
and controllable way and to reduce size and cost of time and space for Kohonen neural network in text processing environment. This paper demonstrates the efficiency and correctness of the present method by using an example ,which makes SOM network to possess real2time ability and feasibility in applying it to the text processing ,and offers a prospect of its further applications.
Key words :text processing ;random mapping ;self2organizing maps neutral network
1 引言
Kohonen 提出的 SOM(自组织映射) 理论提出了在无导师 监督的情况下 ,自发从输入矢量发现其结构模式的算法和网 络结构 ,具有在神经网络输出层按几何中心或者特征 (如概 念) 进行聚类的独特性质 ,因而在数据分析 、数据挖掘等任务 中具有广泛的用途 。但在文本这一类特殊类型数据的处理 中 ,由于文本矢量过高的维数 ,SOM 整个带侧反馈的算法中获 胜者选择问题的计算量非常大[ 1 ] ,导致 SOM 理论很难实际运 用于大规模或者超大规模的输入矢量空间 。
在经典 SOM 理论中 ,无论是训练神经网络还是应用神经 网络 ,最基本的网络操作是获胜者选择操作 ,即选择和输入矢 量最匹配的获胜神经元 。当选择和输入矢量 x 最佳匹配的获 胜神经元时 ,输入矢量 x 和网络输出层所有神经元的权值进 行内积运算或者计算欧式范数距离或者计算余弦 ,假如以乘 法作为基本计算周期 ,选择获胜神经元的计算需要的
文档评论(0)