开源信息在竞争情报采集过程中应用.docVIP

下载本文档

36
0
约2.82千字
约 6页
2018-06-08 发布于福建
举报
版权申诉

开源信息在竞争情报采集过程中应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

开源信息在竞争情报采集过程中应用

开源信息在竞争情报采集过程中应用　　[摘要]从开源信息的特点、竞争情报中开源信息的获取渠道、开源信息有效性的保证三个方面阐述开源信息应用于竞争情报实际工作中的具体要求，并探讨针对7种开源信息的特点所采用的方法、开源信息在竞争情报实际应用中的获取渠道以及如何甄别合适的开源信息。　　[关键词]竞争　情报采集　开源信息　　[分类号]G350 　　在企业和国家的情报活动中，开源渠道(openSOUFCes)中的数据和信息是很重要的信息源。从商业公司的角度来看，为了了解市场情况、为了在并购行动之前掌握必要的信息、为了在结交战略同盟前了解对方公司的信息，企业需要通过各种渠道获取相关的情报，开源信息是其中的重要信息源之一。从国家情报机构的角度看，为了满足其服务对象的特定需求，也需要深入挖掘公开信息资源，从而为随后的分析工作奠定基础。对于开源信息(open source data)的定义??目前并没有统一的描述，本文结合实践工作，将其理解为能在互联网等媒体上公开获得的信息、正式出版的刊物书籍、合法获得的企业报告、产品说明及宣传资料、咨询机构的研究报告以及可以通过问卷调查等方式获得的研究数据。在侧重点方面，本文主要关注开源信息的深层内涵以及如何利用开源信息开展分析工作。选择开源信息作为研究的侧重点，是基于以下原因：①开源信息易于获得，本文以开源信息作为重点，其研究经验可以被更广泛地借鉴使用；②开源信息数量巨大，那么如何甄别合适的信息?这个问题对于后续的分析工作至关重要，本文试图通过实际研究过程中总结的经验对这个问题进行讨论分析。为便于理解，本文采用理论与实践相结合的方式开展论述，实践部分的素材主要来自于中国科学技术信息研究所情报方法研究小组在撰写《国外风电装备市场主要竞争者研究：Enereon公司》等一系列报告过程中研究人员从开源信息源中采集信息的一些方法和经验。　　1、开源信息的特点　　了解和总结开源信息的特点对于竞争情报的信息采集工作非常重要，这关系到采集的信息的质量问题。在开源信息的收集和分析过程中，可以发现其具有以下特点：　　1.1　信息格式方面　　除去格式相对规范的论文和研究报告等信息源，大多数的开源信息格式比较自由，虽然张玉峰等人研究了自动抽取技术在竞争情报中的应用，但是在实际研究中，使用自动抽取技术抽出相关的部分比较困难，因为很难设定相应的抽取规则。这一方面是因为分析的需求很难用准确的规则表示出来，另一方面是因为开源信息的格式构成复杂，很难在抽取规则中充分照顾到每个细节。在大多数情况下，需要人工参阅大量资料，从而选择合适的信息。　　1.2　信息索引方面　　与规范化的信息相比，大多数开源信息没有建立相应的索引，所含的信息对于分析来说，一般是片段性的，很难通过参考文献等方式追溯文献的来源，从而尽可能地按照要求补充信息。在大多数情况下，需要分析人员通过其他途径将信息补充完全，对于无法补全的信息，只能舍弃。开源信息的这种特点，需要信息分析人员熟悉各种数据库和网站，将众多信息整合在一起，最大程度地拼凑出分析所需要的完整信息。　　1.3　网页时效性方面　　网页上的信息通常是不稳定的，当天能阅读的信息，第二天可能会消失，同一网页的信息也可能会被经常性地修改。在情报采集的过程中，为了避免重要信息的遗漏和丢失，需要将网页信息按时期和类别储存，在必要的时候，还需要对目标网页进行持续的跟踪。　　1.4　语言特征方面　　除去正规的出版物和报告，大多数开源信息的表达方式更接近口语，并且呈现出多语种的特点，这需要情报分析人员具有翻译和处理多种语言的能力。在实际工作中，有许多组织本身缺乏掌握外语能力的人才，但是又不愿意将资源提供给外面有能力的组织处理，使得一些信息资源没有得到有效的利用。有一些组织只使用本国语言在网络上发布信息，这为其他国家人员获取信息增加了难度。　　1.5　信息来源方面　　即使信息分析人员可以准确地定位所需要的信息，也很难获得有关信息的源出处、最早发布时间等关键数据，这是因为网络上的很多信息缺乏标签。标签是指关于数据的数据，它可以帮助分析人员确认资源的来源和产生时间，以便进一步考证信息的真实性。考证信息真实性的重要意义在于：一些信息可能会被人为地篡改，为此经常需要找到信息的源出处，进行对比分析。　　1.6　信息的海量性　　对于分析人员来说，最大的问题在于开源信息的爆炸性增长。这也揭示了一个现象：组织花费了很大的代价储存信息，希望能够掌握尽可能多和全面的信息，但是组织很少考虑信息利用率不高的问题。此外，海量信息中能被真正使用的信息并不多，例如：竞争情报对于时效性要求严格，对于海量信息来说，大部分信息的时效性不满足具体的分析要求。　　1.7　Web 2.0的发展　　博