可拓学与人工智能在一级市场投研中应用探索.pdfVIP

  • 0
  • 0
  • 约5.55千字
  • 约 3页
  • 2026-01-08 发布于北京
  • 举报

可拓学与人工智能在一级市场投研中应用探索.pdf

数据,到真正的结构化的数据以及到知识,以及到一个推理的这一系列的过程,对于最下面

的数据,我们从投资的来说,比如我要投资某个项目,我知道他的行业数据,知道的国

家的数据,我需要知道企业的数据,我需要知道各个企业每个案子的流量数据和他的

财务数据,他是非常分散的,他是一个信息农业的数据。而在这个信息数据之下,我们现在

有非常多的上市公司,国内的恒生聚元、东方这种公司,它根据投资机构的需求将作为

的张数据做成结构化的数据,比如说他会把各个行业的宏观的数据汇集,他会把各个公司的

财报数据,这个公司的高管数据、员工数据进行一个分类来组织,从而给投资机构使用。他们这

个过程其实非常像信息的时代去挖掘在信息的纷杂世界里去找到有价值的数据。但是在

这个数据还是比较理想的。

真正像我们可拓学里面提到的,我们需要将这些数据驱构建他的机体,这个机体我们首

先讲的这个类似于实体数据,其实类似于我们现在讲的叫做物元,我们要抽象出整体的投资

行业需要哪些物元,比如说像公司,包含公司的数据,公司的属性里面包含了公司的高管、

公司的估值、公司的、公司的财务营收、公司的竞品以及公司整体的上下游。另

外我们要知道行业的数据,另外我们还需要知道整个的的宏观经济的数据以及这方面我们

基于这些数据的构建所谓的实体,所谓的基元数据。同时我们知道不同的公司、不同的行业

之间会有大量的关联,比如我这家公司和那家公司是上下游的关系,我这个公司和另外一家

公司是属于跨行业,但是有协作的关系,他会构建出一个图谱的数据,这个非常类似于我们

之前讲的有部分是物元,有部分是刚才讲的关系元,这就构成了图谱的数据。基于图谱的数

据我们就可以下面做一些决策,当然这个决策是基于员工的决策,员工基于这些图谱数据做

推论。但是现在2015年国外有一个公司,目前是高盛投标的公司,他做的事情其实非常地

类似于像我们刚刚讲的预测这一块,它是目前构建的巨大的一个图谱数据,同时包含了一个

类似于全世界各地方的地缘的一个数据,包括行业数据,这里做了什么呢?当在上

午8点钟发了一个的情况下,将会影响什么样的行业?具体这个行业下面什么会

下降,什么样的会上升,什么样的大宗商品或会下降,他瞬时就会产生这样的推断

的一些结果。

之前在没有这样的建模的情况下,大部分仍然需要靠一个分析元,根据,天

的时候才能产生这个研报,它是实时就能产生这样的研报,所以这个就真正实现了所谓我基

于物元、事元、关系元加上现在的推理,它能够迅速地产生这样的结论、预测的过程。我们

称为叫做信息的智能时代。

然后我们鲸准在这上面也做了大量的工作,这是我们鲸准一级市场的一个数据,从这个

上面看,其实非常类似于我们自己去抽象我们的各种实体、物元、关系图的数据,我们

是属于各大和,包括上市公司、新三板、四板、主板、美股、港股、合作以及

各个用户、同业的数据,基于这些数据下面,我们结构化,出现了各个物元实体,比如说像

机构、项目、员工、,然后同时我们出了这种属性、数据。大家知道其实每天有大量事

件的产生,的产生就会针对于一个公司、一个这样的实体会产生大量的变化,比如刚刚

我们讲的团队的变化、招聘的变化,每个变化其实就产生了大量的流动出来,这种流动是方

便我们这个东西去做建模,这是我们的一个做法,其实我这里就不详细地介绍,其实主要是

我们对于来自于各个的数据,用自然语言和这样的方式对它进行抽取,同时把它分成项

目流和信号流。项目流一句话,就是针对于任何新的项目,我们跟我们用工商数据、产

品数据、产品指标数据等数据进行自动地补充,并且抽取出,把它抽取出它的,比如任

何一家公司,36氪这家公司到底行业的,做的事情?36氪是一个创新创业的

类目,他做的事情,他有、金融数据、联合办公,我们都要从这些数据抽取出来,给它

打,我们一共是40个一级行类将近4000个类目这样一个行业的体系。同时

我们根据这个做了竞品的一个聚类,针对于新的公司,一个公司新的动态,我们也会把

它分类成,它到底属于融资的、业务进展、还是财务的披露,做这些的一

个结构化。

所有的数据不是马上就能使用的,进入我们的数据运营系统,我们在将近50人的

数据团队

文档评论(0)

1亿VIP精品文档

相关文档