- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据中社会学重要性
大数据分析中社会学的价值--数据挖掘、理论与动态模型的互动;大数据很有用
大数据一词提出者维克托?迈尔提出:
一、资料整合
二、最明显的就是茫茫网海中“盯”一个人
三、找一个聚类
四、我想找一个商机、事件。
五、只是描述性统计和相关性分析,不作任何推论。
六、还有就是数据本身就是母体而不是样本;往往这样的分析只作归纳不作演译,得不到很多有用的知识,以舆情观察为例,会产生五大偏误:
一、抽样偏误。
二、情绪字词衡量偏误。
三、转化偏误--需要指标寻找模型
四、情绪感染偏误。
五、资料被截的偏误(truncated data bias)--可以寻找行为模式的模型加以推估。;大数据知道了what
但是Why? How?
一、Ground Truth问题
二、诠释和理论的不同
三、描述性统计和推论性统计不同
四、Data Mining和Theoretical Hypothesis Testing的不同;集体行动与系统变化;一个计算社会学的方法;大数据分析的推论之一:寻找指标的模型;
Tim;;资料来源
一年期w市同志qq群的资料(每两周作一张网络图,共二十四张)
1893 受观察者,26 qq群
8位线下受访者
;计算机学者会提出:
Degree Centrality
Hole Spanner
Cluster Coefficients
K-Shell
那一个?
社会学家如何回答?;Figure 1. 粗蓝线表示两周内互动二十次以上。细蓝线表示两周内互动十次到二十次之间。细灰线表示两周内互动十次以下;Figure 2 粗蓝线表示两周内互动五十四次以上。 ?;黄色点为受访者3,蓝色和绿色点为其一级连带点,其中八月上旬的三个绿色点为对应的下旬的三个绿色点。他从8月上半旬度数很大的点之一,一下降为了八月下半旬的边缘点。而8月上半旬与他连接的19个点中,只有三个点存留在其网络上。剩下的全部消失掉了。;大数据分析的推论之二:寻找行为模式的模型;/news/news?aidt=5ch=rj_bd_memid=
DCM联合IDG向B2C网站优雅100投资1000万美元
2012-03-12 08:46 中国风险投资网0
【导读】家纺B2C电子商务网站文雅100开创人陈腾华称,其曾经完成第一轮1000万美圆融资,由IDG和DCM结合停止投资。他以为家纺业B2C年销售额应当在将来两三年内有大幅增长,也希望文雅100做到家纺B2C的第一。
家纺B2C电子商务网站文雅100开创人陈腾华称,其曾经完成第一轮1000万美圆融资,由IDG和DCM结合停止投资。 陈腾华表示,本轮资金将主要用户招募员工、做品类优化以及产品开发方面。 “文雅100”()定位于在线的时髦家居生活馆,目前仅仅上线2个月左右,主要销售自有品牌家纺类产品以及其他品牌类的床品、毛巾浴巾等家纺用品。 谈及为何离任并进入家纺B2C时,陈腾华表示这个市场范围每年可以到达7000-8000亿元,目前B2C行业还没有质量家居生活的领头者。在传统市场又存在制造分散、品牌集中度分散等问题,因而B2C在这方面就存在时机。 值得留意的是,除了作为平台出卖其他品牌家纺,文雅100还推出了自有品牌Toscaso。陈腾华以为,垂直类B2C的一个开展趋向就是自有品牌,由于无论是制造、本钱还是质量和渠道都可以有效控制,并且具有较高利润。 陈腾华表示固然有自在品牌,但不会做线下实体展现店。他以为家纺业B2C年销售额应当在将来两三年内有大幅增长,也希望文雅100做到家纺B2C的第一。
;2. Structure Data Base Collected from Big Data;I. 资料挖掘:预测变量;Feature selection;十大预测变量
相同国别
共同邻居数
中介中心性
距离
相同产权
投资领域数量
相同的投资领域数量;为什么要抱团?;大哥带小弟;Probability of Syndication and Distance;基于圈子理论建立的假设;Analytical Results of QAP;Explanatory Variables
From 1995 to the previous one year;网络动态建模;;【加入圈子理论的动态网】
加人下述三个选择伙伴的条件
一、三步距离之外合作机率为零。
二、距离越近合作机率越高。
三、过去合作次数越多合作机率越高。
;;;;大数据分析的推论之三:实务上的指导;一、电话较高频地打给谁?随机抽样一群人?一跳?寻找人脉圈子的指标(丹巴圈子)
在抽样人群中再抽样作访谈和问卷调查
二、手机的移动记录。随机抽样的这群人?移动点与GIS?寻找移动规律指样?寻找个人社经地位指标 结构化数
文档评论(0)