方向玫瑰图社会经济论文.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
方向玫瑰图社会经济论文 1轨迹语义方向玫瑰图 1.1可视化效果图1中分别给出了利用三种不同的分析工具对相同的社会经济重心轨迹进行分析的结果。其中图1(a)为原始轨迹的显示结果;图1(b)为传统方向玫瑰图方法的可视化结果;图1(c)为本文中的语义方向玫瑰图。语义方向玫瑰图将社会经济重心轨迹各自对应的经济属性作为语义信息与全局轨迹方向玫瑰图的方法相结合,以可视化的形式表达。在语义方向玫瑰图中每个词的位置代表了该经济属性对应的重心轨迹在该方向区间内移动的距离大小即移动模式的显著性。同时,词汇的字体大小与该经济重心移动的显著性也成正比。因此,在图中词的位置离中心越远,字体越大,代表该经济属性所代表的经济重心轨迹在该方向上移动的模式越显著。对比图1中三种不同方法的实验结果可知:1)语义方向玫瑰图可从语义的角度对社会经济重心轨迹进行统计分析,最终直接以语义信息代表经济重心在图上表达。因此,语义方向玫瑰图给使用者提供了一种更直观更易理解的分析方法。2)语义方向玫瑰图从整体角度上看可反映经济重心轨迹的全局移动特性。同时,图中单个词汇又能反映其所代表的单条重心轨迹的显著移动模式,从而能更直接更全面的传递出经济重心轨迹的显著移动模式的信息。 1.2形式化定义语义方向玫瑰图是基于带有语义信息的重心轨迹Pj进行统计分析的,语义重心轨迹以式(1)的形式表达。式中n是轨迹上的采样点数,(xi,yi,ti,wj)表示的是在ti时刻移动物体状态;xi,yi为重心轨迹的空间位置信息;wj为语义信息,即轨迹所代表重心的经济属性名,如“国内生产总值”、“工业产量”等。 2生成方法 根据带有语义信息的社会经济重心轨迹数据,按照上式(3)即可计算出八个方向区间内每个语义词汇的词频,得到每个词在图中显示的极坐标位置。一般情况下,由于轨迹数量较多,为了保证语义方向玫瑰图分析的有效性和可行性,可根据轨迹语义词汇的重要性即其所代表轨迹移动模式的显著性大小进行排序和筛选,仅对移动模式最为显著语义词汇进行分析和表达。此外,由于词汇之间难免会出现许多重叠部分,影响可视化效果。因此,最后还可图中的词汇位置进行微调,以减少词与词的重叠碰撞。由此可知,语义方向图的生成过程可分为以下几个步骤:统计各个方向区间的词频;根据显著性对词汇排序和筛选;文字位置微调。接下来,本文将详细阐述语义方向图的生成过程。表1为实现语义方向玫瑰图的伪代码。 2.1统计各个方向区间词频先将[0°,360°]划分成8个等间隔的方向区间。根据式(5)确定轨迹Pj上的矢量#61480;#61481;kkkj#61553;,#61508;x,#61508;y,w所处的方向区间km。中[]代表取整数。2.2计算tf-idf并排序过滤在信息检索领域中,有研究人员提出了tf-idf的概念来衡量某一个词在整篇文档中的重要性[15]。在本文中,同样可以用tf-idf来词汇在语义方向图中的重要性。其中tf反映词代表轨迹移动模式在全局中的显著性,而idf则反映的是该词是否常见。由于各个方向的重要性实际上相同的,因此只考虑词频的距离值。其中,N和num分别代表所有方向区间的个数与所计算词出现的方向区间的个数。在取对数之后,idf的值能更好的表达一个词出现的区间越少,则这个词越重要的特点。此外,在idf的基础上加1是为了处理idf等于0的情况。从上式(6)中可看出,tf-idf值越大,表示这个词越有意义越重要,其代表的轨迹移动模式显著性越强。计算出各区间内各个词的tf-idf后,即可根据tf-idf值的大小在每个方向区间中选择出tf-idf最大的若干个词汇进行显示。此外,若数据在纵轴上出现小指聚集或有异常值的情况下,可以对纵向的R轴进行了一个如下式(7)的指数变换,以保证语义方向图的效果更好。式中R和R’分别为变换前后的纵轴距离值。下图2(a)即经过指数变换之后的可视化结果。 2.3文字位置微调为了提高空间利用率以及可视化显示效果,很多研究词云的人提出了各种不同的方法来避免词汇重叠。例如,FernandaB.Viégas使用了一种随机贪婪算法,即每次给与其他词重叠的词移动一个新位置,直至不再重叠,实现逐步逼近最优解的过程[16]。本文即通过这种类似的贪婪算法解决词与词之间相互重叠的问题。以下为实现文字位置微调的贪婪算法的基本流程:(1)碰撞检测首先依次对一个词与其他所有词进行碰撞检测。若检测得该词与另一个词有重叠时,则进行下一步;若与其他所有词都无重叠,则对下一个词进行判断。检测碰撞的一个比较简单的方法就是检测两个词的外接矩形是否相交。(2)位置随机微调若某两个词有碰撞,则随机选择其中一个,并对这个词的位置在一定的限制条件下进行随机的调整,包括角度和距离两个方面。其中限制条件有两个

文档评论(0)

柚柚 + 关注
实名认证
文档贡献者

你好

1亿VIP精品文档

相关文档