?
?
类比算法的提出以及在人工智能发展中的应用研究
?
?
焦正,张强(通信作者,韩清华,李明远
1.枣庄学院 人工智能学院,山东枣庄,277160;2.伊尔库茨克国立理工大学,俄罗斯伊尔库茨克州,664074
0 引言
人类在接触一个新事物的时候,会把新事物分为两类:已知和未知。分辨的依据就是我们脑海中已有的知识,通过与脑海中已知事物进行特征比对,可以很快地辨别出,新事物以前是否见过。如果匹配,则会将脑海里有关这个事物的所有知识全部调用出来;如果不匹配,下一步则会想,这个新事物和这个已知的事物有多少特征相似,然后通过已知事物的特征来标记未知事物,然后通过各种渠道搜集资料和信息,得到新事物的一个定义,然后结合刚刚的特征,就会把这个未知事物转化为已知事物,进而成为储存在脑海里的知识。这就是人类接触一个新事物的时候,大脑中的一个简单的连锁反应。
1 “类比算法模型”概念的提出
1.1 类比思维模式
人认知世界的过程中就是在不断地给各种事物打上各种各样的标签:高、矮、胖、瘦……打的标签越多,我们对这个世界的认知就越全面,对世界的认知也就更容易。数据标注,就是在给数据打标签。目前的数据标注,大部分工作还是需要人力来完成,所需人力资源庞大[1]。为了解决这个问题,我们通过类比思维模式提出了一个算法概念。首先,该算法可以通过已知事物的标签来标注未知事物,数据库中的数据越多,标签的定义也就越详细,通俗来讲就是已有标注数据越多,对新数据的标注工作也就越轻松。该算法就是在模拟人接触新事物的一个思维过程——类比思维模式。
此算法虽然基于机器学习,但不同于现有的算法,此算法会对已经储存的数据进行一个简单的运用:通过储存的知识让标签的定义更加完善;更加完善的标签则可以更好地完成数据标注的工作,这样就构成了一个良性循环,它更符合人的思考方式。在人类学习知识的过程中,有这样一个概念:“归属学习”,而“归属学习”还分为上位学习和下位学习,上位学习是指新学习的知识在概括程度上高于认知结构中已有的知识,下位学习则与之相反,认知结构中已有的知识可以概括新知识,而通过类比算法来学习的一个概念就是下位学习。标签可以囊括我们所需要标注的内容,而标注的内容则能更好的丰富标签的定义,使标签愈发完善。
相比于目前主流机器学习算法,该算法更注重的是数据的“运用”、智能结构的搭建以及如何不断完善和更新。对数据的运用并不是简单的存储和调用,通过这些数据的存储可以很好的完善所搭建的“智能结构”。
1.2 类比算法模型的提出
本文基于类比思维模式,提出了一种实现机器学习数据集半自动标注的算法模型——“类比算法模型”,人类认知事物的基本逻辑是给予各个事物以标签,包括:外貌、名称、特征等。并通过这些标签和已知事物来与未知事物进行类比,相似的标签,将直接挪用在未知事物上,未知的特征,将通过各种渠道了解,然后再标注。
我们把人当作一个算法模型,其认知事物的过程可以这样描述:首先数据库中存在已标注的数据集,且这些数据集可以随时调用,然后输入一个新数据,算法模型将调用数据集中与新数据相似度高于80%(该参数会随着模型的训练趋近于一个稳定的值)的数据,并与之进行对比,判断相似的地方,然后直接挪用标签,剩余未知的内容与以标注的内容同时输出,由人工复检,人工复检需要检查标注的内容是否正确,然后再标注未知的内容,标注未知的内容过程与人工标注的方式相同。这一过程的流程如图1所示。
图1 类比算法流程图
2 人工智能的发展现状与未来发展方向的论述
人工智能简单来说就是类人化的一个系统,可以模仿人类除了创造类的所有行为[4]。要想让它实现“独立思考”,就要先探讨人的独立思考是如何形成的。人与生俱来就有自己独立的思维,但是,人类认知这个世界的过程却不是仅仅依靠自己来摸索的,在人类认知世界的过程中,会有老师、父母、朋友等来进行引导和影响,简单来说,老师和父母会把他们认知的世界传输给你,然后通过自己的自我化,转化为自己的知识,从而形成对这个世界的概念,然后以此为基础来对接触的新事物打标签、下定义。这是我们认知世界的一个大致过程。机器学习就是让我们人类来当人工智能的老师,把我们的世界观灌输给人工智能,通过大量的数据训练,使它能实现某一方面的“智能化”[6]。但这一方式有一个缺点,它不能进行数据的自我更新,训练完的模型并不会因为它处理的数据越多从而越智能[5]。因此,这一类模型依然是人工智能方面的一个“工具”,并没有形成一个可以“自我完善”的良性循环。
让人工智能拥有独立思考的能力,还有很长一条路要走,但是让人工智能“类人化”却并非无法实现,人类认知世界的过程是基于已有的知识来记忆新知识,但是目前的人工智能并没有很好的“运用”存储的知识,它没能通过知识来“获取”知识。人类是通过类比来不断丰富对这个世界的认知,
原创力文档

文档评论(0)