视觉切入展示执行计划2015.4.15.docx

下载文档

4
0
约2.26万字
约 39页
2017-01-14 发布于北京
举报
版权申诉
保障服务

视觉切入展示执行计划2015.4.15.docx

1、本文档共39页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

视觉切入展示执行计划2015.4.15

基于完备记忆空间的视觉展示执行计划钱小一目标效果一、成长过程：通过晃动或指向一个物体，然后说“这个是……”可以建立新的对象，并赋予它听觉名称属性信息，包含了生成信息和重构信息，从而可以实现对象名称的识别和输出的功能。可以通过把对应的文字图像同时给智能体看，建立视觉名称属性，同样包含生成信息和重构信息，从而可以实现对象文字名称的识别和输出。可以在成长过程中指向性地让智能体输出特定的记忆空间的信息，以文字、语音或图像的方式；可以用语言指向性地修改它的记忆空间；可以指向性地让智能体把注意力集中在视域中的特定元素。可以指向性的要求智能体多么精细的去记忆一个画面，或一个视觉场景；或是如同教授人类婴儿那样，告诉智能体以什么方法去记忆一个形体对象：比如告诉他苹果体如何由标准球体形变得到，而如何通过头、手脚、身体拼凑出一个动物。二、初级展示效果：海量对象但仍然保持高效的识别力：拥有以完备记忆空间为标准建立的数量百万级别的视觉形体对象和平面图形对象数据库，但仍然保持高效的识别力。仿人的对场景的记录：精确地识别摄像头获得的视觉信息流中的形体对象和图形对象：参与者可以展示一张图画，智能体用语言说这张画中有什么对象？智能体可以快速从复杂的背景中找到模糊的特定对象，并用语言表达：“X对象在图中X对象的左边。”指向性信息创造对象：参与者可以用语言去描述一个智能体从未见过的对象，然后智能体有能力在一堆物体对象中寻找到这个对象。人脸识别：人脸识别，挑战人类精细记忆的极限。如同人类那样，识别的模式随着经验改变，特征抽取从粗略到细致，识别准确率从低渐渐变高。理解式的记忆：可以问智能体它是如何记住一个复杂形体的；可以问它比如：雪人和球体的关系是什么？（测试完备性）视觉场景感知体验记忆：你可以带着智能体出去游玩，然后询问外出游玩时场景中的信息，智能体能像人类儿童那样描述自己游玩的经历；描绘特定的场景；会按照自身的“关注点”如同人类那样可繁可简地保存感知体验中的信息。三、可对接的运用领域：图片搜索：用户可以对不认知的植物、动物、包包、以及场景进行拍照，我们可以通过照片寻找到相对应的对象或场景在数据库中的信息。经历记录伙伴：可以通过眼镜或帽子上的微型摄像头记录自己一天看到的信息，与普通摄像记录不同的是，智能体是如同人类那样理解自身看到的场景。这样你就如同携带了一个记忆力超强的6岁儿童，你可以在瞎逛时让它告诉你回去的路；你可以问它在过去一年走过的路中在哪里见到过你想找的蛋糕商店；在课堂结束后你可以向他询问哪些学生迟到，哪些学生心不在焉在看手机；你可以让他在草堆中帮你寻找丢失的高尔夫球，或是开着车让他寻找路边你想要找的某种植物……人脸跟踪：在面部精细识别功能构建的基础上，系统可以对特定的面部信息建立对象，可以在不同街道的摄像头中筛选出候选的对象。如果能够使大量摄像头联网，我们可以在短时间内锁定嫌疑人、丢失的儿童并跟踪他们每个时点出现在什么位置的摄像头视域下。手机视觉智能的嵌入：我们能够把图片搜索和“经历记录伙伴”嵌入到手机中，从而实现更加智能的手机平台上的视觉功能。类人机器人：这里的视觉技术可以运用到其他类型的类人机器人的运用上，实现和人人互动更加接近的人机互动。如同上面说的，智能体可以如同人类那样记录、表达自身的感知体验经历。我们可以加入其他的感受器，和记忆空间归纳演绎的生成机制，完善决策形成机制，从而在前期我们可以再现6-10岁儿童的智能表象。无人驾驶：因为智能体是理解看到的复杂的路面的，我们可以基于这种“理解”建立和人更加相似的驾驶模式，它可以如同人那样对路况的变化调整自身的决策模式，能够如同人那样对视域中的各种潜在的危险进行预备反应。当然在反应、处理效率和精度上它会远远优于人类。场景构想生成平台：你可以对他描述三国的故事而它能以动画的方式生成并输出你描述的故事的动画；你可以向他描述你需要构建的场景，它可以生成并输出你描绘的场景。你可以通过更多的模型的加入使它成为你的私人动画制作人。What makes us different？在这个执行计划中我们效仿人类，通过对已有形体对象组合形变的方式来保存新的形体。所以智能体是像人类那样理解一个形体的，这种理解可以创造各种比已有视觉识别产品更加智能的表征。我们是利用人类模型空间的普遍形式去完成“组合生成”的任务，这种普遍形式上建立的归纳功能会创造类似人类大脑中存在的那些抽象的概念（模型）；而仿人的优先值赋予机制将使智能体在处理复杂图景时更加高效，而如同人类那样对特定类型事物的识别力、记忆能力随着经验的增长而增长。对于人类决策系统是依赖记忆空间发挥作用的，而不是单纯的动机编辑。在前面的基础上，我们能够实现和人类更加相似的决策系统，从而决策优化不是单纯的程序设计，而是如同人类那样因为自身的感知体验经历而改变。这个视觉领域的展示同时