《人工智能开源硬件与Pyhthon编程实践》课件 项目13 卷积神经网络与图像自动分类.pptVIP

《人工智能开源硬件与Pyhthon编程实践》课件 项目13 卷积神经网络与图像自动分类.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卷积神经网络与 图像自动分类 人工智能开源硬件与python编程实践 情境导入 2016年3月,阿尔法围棋(AlphaGo)与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜 。 阿尔法围棋是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平,其主要工作原理是“深度学习”。 任务与目标 了解几种典型的卷积神经网络基本结构和应用方法; 了解CIFAR-10网络的模型结构、加载调用和编程应用方法; 了解运用人工智能开源硬件和OpenAIE Python库设计图像分类系统的方法; 运用人工智能开源硬件和Python编程,编写和调试初步的图像分类应用程序。 知识拓展:卷积神经网络经典模型 LeNet AlexNet ZFNet GooLeNet VGGNet 知识拓展:深度学习开源开发框架 Tensorflow Tensorflow是Google Brainu团队针对机器学习和深度神经网络而开发,使用数据流图(Data Flow Graph)的形式进行计算。图中的节点代表数学运算,而图中的线条表示多维数组(tensor)之间的交互。 Caffe Caffe是一个清晰、高效的深度学习框架,核心语言是C++,支持命令行、Python和MATLAB接口 PyTorch PyTorch非常Python化,可以在PyTorch模型中任意添加pdb断点,调试方便。PyTorch灵活易用、API接口设计合理简洁。 PaddlePaddle 是百度研发的开源开放的深度学习平台,是国内最早开源、也是当前唯一一个功能完备的深度学习平台。 知识拓展:AlexNet模型 Alex在2012年提出的alexnet网络结构模型开启了神经网络的应用热潮,并赢得了2012届图像识别大赛的冠军,使得CNN成为在图像分类上的核心算法模型 ; Input输入层 ; 卷积层 ; 池化层; 全连接层; 输出层 设计与实践 CIFAR-10模型结构 cifar10网络模型的加载 图像分类识别 编程及实现 CIFAR-10模型结构 CIFAR-10模型是利用CIFAR-10 数据集训练出来的具有10分类能力的CNN网络,科院分类识别飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船以及卡车等10个类别物体。 CIFAR-10模型结构除了最顶部的几层外,基本跟AlexNet模型一致。模型是一个多层架构,由卷积层和非线性层(nonlinearities)交替多次排列后构成。这些层最终通过全连通层对接到softmax分类器上。 cifar10网络模型的加载 # 加载cifar10网络。 # 更快,更小,更准确。 net = nn.load(/cifar10_fast.network) labels = [airplane, automobile, bird, cat, deer, dog, frog, horse, ship, truck] 图像分类识别 OpenAIE内嵌库中有net.search(image[, roi[, threshold=0.6[, min_scale=1.0[, scale_mul=0.5[, x_overlap=0[, y_overlap=0[, contrast_threshold=1[, softmax=False]]]]]]]]) 方法,用来以滑动窗口方式在图像roi上运行神经网络。 网络检测器窗口以多种比例滑过图像。返回神经网络检测结果的nn_class 对象列表。 图像分类识别编程 基于cifar10网络模型,利用net.search对象实现图像分类识别的Python代码如下: for obj in net.search(img, threshold=0.6, min_scale=0.5, scale_mul=0.5, \ x_overlap=0.5, y_overlap=0.5, contrast_threshold=0.5): img.draw_rectangle(obj.rect(), color=(255, 0, 0)) 系统编程及实现 利用cifar10卷积神经网络模型,能够快速检测出图像中存在的10种目标物体: 分析与思考 结合本编程实践进行思考:如果将本项目改造成校园植物园的花草识别系统,存在哪些困难?应该如何进行改造设计? 借鉴本项目介绍的理论、方法和例程,如果利用cifar10网络模型来设计一个车牌识别系统,具有可行性吗? 利用互联网络检索cifar100网络模型的原理和应用方法,如果利用cifar100网络模型来设计一个车牌识别系统,情况又会怎样?。

文档评论(0)

soloman_555 + 关注
实名认证
文档贡献者

全网最全各版本教材各学科新课标双减背景下作业设计

1亿VIP精品文档

相关文档