唯品会技术岗笔试4.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一. (深度学习方向)深度学习和过往的神经网络训练方法有什么区别?给出几 个具体的 loss function ? 神经网络和深度学习的概念区别: 神经网络是我们经常看到的那种层级网络结构,它是指一种具体的模型。而深 度学习是基于当神经网络层数增多,神经网络学习日益困难的问题而提出的一 种学习的方式。 更加具体的解答请参见博客,这里面写的非常清楚。 以下是我基于上述博客做的一个简短的解答: 1.深度学习的目的?  大多数情况下,我们面临的主要是一个分类问题或者是回归问题。但是基于 已有的数据,我们很难提取一些有效的特征构建模型(传统机器学习基于经 验),而深度学习则是设计了这样一套方案,能够让模型自己学习特征。 因此,“深度模型”是手段,“特征学习”是目的。 摘自上述博客。 As a result, Deep Learning is an unsupervised learning algorithm. 2.传统神经网络的训练方式?  传统的神经网络训练方式正如大家所了解的那样,分为前向传播和反向传 播。前向传播构建了神经网络层输出与层输入之间的复杂关系,而反向传播则 是利用梯度下降方法,往回更新参数,使得目标函数(也即 loss function )下 降,最终趋于收敛,则训练完毕。 3.传统的神经网络训练方式有什么不好?  梯度消失问题,也就是说若某一层的梯度非常小,则该层前面的梯度会更小 (最终趋于0 ),也就是说很前面的层数的参数会趋于不更新。  博客中还讲了其他的一些缺点,该兴趣的可以自行查看。 刺猬实习 4.深度学习训练方法?  深度学习方法采用逐层训练的方法,参照博客中 AutoEncoder 可以很好的理 解 layer-wise。 其实感觉反向传播同神经网路是一样的,只是在前向传播时,是逐层训练,逐 层调优。 5.一些 loss function ? -二. (NLP 方向)现在深度学习在 nlp 领域有哪些应用? 请具体说明 三. 什么是中文分词? 列举出几种你所知的分词方法 三大主流分词方法:基于词典的方法、基于规则的方法和基于统计的方法。 词典或规则: 基于已有词典 ,根据匹配类型不同而划分,有最大匹配法等。 统计: 1.组成词语的字可能多次同时出现的可能性最大而形成的 N-gram 模型 2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。 N-gram 和 HMM、CRF 的区别? 个人认为,N-gram 是基于统计的,没有标注问题。 而 HMM、CRF 引入了一个中间变量(即状态)。 刺猬实习

文档评论(0)

wanwen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5023212001000011

1亿VIP精品文档

相关文档