- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一. (深度学习方向)深度学习和过往的神经网络训练方法有什么区别?给出几
个具体的 loss function ?
神经网络和深度学习的概念区别:
神经网络是我们经常看到的那种层级网络结构,它是指一种具体的模型。而深
度学习是基于当神经网络层数增多,神经网络学习日益困难的问题而提出的一
种学习的方式。
更加具体的解答请参见博客,这里面写的非常清楚。
以下是我基于上述博客做的一个简短的解答:
1.深度学习的目的?
大多数情况下,我们面临的主要是一个分类问题或者是回归问题。但是基于
已有的数据,我们很难提取一些有效的特征构建模型(传统机器学习基于经
验),而深度学习则是设计了这样一套方案,能够让模型自己学习特征。
因此,“深度模型”是手段,“特征学习”是目的。
摘自上述博客。
As a result, Deep Learning is an unsupervised learning algorithm.
2.传统神经网络的训练方式?
传统的神经网络训练方式正如大家所了解的那样,分为前向传播和反向传
播。前向传播构建了神经网络层输出与层输入之间的复杂关系,而反向传播则
是利用梯度下降方法,往回更新参数,使得目标函数(也即 loss function )下
降,最终趋于收敛,则训练完毕。
3.传统的神经网络训练方式有什么不好?
梯度消失问题,也就是说若某一层的梯度非常小,则该层前面的梯度会更小
(最终趋于0 ),也就是说很前面的层数的参数会趋于不更新。
博客中还讲了其他的一些缺点,该兴趣的可以自行查看。
刺猬实习
4.深度学习训练方法?
深度学习方法采用逐层训练的方法,参照博客中 AutoEncoder 可以很好的理
解 layer-wise。
其实感觉反向传播同神经网路是一样的,只是在前向传播时,是逐层训练,逐
层调优。
5.一些 loss function ?
-二. (NLP 方向)现在深度学习在 nlp 领域有哪些应用? 请具体说明
三. 什么是中文分词? 列举出几种你所知的分词方法
三大主流分词方法:基于词典的方法、基于规则的方法和基于统计的方法。
词典或规则:
基于已有词典 ,根据匹配类型不同而划分,有最大匹配法等。
统计:
1.组成词语的字可能多次同时出现的可能性最大而形成的 N-gram 模型
2.将词语构成看成是标注问题而出现的隐马尔科夫链、条件随机场等模型。
N-gram 和 HMM、CRF 的区别?
个人认为,N-gram 是基于统计的,没有标注问题。
而 HMM、CRF 引入了一个中间变量(即状态)。
刺猬实习
文档评论(0)