- 2
- 0
- 约2.75千字
- 约 2页
- 2026-04-20 发布于北京
- 举报
/LLM行业领军大佬带你大语言模型算法工程师/【思考题】transformer思考题
如果将位置编码与词向量拼接起来那么输入序列的维度将会增加这可能会导致模型杂增
,,
加,并且可能需要的计算资源。而将位置编码与词向量相加可以保持输入序列的维度不变,同
时仍然能够位置信息。
通过将位置编码与词向量相加,Transformer模型可以同时利用词向量和位置编码的信息来进行下
章节
/LLM行业领军大佬带你大语言模型算法工程师/【思考题】transformer思考题
如果将位置编码与词向量拼接起来那么输入序列的维度将会增加这可能会导致模型杂增
,,
加,并且可能需要的计算资源。而将位置编码与词向量相加可以保持输入序列的维度不变,同
时仍然能够位置信息。
通过将位置编码与词向量相加,Transformer模型可以同时利用词向量和位置编码的信息来进行下
章节
文档评论(0)