;;;;;;;;;;传统模型:参数量级普遍<7B,发展相对成熟,主要关注计算性价比。原方案N49D,新方案推荐N59D/N59Dv2,紫霄v2;
搜广推:自研模型为主,除关注GPU外,同时关注CPU核心数、内存容量等。原方案L20,新方案推荐BW151/天垓150;
中小模型推理:关注显存容量/算力等。原方案N49D(<7B),L20(7B~70B),新方案N59Dv2(<7B),N88a/紫霄V2及BW151/
;;;;;;;;;;传统模型:参数量级普遍<7B,发展相对成熟,主要关注计算性价比。原方案N49D,新方案推荐N59D/N59Dv2,紫霄v2;
搜广推:自研模型为主,除关注GPU外,同时关注CPU核心数、内存容量等。原方案L20,新方案推荐BW151/天垓150;
中小模型推理:关注显存容量/算力等。原方案N49D(<7B),L20(7B~70B),新方案N59Dv2(<7B),N88a/紫霄V2及BW151/
文档评论(0)