- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
这套体系实际上是自计算机诞生以来持续迭代演进至今的一套事实标准组成的体系,其中很多组件都具有历史的厚重感。整个体系不属于任何一个组织,是全行业多年竞争博弈后的结果,但同时,博弈中的胜者也都拥有整个体系中某一生态位的话语权。整个体系又大大小小的各种生态位构成,生态位之间相互依赖,每个生态位上的组件既是其他生态位的应用,需要满足相应生态位的规则,又给其他生态位搭建平台,可以制定相应的游戏规则。
生态位的话语权并不取决于谁是谁的平台,而取决于需求,例如NVidia的GPU名义上仍然是Intel定义的“中央”处理器+各种PCIe“从属”设备游戏规则下的“从属”设备,但今天在AI的需求暴涨的情况下,NVidia在这一块的解决方案形态的定义上有着远超Intel的话语权。PyTorch虽然是基于C++和Python构建的深度学习框架,但C++和Python语言本身的演进也很难对深度学习领域有多强的话语权。
当然这种话语权也并不意味着可以为所欲为,需求本身也限定了各个掌握了话语权的玩家可以折腾的边界。Intel虽然在传统云、虚拟化、处理器安全、包括PCIe、CXL的演进上拥有充分的折腾自由度,但在AI领域基本没什么号召力。同样,NVidia的折腾一定要能解决目前体系在AI领域的各类瓶颈问题,渐进式地讲整个体系逐渐改造成一个更加适用于AI需求的整体解决方案。
今天有很多人说NVidia不只是一家芯片公司,更是一家软件公司,是一家系统级解决方案公司,NVidia也正在打造各行各业的整体解决方案。这些都是非常客观的评价,NVidia事实上也确实不断围绕GPU产品打造越来越多行业的软件解决方案,而且在很多垂直行业都做到了老大的地位。但这并不意味着整体解决方案就是芯片竞争的有效途径。
解决方案式的思维是目前在芯片领域竞争最常见的坑。实际上解决方案式的产品模式本身就是已经取得生态统治力的玩家收割各行各业的手段,是构建了生态统治力之后的果,而不是他们取得竞争力的因。今天有无数公司把端到端解决方案当作取得竞争力的方法论,但NVidia驾驭的整体解决方案是上述事实标准体系,而其他玩家自己从芯片到软件全栈打造解决方案,并期望通过软硬件整体解决方案的竞争力来构建自己的生态,属实搞错了因果。
事实标准体系实际上需要极强的亲和性,NVidia的CUDA采用C/C++语言扩展的形式构建,并且整体设计对C/C++的编译、链接、构建、调试等体系具有更好的亲和性,例如形式上兼容elf格式的object文件,兼容C/C++的整个函数调用和符号体系,最大化减少对用户项目的侵入性。这样在一个复杂的C/C++项目中,只有和GPU直接相关的代码用nvcc编译器编译,其他代码的编译以及整个项目的链接和构建都原来用啥还用啥。这种对C/C++的亲和性实际上对于切入事实标准体系是非常重要的。
而今天CUDA已然成为事实标准体系中的一部分,新的玩家入场,就不止要考虑C/C++的亲和性,也一样要考虑对CUDA的亲和性。当然与哪些东西亲和取决于要从整个体系的大大小小生态位的什么位置切入,NVidia设计CUDA时,深度学习还没有起飞,C/C++也是高性能计算非常主流的平台,选择从C/C++切入自然是当时最优选择。今天C/C++仍然是最优选择之一,不过深度学习在应用层也带飞了Python,与Python亲和也是今天一种可能的选择,但在整体设计上就需要考虑更多与Python及其周边生态的亲和性。像TVM虽然选择了Python库的形式,但整体上采用了Python写编译和优化流程这种坑爹形式,自然跟Python亲和性完全扯不上边。
这里面没有什么标准答案,成败全在细节之中,需要对周边生态的亲和性有极强的感知和理解。即使像TVM这种纯软件背景团队的作品甚至TensorFlow这种出自Google这种顶级软件公司的作品,也因为缺乏这方面意识而在生态上各种碰壁。今天有无数微架构背景的架构师把编译器、软件框架当作万金油,只着眼于最终的业务,最终做出的产品自然也和生态亲和性相去甚远。这背后的细节把控其实无论软件背景还是芯片背景都没有孰优孰劣,能同时清楚所有边界上生态位的设计理念才是最重要的。
在今天AI领域的软件生态已然包含CUDA、PyTorch等组件构建的庞大体系,整个亲和性的设计就变得愈发困难,于是很多公司就走上了端到端整体解决方案式的邪路。芯片的算子编程语言做不好亲和性,就把上面各种可能用到算子编程语言的图编译、深度学习框架、推理引擎、甚至具体业务全都做了,以期望减少算子编程语言亲和性的问题。但同时带来的也有上层这些框架、引擎与周边生态的亲和性。最后等于是为了解决一个亲和性问题创造了无数个亲和性问题,只是在不断redirect问题。除了软件栈之外,其他方面类似的踩坑简直不要太常见,芯片搞不好就包成整机,整机搞
您可能关注的文档
- 用电子示功图分析主机故障实例.docx
- 工业内窥镜及机器人技术在无损检测中的应用.docx
- 锅炉水冷壁管鳍片对漏磁检测影响的分析.docx
- 高压奥氏体不锈钢给水加热器管道的生产和无损检测.docx
- 油气管道漏磁检测数据处理和缺陷识别量化方法研究进展.docx
- CT技术高效助力脆弱青铜器腐蚀的无损评估.docx
- 相控阵超声相位相干成像(PCI)检测原理及应用.docx
- 长输管道全自动焊接AUT检测典型缺陷分析.docx
- 非线性超声检测系统检测分辨力和灵敏度的确定方法.docx
- 航空发动机陶瓷基复合材料无损表征技术研究进展.docx
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)