- 1
- 0
- 约4.13千字
- 约 10页
- 2018-11-11 发布于江苏
- 举报
Nvidia与ARM共同合作打造AI芯片专用IP
Nvidia与ARM共同合作打造AI芯片专用IP
一年一度的GTC至今已经迎来了第十个年头,虽然它每年或多或少的给网友一些“失望”,但它也终究是代表着GPU行业的高水平技术大会。那么,今年的GTC大会,英伟达又给业界带来了哪些惊喜呢?
日前,英伟达公司创始人兼首席执行官黄仁勋宣布了该公司在芯片、AI 平台、自动驾驶上的一系列新动作。
一、光线追踪(ray-tracing)
开场介绍的第一个项目就是英伟达在前不久GDC上发布的NVIDIA RTX光线追踪技术(ray-tracing),这项技术是英伟达耗时10年打造的,能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面,几乎与真实世界的照片或视频很难区分开来。现场展示的视频片段就是用光线追踪技术实时渲染的,而且并不需要一个超级强大的超算电脑,只需要一台DGX-Station。
在真实世界中,我们看到的3D物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则是反过来,通过从我们的眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2D视表面上每个像素的光线的路径,并应用到场景的3D模型中。
可想而知,这种技术的计算量非常大,一般渲染复杂的特殊效果可能需要花上几天甚至几周的时间,所以此前该项技术一直仅限于高成本的电影制作中。
不过,目前,随着GPU性能日益强悍,能够支持光线追踪的电脑也越来越多,通过Volta架构的GPU配合英伟达的RTX技术,产品设计师、游戏设计师、建筑师们能够在几秒内即可生成逼真的产品模型。
二、新版Quadro GV100,首次采用Volta架构
Quadro GV100 具有 32GB 内存,且可借助 NVIDIA NVLink 2 互联技术,通过并联两块 Quadro GPU 扩展至 64GB,在所有适用于此类应用的平台中其性能最高。
在性能方面,GV100 基于 NVIDIA Volta GPU 架构,可提供每秒 7.4 万亿次浮点运算的双精度性能、每秒 14.8 万亿次浮点运算的单精度性能、以及每秒 118.5 万亿次浮点运算的深度学习性能。NVIDIA RTX 内置的 NVIDIA OptiX AI-denoiser 可实现实时的 AI 去噪,英伟达表示且其性能相当于采用 CPU 时的 100 倍。
三、医疗图像处理超级电脑Clara
黄仁勋在现场推出了第一款专用于医疗图像处理的超级电脑Clara,它能够支持CUDA、CUDNN、TensorRT、OGL、RTX技术。
在现场,黄仁勋展示了一个医疗图像实时处理的影像片段。这个段影像是用十几年的超声波老设备拍摄而成,本来只能看到2D的黑白图像。然而当数据传进Clara后,配合人工智能软件,可以在2D图像中分析出3D的腔膛形状(图中红色部分)。因此,医院可以在现有医疗设备上直接接入这台电脑。
目前,英伟达正在和众多医疗厂商合作,除了GE通用电气、三星电子等大厂外,还有像图玛深维、推想科技等AI医疗创业公司。
四、新版 TensorRT 推理软件 TensorRT 4,并将 TensorRT 集成至谷歌的 TensorFlow 框架。
这是一款可编程应用平台(Programmable Inference Platform),当你将一个神经网络训练好了之后,可以通过TensorRT可编程平台,简便快捷地将这个训练好了的神经网络部署(Deploy)到英伟达的GPU上。
新版TensorRT 4能够支持INT8和FP16精度运算,能够将数据中心的功耗降低70%。
而且,英伟达还与谷歌进行了深度合作,将TensorRT整合进如今最广泛应用的AI开源框架谷歌TensorFlow 1.7中。而且现在还能够加速图像、视频、语言、NLP等AI应用。
英伟达表示,TensorRT 4 可用于快速优化、验证及部署在超大规模数据中心、嵌入式与汽车 GPU 平台中经过 训练的神经网络。相比 CPU,针对计算机视觉、神经网络机器翻译、自动语音识别、语音合成 与推荐系统等常见应用,该软件最高可将深度学习推理的速度加快 190 倍。而且为了进一步精简开发,英伟达与谷歌的工程师已将 TensorRT 集成至 TensorFlow 1.7,使得在 GPU 上运行深度学习推理应用更加容易。
五、AI平台新进展
如同往届,黄仁勋对英伟达 AI 平台做了介绍,公布了其中的一系列重要进展,包括全新 Tesla V100 32GB GPU 的 2 倍内存、革命性的 NVSwitch 结构、以及全面的软件堆栈推动性能提升、深度学习工作站 DGX-2 成为首款性能高达每秒 2 千万亿次浮点运算的深度学
您可能关注的文档
- LinkIt 7687 HDK开发板评测:跟2017年的物联网世界说“Hello”.doc
- Linux之父为自己粗鲁言论道歉,并宣布休假!.doc
- linux发行版排行 2018大盘点.doc
- Linux系统软件加壳保护技术的改进设计.doc
- LITEX支付生态基础网络设计方案.doc
- Lity是如何主动消除智能合约整数溢出的?且能防止95%的智能合约错误.doc
- LM3444-LM3445 非隔离式LED照明应用改进型线性稳压解决方案.doc
- Lon总线在图像采集节点中应用设计.doc
- LoRaLAN和LoRaWAN面临的优势和挑战.doc
- LoRaWAN的特色,阿里云的LoRa生态建设.doc
- DB31∕933-2025 大气污染物综合排放标准.docx
- DB31∕1640-2025 工业企业设备与管线组件挥发性有机物泄漏排放标准.docx
- DB42∕T 2523-2026 党政机关办公用房面积核定工作规范.pdf
- DB42∕T 2500-2026 武当山茶加工技术规程.docx
- DB42∕T 2507-2026 受污染耕地安全利用项目实施规范.pdf
- DB42∕T 2515-2026 装配式部分包覆钢-混凝土组合结构技术规程.pdf
- DB42∕T 2521-2026 湖北省生活和服务业用水定额.docx
- DB42∕T 2494-2026 中药材 银杏叶生产技术规程.pdf
- DB42∕T 2524-2026 高速公路水毁影响预警等级.pdf
- DB42∕T 2499-2026 宜昌毛尖加工技术规程.pdf
最近下载
- 执法工作中存在的问题和不足.docx VIP
- 分析力学PPT课件.ppt VIP
- 生成式人工智能在高中数学课堂中的应用:激发学生探究兴趣的实证研究教学研究课题报告.docx
- 部编版小学五年级道德与法治下册第二单元第5课《建立良好的公共秩序》第二课时(教案).docx VIP
- 2026年中职学校工作计划.docx VIP
- 排列数的综合运用_课件.pptx VIP
- QGW17991-2025《电力安全工作规程变电部分》.pdf VIP
- 西南科技大学处室文件-西南科技大学研究生院.PDF VIP
- iTrust UL33系列UPS系统20-60kVA用户手册(V1.5).pdf VIP
- 新改版教科版六年级下册科学知识点.doc VIP
原创力文档

文档评论(0)