NVIDIA Ampere 架构发表后的启示:超算级与消费、准专业级架构差异化,嵌入设计进一步强化推论性能 (153735)

admin 1个月前 (08-13) 快讯 17 0
NVIDIA Ampere 架构发表后的启示:超算级与消费、准专业级架构差异化,嵌入设计进一步强化推论性能
NVIDIA Ampere 架构发表后的启示:超算级与消费、准专业级架构差异化,嵌入设计进一步强化推论性能

NVIDIA 在上周公布新一代 GPU 架构 Ampere 安培的设计特性,从目前公布的讯息, NVIDIA 也暗示它们在 GPU 产品线将会因应市场特性的不同自架构差异化,应用于超算领域的 NVIDIA A100 与自驾车领域的 Orin 都会是在特质与设计因应使用情境与消费级产品与绘图产品截然不同的设计。后续 NVIDIA 执行长也透露 Ampere 将会是横跨运算、绘图与消费领域的架构,也证实 NVIDIA 将透过产业差异化在结构进行微调。

GTC 2020 : NVIDIA 发表地表最大 7nm 晶片、 Ampere 架构的 NVIDIA A100 GPU ,AI 性能提升 20 倍、具创新多重执行个体设计

NVIDIA 公布新一代自驾平台 Orin SoC 特性, 除 200TOPS 标准版外还推出仅 5W 、 10TOPS 之 Orin ADAS 版

从此次 Ampere 公布的资讯, Ampere 在特质是直接作为 Volta 的后继产品,架构规划放在 GPU 加速与 AI 加速之 Tensor Core 相关的部分,完全未提及与目前娱乐与绘图相关的 RT Core 光线追踪加速,毕竟在超算领域应用,重点是放在 GPU 运算与能够提升运算效率的 AI 部分,至于 RT Core 自然在这些领域就不被需要。

此次 NVIDIA 在 CUDA 架构的部分并未做太多的着墨,仅以纯性能象征架构与设计的革新,介绍的重点反而是把重点放在第三代 TensorCore 上,相较 Volta 的第一代 TensorCore ,第三代 TensorCore 除再度针对需求日益提升的 AI 运算强化导入 TF32 之外,还以超算领域需要的 FP64 加入支援性,同时提升 AI 与超算所需的技术。

另一项特性则是 MIG 多重执行个体 GPU 特性,此项技术使单一 GPU 能够视为多个执行个体进行同步多工,此举可使单一 Ampere 作为多张 GPU 使用,这项技术可说是呼应基础设施、边际运算对于大量推论需求的技术, NVIDIA 特别强调基于 Ampere 的 NVIDIA A100 能够透过 MIG 成为七张超越 Tesla T4 加速器的推论加速器,不过在消费端是否会提供这项技术则有待商榷。

▲ Orin 除了 Ampere 架构 GPU 以外,还具备针对推论加速的 DLA

值得注意的是, NVIDIA 借此次发表的车载嵌入式超算平台 Orin 也是基于 Ampere 架构, 而在设计部分除了同样具备 CUDA Tensor Core 外,也承袭 Xavier 平台加入针对推论的 DLA 加速器,因为在车载领域,无论是先进辅助驾驶、自动驾驶, AI 推论皆是重要的一环,然而要在有限的功耗达到效率的最大化,透过专属核心进行硬体加速是比起扩充 GPU 或 CPU 规模更具效率的手段。

Amazfit 新表抢先睇   表面显示尺寸仍然细小

可以见到 Amazfit Ares 的表面除了显示日期时间,还有步数计、心率、最大摄氧量、电池剩余量、天气和温度的资料。暂时华米仍然未公布 Amazfit Ares 的实际规格配置,现时唯一可以从相片得知的,就是手表有 50 米防水能力,而且至少有黑色和绿色两种颜色选择。     Amazfit 手表受特定用户群组欢迎,拥有高性价比和特长电力是主要原因,不过其屏幕尺寸细小和极粗的边框则是其缺点。有网民在见到 Amazfit Ares 的宣传照后,直指在粗边框加上文字点缀的掩眼法,加上细小屏幕令整体感觉很廉价,可能当华米公布售价后,外界的观感会因此改变。 转载说明:本文转载自互联网,如有侵犯你的利益,请发邮件至本站邮箱,本站24小时内将予删除。

网友评论

  • (*)

最新评论

站点信息

  • 文章总数:722
  • 页面总数:0
  • 分类总数:8
  • 标签总数:1507
  • 评论总数:188
  • 浏览总数:7117