英伟达AI芯片H200开始供货,性能相比H100提升60%-90%

hjh_h2024-03-28 20:11:37IT之家

IT之家 3 月 28 日消息,据日本经济新闻今日报道,英伟达的尖端图像处理半导体(GPU)H200 现已开始供货。H200 为面向 AI 领域的半导体,性能超过当前主打的 H100。

根据英伟达方面公布的性能评测结果,以 Meta 公司旗下大语言模型 Llama 2 处理速度为例,H200 相比于 H100,生成式 AI 导出答案的处理速度最高提高了 45%。

市场调研机构 Omdia 曾表示,2022 年英伟达在 AI 半导体市场约占 8 成的份额,与此同时 AMD 等竞争对手也在开发对抗英伟达的产品,竞争愈演愈烈。

英伟达当地时间 3 月 18 日在开发者大会上宣布,年内将推出新一代 AI 半导体“B200”,B200 和 CPU(中央运算处理装置)组合的新产品用于最新的 LLM 上。“最强 AI 加速卡”GB200 包含了两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU ,推理大语言模型性能比 H100 提升 30 倍,成本和能耗降至 25 分之一。

GB200 采用新一代 AI 图形处理器架构 Blackwell,黄仁勋在 GTC 大会上表示:“Hopper 固然已经非常出色了,但我们需要更强大的 GPU”。

据IT之家此前报道,英伟达 H200 于去年 11 月发布,其为基于英伟达的“Hopper”架构的 HGX H200 GPU,是 H100 GPU 的继任者,也是该公司第一款使用 HBM3e 内存的芯片,这种内存速度更快,容量更大,因此更适合大型语言模型。较前任霸主 H100,H200 的性能直接提升了 60% 到 90%。英伟达称:“借助 HBM3e,英伟达 H200 以每秒 4.8 TB 的速度提供 141GB 的内存,与 A100 相比,容量几乎是其两倍,带宽增加了 2.4 倍。”

法国一公司发布全球首款AI智能镜子:可识别用户情绪 缓解压力

IT之家1月8日消息,在CES2024期间,法国一家名为Baracoda的智慧健康科技公司发布了全球首款AI智能镜子BMind,按照官方的说法,这是一款专为心理健康而设计,能够识别情绪、帮助管理压力的“健康伴侣”。BMind由生成...

智谱AI推出国产大模型GLM-4 中文能力比肩GPT-4

1月16日消息,智谱AI今天发布全自研第四代基座大模型GLM-4,性能相比前一代GLM-3提升60%、中文能力比肩GPT-4。智谱AICEO张鹏介绍,GLM-4的整体性能相比上一代大幅提升,逼近GPT-4。它可以支持更长的上下文,具备更强...

ChatGPT网站流量连续三个月下滑:8月访问量下降3.2%至14.3亿次

9月8日消息,根据分析公司Similarweb最新发布的数据,今年8月份人工智能聊天机器人ChatGPT网站访问量继续下降,这也是自OpenAI于去年11月份上线ChatGPT后,网站访问量连续第三个月下降。今年8月份,ChatGPT网站在全...

微软技术主管:英伟达AI芯片供应正在改善

9月28日消息,当地时间周三,微软公司技术主管凯文·斯科特(KevinScott)表示,现在更容易拿到英伟达GPU芯片用于人工智能训练,这相比几个月前有所改善。斯科特周三在美国加州达纳波因特(DanaPoint)举行的CodeConfere...

知情人士称沙特计划设立基金投资人工智能 规模约400亿美元

3月20日消息,据外媒报道,在OpenAI训练的人工智能聊天机器人ChatGPT大火后,科技巨头们纷纷加大了在人工智能方面的投资,这一领域的初创公司也大量涌现,风投公司对这一领域的投资也大幅增加。而外媒最新的报道显示...

上一篇:Google 2023年移除超55亿条不良广告 9成由AI发现
下一篇:伊克罗德信息与向量数据库创企墨奇科技达成战略合作 共创生成式AI应用解决方案