让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

英伟达开导GPU定位本事? 官方恢复!

发布日期:2025-12-19 15:39    点击次数:55

用于监测扫数这个词GPU的开动景色和库存。

作家 | ZeR0

芯东西12月11日报说念,本日,英伟达文书正在开导用于可视化和监测GPU集群的软件处置决议,并再度强调:“NVIDIA GPU莫得硬件追踪本事、隔断开关和后门。”

此前据外媒报说念,英伟达已开导出位置考据本事,可自大其芯片在哪个国度开动。本日英伟达在一篇博客著述中提供了更多研究细节,包括贪图将客户端软件智能体开源。

证据英伟达博客著述,这项新软件处置决议是为了确保AI数据中心保抓最好状态开动而想象,向云配结伴伴和企业提供知悉姿色板,可匡助数据中心运营商监测扫数这个词AI GPU集群开动景色,普及扫数这个词策划基础智力的GPU平日开动时间。

该功能将以软件选件的体式提供给用户装置,并诳骗GPU的“奥妙策划才能”。这项工作由客户弃取、自行装置和扫尾,用于监测GPU使用情况、成立和特地。

通过这项工作,数据中心运营商将大略:

追踪功耗峰值,在不超出能耗预算的前提下最大化单元功耗性能。

监测扫数这个词集群的诳骗率、内存带宽和互连开动景色。

趁早发现热门柔柔流问题,以幸免过热降频和组件过早老化。

证据软件成立和诞生一致,以确保成果可复现以及开动可靠。

发现特地和终点情况,趁早发现故障部件。

这些功能不错匡助企业和云提供商可视化其GPU集群、处置系统瓶颈并优化出产力,从而普及投资汇报。

此可选工作提供及时监测,让每个GPU系统与外部云工作通讯和分享GPU成见。工作将配备客户端软件智能体,客户可装置该智能体,将节点级GPU遥测数据流式传输到托管在NVIDIA NGC的流派网站上。

客户可在姿色板中可视化其GPU集群诳骗率,既不错全局检讨,也不错按策划区域(在归拢物理或云位置注册的节点组)检讨。

该客户端用具智能体也贪图开源,以提供透明度和可审计性。它将提供一个本体示例,展示客户如何将英伟达用具整合到他们我方的GPU基础智力监测处置决议中。

这一软件大略匡助企业了解其GPU库存情况,但无法修改GPU成立或底层开动机制。它提供的是只读遥测数据,并由客户自行料理及自界说。

该工作还因循客户生成详备先容GPU集群信息的诠释。

另据外媒本日报说念,英伟达周三浮现,“莫得功能允许英伟达费力扫尾或对已注册系统遴荐步履”,发送给英伟达工作器的遥测数据是“只读的”,这意味着该公司的工作器不成将数据写回芯片,“英伟达GPU里面莫得允许英伟达或费力参与者禁用英伟达GPU的功能”。

该功能将最初在英伟达最新的Blackwell芯片上兑现,英伟达也在筹商前几代芯片的弃取。