BetVictor Sports(伟德体育)国际官网(访问: hash.cyou 领取999USDT)
不过起码表示LLM可以辅助芯片设计。英伟达首席科学家Bill Dally在分析师沟通会上说ChipNeMo在内部主要扮演3个角色。其一是让初级水平的芯片设计师,在有问题的时候就直接问ChipNeMo,这样不会浪费那些高级芯片设计的时间;其次是对bug报告做总结,因为硅工们写的bug报告有时又长又复杂,而且经常只有本人能看懂,那么ChipNeMo此时就可以为旁人理解bug报告起到很大的帮助作用;最后,ChipNeMo的确能生成Verilog,不过一般英伟达不会这么去用...
不过如果要说NIM的确切构成,实际还是比较复杂的,包括各种预训练模型、及各种跑模型的依赖包,如CUDA, CuDNN, TensorRT-LLM, Triton Inference Server等等……上接AI API。这部分咱就不细说了,有兴趣的去研究下英伟达的博客与文档——不过从这些中间件,其实也能看出,英伟达要为企业解决模型优化之类的问题,而不单是提供和修改模型(当然关键也包括要卖跑在下面的硬件,和NVIDIA AI企业解决方案)。
在此期间,黄仁勋反复提到了英伟达作为“AI foundry”的设定,说法上是对于LLM,“并非创造,而是生产(not create it, but manufacture it)”,是为英伟达作为AI foundry的定位。“你去跑这些模型,规模化运行的时候,向我们支付的其实只是AI操作系统的钱。”黄仁勋说,“操作系统也就是NVIDIA AI Enterprise”,“非常划算”…就差没讲“buy more, save more”了…
HASHKFK