英伟达亲自下场!AI模型Llama Nemotron Super v1.5性能爆表,成本暴降?
英伟达(NVIDIA)公司近日推出了一款名为“Llama Nemotron Super v1.5”的新型AI模型,旨在提升人工智能代理的准确性和效率。
据介绍,NVIDIA Nemotron系列通过采用英伟达开放的合成数据集、先进技术和工具,在生态系统中已有的强大开放模型基础上进行增强,从而实现了更高的准确性、效率和透明度。
此次推出的Llama Nemotron Super v1.5在数学、科学、编码、函数调用、指令遵循和聊天等核心推理和代理任务方面取得了显著进步,同时保持了强大的吞吐量和计算效率。新媒网跨境了解到,该模型专为推理和代理工作负载而设计。
Llama Nemotron Super v1.5建立在与Llama Nemotron Ultra相同的有效推理基础上。 然而,该模型通过使用专门针对高信号推理任务的新数据集进行后训练而得到改进。
在各种基准测试中,Llama Nemotron Super v1.5 的性能优于同等规模的其他开放模型,尤其是在需要多步骤推理和结构化工具使用的任务中。
图1. Llama Nemotron Super v1.5 在推理和代理任务中提供最高的准确性
为了提高吞吐量和部署效率,英伟达采用了诸如神经架构搜索之类的剪枝技术。 新媒网跨境认为,更高的吞吐量意味着模型可以更快地进行推理,并在相同的计算和时间预算内探索更复杂的问题空间,从而以更低的推理成本提供更强大的推理能力。 此外,该模型还可以在单个GPU上运行,进一步降低了计算开销。
图2. Llama Nemotron Super v1.5 为代理任务提供最高的准确性和吞吐量,从而降低了推理成本
目前,用户可以通过build.nvidia.com体验Llama Nemotron Super v1.5,也可以直接从Hugging Face下载该模型。
新媒网跨境获悉,英伟达公司一直致力于在人工智能领域不断创新,并积极推动AI技术的应用和发展。此次推出的Llama Nemotron Super v1.5模型,有望为各行各业带来更高效、更智能的解决方案,助力人工智能技术的普及和应用。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。











评论(0)