登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
阿里云 PAI 团队测试的 Cosmos Reason-1 tools 的性能表现如下:在 Qwen2.5-32B-Instruct 模型和 gsm8k 数据集 (Batch size = 2,048) 组合上进行后训练测试,相比其他开源框架,Cosmos Reason-1 tools 在小规模集群上实测有 1-2 倍的性能加速。它提供的模型后训练脚本 (SFT + RL) 将加速企业和开发者基于
在整个活动期间,NVIDIA 将为您提供所需的支持和工具,帮助您学习 DOCA 软件框架的基础知识,以及了解如何使用 DOCA SDK 和工具开发 DPU 加速的云应用程序。本次竞赛期间,您将有机会与 NVIDIA 顶尖的网络技术专家直接交流,并在赛前参加线上技术训练营,在专业的培训及导师的指导下利用 NVIDIA BlueField DPU 及其硬件加速功能开发 AI 或基于网络的应用程序,将您
依托 NVIDIA AI Enterprise 企业级解决方案,安利正在构建安全、高效、可扩展的 AI 基础设施体系,全面提升算力资源调度能力与推理服务工程化水平,为 AI 在全业务场景的规模化落地提供坚实支撑。借助生成式 AI,安利正在重塑业务流程,推动企业数字化转型,驱动业务创新与价值增长。借助 NVIDIA 强大硬件性能与端到端 AI 软件生态,安利在本地快速部署大语言模型,构建覆盖全链路的
通过 VAST InsightEngine,NHL 能够实现在亚秒级时间内对 PB (petabytes) 级视频的检索,支持对比赛精彩瞬间和高光时刻的近实时提取。AI 驱动的代理式工作流通过自动剪辑、标记和组合视频内容,进一步提高了内容创作效率,确保素材的便捷访问与高效利用。Linker Vision 的 AI 应用由 VSS 蓝图驱动,其智能体能够结合实时视频分析与生成式 AI 技术,不仅可以
上获取,用户可使用它高效连接、分析和优化 AI 智能体团队,并通过完整的系统可追溯性和性能分析能力,识别效率低下的问题并进行改善。SAP 的智能体 Joule 将集成 NVIDIA Llama Nemotron 的逻辑推理功能,能够解析复杂的用户请求、深度挖掘企业数据价值、自主执行跨职能的业务流程。经实测对比,税务专用逻辑推理模型相较于通用模型,在使用逻辑推理方法时,税务问题的回复质量提高了 86
请扫描如下二维码或点击文末“阅读原文”,立即注册参会。或复制粘贴:
仅仅通过几行代码,开发者即可通过包括 TensorRT-LLM 在内的流行推理框架来使用最新的 Qwen 系列模型。此外,对模型推理和部署框架的技术选型需要考虑到诸多关键因素,尤其是在把 AI 模型部署到生产环境中时,对性能、资源和成本的平衡。
要维护和优化生产环境中驱动 AI 智能体的模型,需要三类数据:用于获取洞察并适应数据模式演变的推理数据,提供智能的最新业务数据,以及验证模型与应用表现是否符合预期的用户反馈数据。已发布的 NeMo 微服务可与合作伙伴平台集成,作为创建 AI 智能体的构建模块,使用商业智能与强大的逻辑推理模型 (包括 NVIDIA Llama Nemotron) 处理更多任务。在多智能体系统中,数百个具有不同目标和
因此,我们特别推出 NVIDIA Agentic AI 实践月系列内容,带您了解代理式 AI 在 NVIDIA 内部的各个实践,分享 NVIDIA 内部团队的解决方案和重要经验,供您参考和借鉴。然而,微调较小的模型需要高质量的标记数据,而创建这些数据既耗时又昂贵。这表明 API 目录可用于生产部署。通过这些前沿实践,NVIDIA 不断突破技术创新的边界,积极加速代理式 AI 的落地应用,为开发者和
发布版本引入了一些关键的增强功能,可提升 DOCA 的功能,包括通过 DOCA Flow API 大幅提升连接追踪(CT)功能的性能。此长期支持(LTS)版本为用户提供了一种对传统使用 DPDK 或内核数据路径(kernel datapath)的 OVS 解决方案的替代方案,为现代网络环境提供更高的效率和扩展功能。IBCC 专门针对 InfiniBand 上的 AI 工作负载进行了优化,而 NVN