AWS NVIDIA NIM增强了AI推理能力

🤖 由文心大模型生成的文章摘要

生成式人工智能正迅速改变各行各业，推动对安全、高性能推理解决方案的需求，以便高效且经济扩展日益复杂的模型。

亚马逊网络服务（AWS）在年度AWS re:Invent大会上宣布扩大与英伟达的合作，已将NVIDIA NIM微服务扩展到关键AWS AI服务中，以支持生成式AI应用更快的AI推理和更低的延迟。

NVIDIA NIM微服务现可直接从AWS Marketplace、Amazon Bedrock Marketplace和Amazon SageMaker JumpStart获取，这使得开发者可以更轻松大规模部署针对常用模型的NVIDIA优化推理。

NVIDIA NIM是AWS Marketplace中提供的NVIDIA AI Enterprise软件平台的一部分，为开发者提供了一组易于使用的微服务，旨在跨云、数据中心和工作站安全、可靠部署高性能企业级 AI模型推理。

这些预构建的容器建立在强大的推理引擎上，例如NVIDIA Triton推理服务器、NVIDIA TensorRT、NVIDIA TensorRT-LLM和PyTorch，并支持广泛的AI模型——从开源社区模型到NVIDIA AI Foundation模型和自定义模型。

NIM微服务可部署在各种AWS服务中，包括Amazon Elastic Compute Cloud（EC2）、Amazon Elastic Kubernetes Service（EKS）和Amazon SageMaker。

开发者可在NVIDIA API目录中预览由常用模型和模型系列构建的100多个NIM微服务，包括Meta Llama 3、Mistral AI Mistral和Mixtral、NVIDIA Nemotron、Stability AI SDXL等等。最常用的微服务可用于自托管以部署在AWS服务上，并且经过优化可在AWS上的 NVIDIA加速计算实例上运行。

「93913原创内容，转载请注明出处」

相关文章

IDC：预计2028年全球生成式AI智能手机出货量将占市场70%，2024年将增长360%以上

谷歌称DeepMind JEST优化训练数据方案使AI训练速度提升13倍，能效提升10倍

智谱AI增资至3107万，北京市人工智能产业投资基金等入股

业界首款“汽车小芯片AI加速器”，BOS推出汽车AI芯片

Peer完成1050万美元融资，以拓展AI驱动3D社交平台

人工智能仅用两天时间就破解了科学家耗时数年的超级细菌难题

推荐

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

苹果公布一系列HMD专利申请，重点关注新型安全系统

Bigscreen Beyond 2首年销量已超过第一代

AI应用推荐

热门

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

友情链接

推荐

小派最新软件更新改进了Crystal Light VR头显追踪功能

苹果发布visionOS 2.4，集成Apple Intelligence、空间画廊和新iPhone

苹果公布一系列HMD专利申请，重点关注新型安全系统

Bigscreen Beyond 2首年销量已超过第一代