Hoạt động suy luận AI tạo ra với Cisco UCS / Bộ xử lý Intel Xeon thế hệ thứ 5 và thứ 4
Intel® QuickAssist Technology (Intel® QAT) Intel® QuickAssist Technology (Intel® QAT) HPC Library Intel® Xeon® Scalable Processors Intel® Xeon® Scalable Processors
812502
2023-12-29
Public
Không thể xem trước tệp tin này. Vui lòng tải xuống tệp tin.
Mô tả
Cisco UCS, được hỗ trợ bởi bộ xử lý Intel® Xeon® thế hệ thứ 5 và Cisco Nexus, là nền tảng có thể mở rộng để triển khai Generative AI trên quy mô lớn. Kiến trúc này mang lại:
- Hiệu suất tối ưu: Cisco UCS với bộ xử lý có thể mở rộng Intel Xeon với bộ tăng tốc AI chuyên dụng và khung phần mềm được tối ưu hóa giúp cải thiện đáng kể hiệu suất suy luận và khả năng mở rộng.
- Kiến trúc cân bằng: Cisco UCS vượt trội trong cả điện toán Học sâu và không Học sâu, rất quan trọng đối với toàn bộ quy trình suy luận. Cách tiếp cận cân bằng này dẫn đến hiệu suất tổng thể và sử dụng tài nguyên tốt hơn.
- Khả năng mở rộng theo yêu cầu: Cisco UCS thay đổi quy mô liền mạch với nhu cầu suy luận Generative AI của bạn. Thêm hoặc xóa máy chủ, điều chỉnh dung lượng bộ nhớ và định cấu hình tài nguyên theo cách tự động khi mô hình của bạn phát triển và khối lượng công việc tăng lên bằng Cisco Intersight.
Bạn có tùy chọn chạy suy luận trong trung tâm dữ liệu hoặc ở biên, sử dụng hệ số dạng mô-đun hoặc giá đỡ.
Lệnh sử dụng
Tài sản liên quan
Tiêu đề và Mô tả
Định dạng
Ngôn ngữ
Hành động
Cisco UCS M7 and Pure Storage FlashArray: FlashStack VSI with VMware vSphere 8.0 — Design Guide
Cisco 7th generation of UCS C-Series and UCS X-Series Servers, powered using 4th Gen Intel Xeon Scalable processors., and Pure Storage FlashArray FlashStack on VMware vSphere 8 solution.
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 Powered by Intel — Design Guide
Cisco UCS M7 IMM FlexPod Datacenter with VMware vSphere 8.0, and NetApp ONTAP 9.12 powered by Intel design guide
FlashStack Cisco UCS X-Series and Pure Storage FlashArray//X R3 for VMware Horizon 8 — Design Guide
FlashStack Virtual Desktop Infrastructure for VMware Horizon 8 VMware vSphere 8.0 U1 and 4th Gen Intel® Xeon® Scalable processors Design Guide
Cisco UCS with 5th Gen and 4th Gen Intel Xeon Processors for Generative AI
Cisco UCS, powered by 5th Gen Intel® Xeon® processors, delivers a compelling solution for maximizing Generative AI performance.
Generative AI Inferencing with Cisco UCS X-Series M7 Blade Servers / 5th Gen Intel Xeon Processors
Cisco UCS® with Intel® Xeon® Scalable processors and Cisco Nexus® offers a compelling and scalable foundation for deploying generative AI at scale.
GenAI Inferencing Powered by Cisco UCS X-Series / 5th Gen Intel Xeon Processors on Red Hat OpenShift AI — Cisco Validated Design
Cisco, Red Hat, and Intel provide a proven AI infrastructure to enable VMware-based Red Hat® OpenShift® AI.
Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors — White Paper
This white paper contains a reference architecture that illustrates the benefits of Microsoft SQL Server 2022 on Cisco UCS X210c M6/M7 on 4th Gen Intel® Xeon® Scalable Processors for bare-metal and hybrid cloud deployments.