Bộ xử lý có khả năng mở rộng Intel® Xeon® thế hệ thứ 5, trước đây có tên mã là Emerald Rapids, đã giới thiệu khả năng Độ tin cậy, Tính khả dụng và Khả năng bảo trì (RAS) mới được gọi là Quét tại hiện trường của Intel®. Đây là dòng công cụ được thiết kế để giúp quản trị viên hệ thống nhanh chóng và dễ dàng tìm thấy các bộ xử lý bị lỗi theo thời gian. Intel® In-Field Scan có một lộ trình các khả năng sẽ được đưa vào các bộ xử lý hiện tại và tương lai. Scan-at-Field (SAF) và Array Built In Self Test (BIST) là hai tính năng đầu tiên trong dòng sản phẩm In-Field Scan và cả hai đều khả dụng trên bộ xử lý Intel® Xeon® thế hệ thứ 5.
Intel® In-Field Scan xâm nhập tối thiểu và được thiết kế để nhanh chóng kiểm tra một lõi, trong khi tất cả các lõi khác trong nút tiếp tục chạy khối lượng công việc của khách hàng.
Quét* là một phương pháp tiêu chuẩn ngành để phát hiện lỗi trong các thiết bị bán dẫn. Cho đến nay, quét đã được sử dụng bởi các thiết bị kiểm tra chuyên dụng trong các nhà máy sản xuất chip. Intel sử dụng tính năng quét để kiểm tra bộ xử lý trong quá trình sản xuất khối lượng lớn (HVM).
Scan-At-Field cho phép khách hàng chạy một tập hợp con các thử nghiệm quét sản xuất của Intel để kiểm tra lỗi các lõi xử lý riêng lẻ. Sử dụng các mẫu thử nghiệm do Intel cung cấp (được gọi là Hình ảnh kiểm tra quét), mỗi lõi trong gói bộ xử lý có thể được kiểm tra độc lập để xác nhận hoạt động bình thường.
Array BIST kiểm tra bộ nhớ đệm L1 (Cấp 1) và L2 (Cấp 2) và nhiều tệp đăng ký và mảng dữ liệu trong mỗi lõi. Là một tự kiểm tra tích hợp (BIST), không có hình ảnh thử nghiệm để tải; Tất cả các thử nghiệm được điều phối bởi một mô-đun kiểm tra chuyên dụng trong mỗi lõi.
Tổng quan kỹ thuật cấp cao về SAF và ArrayBIST được cung cấp trong tài liệu kỹ thuật Tìm kiếm các thành phần bị lỗi trong Môi trường Hạm đội Trực tiếp. Chi tiết về các yêu cầu hệ thống và cách chạy In-Field Scan được cung cấp trong Hướng dẫn Kích hoạt Quét Tại chỗ của Intel® dành cho Bộ xử lý Intel® Xeon® thế hệ thứ 5.
Quét tại chỗ của Intel® là một bước tiến quan trọng trong lĩnh vực dịch vụ cung cấp độ tin cậy và tính khả dụng, vì tính năng này cho phép khách hàng sử dụng khả năng kiểm tra trong ngành để nhanh chóng xác định các thiết bị lỗi trong nhóm của họ.
Có các yêu cầu về phần cứng và phần mềm để cho phép Quét tại chỗ Intel® trên một nền tảng. Dưới đây là tóm tắt các yêu cầu.
Intel® In-Field Scan được thiết kế và tối ưu hóa để các quản trị viên hệ thống sử dụng để kiểm tra nhóm định kỳ nhằm đảm bảo các bộ xử lý hoạt động chính xác. Intel® In-Field Scan cung cấp cho quản trị viên hệ thống một bài kiểm tra bộ xử lý rất nhanh có thể chạy trên các nút trực tiếp (nghĩa là một nút đang trực tuyến và đang chạy các ứng dụng người dùng) mà không làm gián đoạn toàn bộ hoạt động của nút. Trong trường hợp này, thuật ngữ rất nhanh có nghĩa là ~ 200ms hoặc ít hơn.
Thử nghiệm định kỳ của đội xe được khuyến nghị để tìm các thành phần đã bị hỏng theo thời gian. Tần suất kiểm tra đội tàu và mức độ rộng lớn của thử nghiệm để chạy là một câu hỏi phức tạp. Nhiều biến số xuất hiện, ví dụ: Bộ xử lý đã chạy được bao lâu; tỷ lệ Failure in Time (FIT) 2 dự đoán của bộ xử lý là bao nhiêu; khả năng chịu đựng của khách hàng đối với SDE (Lỗi dữ liệu im lặng) là gì; và lượng thời gian quản trị hệ thống sẵn sàng dành cho việc bảo trì hệ thống chủ động.
Tài liệu kỹ thuật Tìm kiếm các thành phần bị lỗi trong Môi trường Hạm đội Trực tiếp cung cấp các cân nhắc và ví dụ về tần suất Chạy quét tại chỗ.
Hướng dẫn kích hoạt tính năng Quét tại chỗ dành cho Bộ xử lý Intel Xeon thế hệ thứ 5 của Intel® có thông tin chi tiết về cách chạy, kiểm tra và hiểu kết quả.
Hình ảnh kiểm tra quét nội bộ Intel® cho bộ xử lý Intel® Xeon® thế hệ thứ 5 và hướng dẫn kiểm tra phiên bản hoặc tải hình ảnh mới được đăng (yêu cầu tài khoản NDA - Cách đăng ký Trung tâm tài liệu và tài nguyên Intel®).
Ứng dụng quét nội bộ Intel® đã được đăng (yêu cầu phải có tài khoản NDA - Cách đăng ký Trung tâm Tài liệu và Tài nguyên Intel®).
Trong một đội tàu có hàng trăm nghìn, hoặc hàng triệu bộ xử lý, lỗi có thể xảy ra một cách thường xuyên. Tìm ra những khiếm khuyết này càng nhanh càng tốt là chìa khóa để giảm thiểu sự gián đoạn đối với hoạt động của khách hàng.
Intel đang dẫn đầu ngành bằng cách cung cấp nhiều công cụ và lộ trình tính năng để kiểm tra các bộ xử lý hoạt động chính xác. Intel® In-Field Scan mở rộng các khả năng thử nghiệm này để cải thiện khả năng quản lý nhóm của quản trị viên hệ thống.
Intel cũng cung cấp Intel® Data Center Diagnostic Tool (Intel® DCDiag). Intel® DCDiag là một bộ kiểm tra kiểm tra một cách có phương pháp hầu hết các chức năng của SoC, bao gồm cả chức năng của từng lõi vi xử lý riêng lẻ. Bằng cách xác minh rằng mọi tính toán DCDIAG đều chính xác và không chỉ xác nhận rằng thử nghiệm đã hoàn thành thực thi đúng cách, DCDIAG có thể phát hiện nhiều loại lỗi, bao gồm cả những lỗi biểu hiện dưới dạng Lỗi dữ liệu im lặng. Để biết thêm thông tin về Intel® DCDiag , hãy truy cập liên kết này.
Intel® In-Field Scan và Intel® DCDiag là các công cụ kiểm tra bổ sung. Intel® In-Field Scan xâm nhập tối thiểu và được thiết kế để nhanh chóng kiểm tra một lõi, trong khi tất cả các lõi khác trong nút tiếp tục chạy khối lượng công việc của khách hàng. Intel® DCDiag là một bộ kiểm tra bộ xử lý toàn diện và hiệu quả nhất khi toàn bộ nút xử lý được dành riêng để thử nghiệm. Vì các công cụ chạy nội dung kiểm tra khác nhau, Intel nhận thấy rằng mỗi công cụ xác định các lỗi khác nhau trên các bộ xử lý được thử nghiệm.
Ghi: Không phải tất cả SKU của Bộ xử lý Intel® Xeon® thế hệ thứ 5 đều hỗ trợ tính năng Quét tại hiện trường của Intel®.