Quy trình làm việc khoa học dữ liệu chính
Các máy trạm được thiết kế đặc biệt này kết hợp khoảng bộ nhớ lớn, nhiều khe mở rộng để kết nối nhiều thiết bị và CPU được lựa chọn riêng được thiết kế để đáp ứng nhu cầu độc đáo của các nhà khoa học dữ liệu và nhà phân tích dữ liệu dựa trên Python như bạn.
Máy trạm khoa học dữ liệu: Bao gồm siêu năng lực
Với tư cách là một nhà khoa học dữ liệu, bạn dành phần lớn thời gian của mình để xử lý các tập dữ liệu trung bình và lớn trong các thư viện và thuật toán Python chuyên sâu về CPU - điều này khiến hầu hết các máy trạm phải sử dụng đến đầu máy.
Đó là vì máy trạm của bạn có thể đã được dựng sẵn để đào tạo mô hình nhưng chưa được xây dựng để chuyển đổi dữ liệu đòi hỏi cao về bộ nhớ.
Tránh lỗi bộ nhớ khi cố gắng tải và khám phá dữ liệu - một trải nghiệm phổ biến khi các chức năng Pandas yêu cầu nhiều bộ nhớ hơn máy tính hoặc phiên bản đám mây của bạn có sẵn.
Điện toán NumPy/SciPy nhanh hơn so với thế hệ trước
Đại số tuyến tính là nền tảng của số và khoa học dữ liệu. Các công cụ điện toán số do NumPy và SciPy cung cấp cho phép nhà khoa học dữ liệu làm việc thông qua các phân tích và chức năng số cũng như nhiều mô hình học máy và công thức toán học. iBench là một điểm chuẩn kiểm tra các lệnh căng thẳng trong đại số tuyến tính của các thuật toán phổ biến được sử dụng trong NumPy và SciPy như dot, det, inv, lu, qr và svd. Hiệu năng được đo bằng giây (thấp hơn là tốt hơn). So với Xeon-W3275 thế hệ thứ 3, Xeon-W3495X thế hệ thứ 4 hoạt động nhanh hơn 25% đến 75% trong các thử nghiệm iBench mới nhất.1
Khoa học dữ liệu siêu nạp
Chúng tôi thiết kế Intel-based máy trạm khoa học dữ liệu chuyên sâu để giúp cho quy trình làm việc AI và học máy chuyên sâu về dữ liệu nhanh chóng, linh hoạt và phản hồi nhanh. Với bộ nhớ lên đến 8TB trong các hệ thống ổ cắm kép và CPU phù hợp với khối lượng công việc, các máy trạm này có thể chạy các bộ dữ liệu trung bình đến lớn trong bộ nhớ và cạo râu nhiều giờ với các tác vụ tốn nhiều thời gian nhất trong phát triển AI.
Máy trạm Khoa học Dữ liệu nền tảng Intel đề xuất
Intel-based máy trạm khoa học dữ liệu có ba nền tảng - di động, chính thống và chuyên gia - với một loạt các CPU, dung lượng bộ nhớ và các khe mở rộng PCIe.
Nền tảng di động khoa học dữ liệu cho bộ dữ liệu 32GB-64GB
Hiệu suất vượt trội để phát triển AI di động và trực quan hóa dữ liệu.
- Intel Core chuỗi HX với tối đa 24 lõi (8P+16E).
- DDR5 DRAM 128GB cho tất cả các nền tảng.
- SKU đề xuất:
- i9-13950HX (24 lõi)
- i7-13850HX (20 lõi)
Nền tảng chính thống khoa học dữ liệu cho bộ dữ liệu 64GB-512GB
Hiệu suất mỗi đô la tuyệt vời để tiền xử lý và phân tích trên các tập dữ liệu kích thước trung bình.
- Intel Xeon W-2400 với tối đa 24 lõi được mở khóa.
- Lên đến 2TB DDR5 ĐIỀU CHỈNH.
- SKU đề xuất:
- W7-2495X (24 lõi)
- W5-2465X (16 lõi)
Nền tảng chuyên gia khoa học dữ liệu lên đến 8TB DDR5 cho nền tảng hai khe cắm
Hiệu suất tối đa để thao tác các bộ dữ liệu lớn, học máy và phân tích dữ liệu.
- Intel Xeon W-3400 với tối đa 56 lõi.
- Lên đến 4TB DDR5 HƯỚNG DẪN CHO chuỗi W-3400 và lên đến 8TB DDR5 cho các nền tảng xeon SP thế hệ thứ 4 ổ cắm kép.
- SKU đề xuất cho các nền tảng một khe cắm:
- W9-3475X(36 lõi)
- W7-3455 (24 lõi)
- W5-3425X (16 lõi)
- SKU đề xuất cho nền tảng hai khe cắm:
- 6448Y (32 lõi)
- 6442Y (24 lõi)
- 6444Y (16 lõi)
Chạy nhanh hơn với Bộ công® cụ phân tích Intel oneAPI AI
Chúng tôi đã tối ưu hóa các công cụ phổ biến nhất trong hệ sinh thái Python cho kiến trúc Intel và gói chúng trong Bộ công cụ phân tích Ai Intel oneAPI để giảm bớt trải nghiệm của bạn trong việc xây dựng môi trường khoa học dữ liệu của bạn và tăng hiệu suất của các công cụ này. Các tối ưu hóa thả xuống này đã sẵn sàng để chạy để bạn có thể làm việc nhanh hơn với ít hoặc không có thay đổi mã hóa.
Các câu hỏi thường gặp
Có hai yếu tố chính cần xem xét khi chọn máy trạm khoa học dữ liệu: công cụ và kỹ thuật nào bạn sử dụng nhiều nhất và dung lượng bộ dữ liệu của mình.
Khi nói đến các khung khoa học dữ liệu, số lượng lõi cao hơn không phải lúc nào cũng dịch thành hiệu suất tốt hơn. NumPy, SciPy và sc vẹt-learn không mở rộng quy mô vượt quá 18 lõi. Mặt khác, HEAVY. AI (trước đây là OmniSci) sẽ lấy tất cả các lõi mà nó có thể có được.
Tất cả các máy trạm khoa học dữ liệu Intel-based đều sử dụng các bộ xử lý Intel® Core™, Intel® Xeon® W và Intel® Xeon® có khả năng mở rộng vượt trội so với khối lượng công việc khoa học dữ liệu trong các bài kiểm tra trong thế giới thực. Bạn sẽ nhận được hiệu năng tốt nhất trong dòng bộ xử lý từ tất cả các sản phẩm này, điều này khiến dung lượng bộ nhớ trở thành lựa chọn quan trọng nhất của bạn.
Các khung khoa học dữ liệu giúp dấu chân bộ nhớ bong bóng hai đến ba lần. Để có được nhu cầu bộ nhớ cơ bản của bạn, hãy kiểm tra các tập dữ liệu điển hình của bạn và nhiều phần ba. Nếu bạn có thể làm việc với 512 GB hoặc ít hơn, bạn có thể có hiệu suất tuyệt vời trong máy tính để bàn. Nếu bộ dữ liệu của bạn ở trên 500 GB, bạn sẽ cần một cặp có bộ nhớ từ 1,5 TB trở lên.
Bộ tăng tốc GPU tỏa sáng ở chương trình đào tạo mô hình học sâu và suy luận học sâu quy mô lớn. Tuy nhiên, đối với phần lớn công việc khoa học dữ liệu — chuẩn bị dữ liệu, phân tích và học máy cổ điển— những GPU đó không hoạt động vì hầu hết các thư viện Python dành cho khoa học dữ liệu chạy nguyên bản trên CPU. Bạn cần một bộ điều hợp đồ họa để điều khiển màn hình của mình, nhưng không cần một thiết bị GPU.
Đám mây sẽ không cung cấp cho bạn hiệu suất tốt nhất trừ khi bạn đang chạy trên máy ảo chuyên dụng hoặc máy chủ bare metal. Các phiên bản đám mây thể hiện mình như một nút duy nhất, nhưng ở phía sau, mọi thứ phân tán cao. Khối lượng công việc và dữ liệu của bạn được phân chia trên nhiều máy chủ ở nhiều vị trí. Điều này tạo ra độ trễ xử lý và bộ nhớ làm giảm thời gian chạy. Ngoài ra, làm việc với các bộ dữ liệu và đồ thị lớn thông qua một máy tính để bàn từ xa không phải là một trải nghiệm lý tưởng.
Giữ cho khối lượng công việc và dữ liệu cục bộ trên một máy duy nhất, có thể mang lại hiệu suất tốt hơn nhiều và trải nghiệm làm việc linh hoạt và nhanh nhạy hơn.
Bạn có thể, nhưng bạn sẽ đốt cháy một lượng thời gian lớn để xem dữ liệu phân tán giữa bộ lưu trữ, bộ nhớ và CPU. Nếu bạn đang làm việc trong môi trường chuyên nghiệp, việc nâng cấp lên máy tính xách tay khoa học dữ liệu hoặc máy tính để bàn tầm trung của Intel® có thể giúp tiết kiệm thời gian. Chúng tôi đã cố tình thử nghiệm và xác định Intel® Core™ máy tính xách tay khoa học dữ liệu dựa trên dữ liệu để sinh viên, người mới bắt đầu và các nhà sản xuất AI có thể có một lựa chọn hợp lý để phát triển và thử nghiệm với các công cụ AI nguồn mở.
Bạn có thể chạy công cụ khoa học dữ liệu dựa trên Python nhanh hơn trên một máy tính tiêu chuẩn bằng cách sử dụng các thư viện và phân phối được Intel tối ưu hóa. Tất cả chúng đều là một phần của bộ dụng cụ Intel AI miễn phí.
Thông báo và Miễn trừ Trách nhiệm
Theo ước tính bằng các phép đo được thực hiện bằng cách sử dụng nền tảng xác thực của Intel, so sánh Intel Xeon Intel Xeon w9-3495X với Intel® Xeon® W-3275 trên NumPy/SciPy – Inv, N=25000
Xem phần intel.com/performanceindex chi tiết cấu hình. Kết quả có thể khác nhau.
Kết quả về hiệu năng dựa trên thử nghiệm từ ngày hiển thị trong cấu hình và có thể không phản ánh đúng tất cả các bản cập nhật hiện đã công bố. Xem phần sao lưu để biết thông tin chi tiết cấu hình. Tìm hiểu thêm tại intel.com/PerformanceIndex.
Pandas, sc vẹt-learn và đạt được khả năng tăng tốc TensorFlow bằng cách sử dụng Intel® Distribution of Modin. Để biết thêm chi tiết, hãy xem phần intel.com/content/www/vn/vi/developer/articles/technical/code-changes-boost-pandas-scikit-learn-tensorflow.html#gs.mdyh9o.
© Intel Corporation. Intel, biểu trưng Intel và các ký hiệu khác của Intel là thương hiệu của Intel Corporation chi nhánh của Intel. Các tên và nhãn hiệu khác có thể là tài sản của những người khác.
Thông tin Sản phẩm và Hiệu năng
Nội dung gốc bằng tiếng Anh trên trang này vừa do con người vừa do máy dịch. Nội dung này chỉ để cung cấp thông tin chung và giúp quý vị thuận tiện. Quý vị không nên tin đây là thông tin hoàn chỉnh hoặc chính xác. Nếu có bất kỳ mâu thuẫn nào giữa bản tiếng Anh và bản dịch của trang này, thì bản tiếng Anh sẽ chi phối và kiểm soát. Xem phiên bản tiếng Anh của trang này.