Một nhóm các nhà nghiên cứu khoa học trong phòng thí nghiệm trên máy tính để bàn để kiểm tra nội dung được đặt dưới kính hiển vi.

Mở rộng quy mô khối lượng công việc AI trong môi trường HPC

Khám phá cách triển khai và mở rộng quy mô khối lượng công việc AI động trong môi trường HPC của bạn để mở khóa những hiểu biết sâu sắc mới, tăng tốc kết quả và cho phép các cơ hội mới.

Những thông điệp chính

  • Các bộ dữ liệu lớn, thời gian đến giá trị nhanh hơn và nhu cầu về thông tin chuyên sâu hơn đang thúc đẩy nhu cầu về HPC được tăng tốc bằng AI.

  • AI trong HPC yêu cầu các công nghệ tối đa hóa băng thông bộ nhớ và điện toán để đáp ứng nhu cầu khối lượng công việc đòi hỏi nhiều dữ liệu.

  • Các giải pháp phần cứng và phần mềm nguồn mở hiệu năng cao Intel® được thiết kế để tăng tốc HPC để khám phá khoa học.

author-image

Bởi

Bước vào Kỷ nguyên mới của HPC được tăng tốc bằng AI

Trong nhiều năm, người dùng cuối, nhà xây dựng hệ thống, nhà cung cấp giải pháp và nhà phát triển đã khai thác sức mạnh của HPC để giải quyết các vấn đề khó khăn nhất và phức tạp nhất trên thế giới. Tuy nhiên, sự tăng trưởng liên tục của dữ liệu, nhu cầu về thời gian đến giá trị nhanh hơn, đòi hỏi những hiểu biết sâu sắc hơn và sâu hơn để khám phá khoa học và các hạn chế về thời gian và chi phí bổ sung đang đẩy các giới hạn của các hệ thống hiện tại.

Đồng thời, các thuật toán AI đang ngày càng tăng về độ tinh vi và có thể xử lý các bộ dữ liệu lớn hơn nhiều so với những năm trước, khiến chúng trở thành sự phù hợp lý tưởng để giải quyết khối lượng công việc khoa học ngày càng tăng. Các tổ chức tận dụng sức mạnh của AI và HPC cùng nhau có thể giảm thời gian nghiên cứu sâu sắc của họ trong khi đáp ứng hoặc vượt quá mức độ chính xác tương tự, cuối cùng cho phép họ giải quyết một số vấn đề phức tạp và cấp bách nhất thế giới.

Ví dụ: Cơ sở Điện toán Lãnh đạo Argonne (ALCF) của Phòng thí nghiệm Quốc gia Argonne ở Illinois, ngôi nhà tương lai của hệ thống HPC Aurora exascale, đang giúp thúc đẩy nghiên cứu khoa học thông qua sự hội tụ của HPC, phân tích dữ liệu hiệu năng cao và AI. Các dự án mới nhất được dự kiến cho ALCF sẽ sử dụng AI để mô hình hóa các điều kiện lò phản ứng năng lượng tổng hợp; phát triển các mô hình chất lỏng không xâm lấn, cụ thể cho bệnh nhân để hiểu sự tiến triển và nội địa hóa của các bệnh khác nhau của con người; và hiểu rõ hơn về đa vật lý trong lò phản ứng nhiệt hạch.

Khám phá bộ sưu tập câu chuyện thành công của khách hàng của chúng tôi để khám phá cách các tổ chức và tổ chức nghiên cứu khác đang tận dụng HPC được tăng tốc bằng AI để thúc đẩy đổi mới khoa học chính xác và có tác động.

Hiểu được Những thách thức của AI trong HPC

Khi bạn bắt đầu quá trình khởi động sáng kiến HPC được tăng tốc bằng AI của riêng mình, điều quan trọng là phải hiểu những thách thức chung mà bạn có thể phải đối mặt.

 

  • Đối với các cấu hình AI và HPC, theo truyền thống có sự đánh đổi giữa các yêu cầu AI và HPC trong cấu trúc CPU. Khối lượng công việc nặng bằng AI thường trao đổi số lượng lõi cho tốc độ, trong khi khối lượng công việc HPC thường thích hiệu năng điện toán lớn hơn với số lượng lõi cao và băng thông lõi nhiều hơn.
  • Ngày càng nhiều khối lượng công việc đòi hỏi nhiều dữ liệu, chẳng hạn như mô hình, mô phỏng và AI, tạo ra các tắc nghẽn hiệu năng đòi hỏi các giải pháp với bộ nhớ băng thông cao được cấu trúc để mở khóa và tăng tốc chúng.
  • Mức độ phức tạp cao của AI trong HPC là nguồn ma sát chính để áp dụng. Các bộ kỹ năng cho AI và HPC rất cụ thể và việc tìm kiếm tài năng có kỹ năng trong cả hai lĩnh vực là rất khó. Tuy nhiên, nếu không có tài năng này, các sáng kiến HPC được tăng tốc bằng AI có thể không tiến triển.

 

Để giúp khách hàng vượt qua những trở ngại này, chúng tôi hợp tác chặt chẽ với cộng đồng HPC về việc sử dụng AI để chia sẻ chuyên môn và ý tưởng và cung cấp các giải pháp đổi mới, sử dụng các công nghệ HPC hàng đầu của chúng tôi.

Tạo Kế hoạch Triển khai HPC được Tăng tốc bằng AI của bạn

Một bước thiết yếu để tăng tốc các dự án HPC của bạn bằng AI là tạo ra kế hoạch triển khai toàn diện bao gồm nhu cầu và yêu cầu của tổ chức của bạn để đảm bảo bạn có các công nghệ phù hợp để nghiên cứu và khám phá.

Khi bạn tìm cách thêm các khả năng AI mạnh mẽ vào môi trường HPC của mình, đây là một số câu hỏi cần hỏi để bạn có thể đưa ra quyết định công nghệ sáng suốt hơn:

 

  • Các yêu cầu về thời gian và độ chính xác mà đầu ra của bạn cần đáp ứng?
  • Bạn nên nhận thức và tránh loại thiên vị thuật toán nào?
  • Những nhượng bộ đánh đổi nào được chấp nhận để đạt được các yêu cầu độ nhạy hoặc độ đặc hiệu của bạn?
  • Lựa chọn mô hình, bộ dữ liệu và đầu ra của bạn có thay đổi kích thước và hướng không?
  • Thay đổi mã sẽ xảy ra ở đâu và như thế nào đối với các dự án?
  • Cách tốt nhất để bạn đạt được thay đổi mã là gì?
  • Liệu có cần phải viết lại một lượng lớn mã cho từng trường hợp sử dụng không?
  • Những loại khối lượng công việc nào và bao nhiêu khối lượng công việc sẽ được chạy? Khối lượng công việc cần chạy bao lâu một lần? Họ sẽ chạy liên tục?

 

Câu trả lời cho những câu hỏi này có thể cung cấp cho bạn nền tảng vững chắc về các yêu cầu để sử dụng khi khám phá các phương án thiết kế hệ thống với đối tác công nghệ của bạn.

Chọn công nghệ cho phép khám phá HPC được tăng tốc bằng AI

Chìa khóa để hiện thực hóa lời hứa của AI trong HPC là chọn các công nghệ phù hợp hoạt động cùng nhau để tối đa hóa băng thông bộ nhớ và điện toán để phù hợp với nhu cầu của các cấu hình khối lượng công việc động của bạn.

Intel cung cấp một bộ công nghệ HPCAI toàn diện được xây dựng trên khung cấu trúc chéo, dựa trên tiêu chuẩn mở để đơn giản hóa việc triển khai và cung cấp năng lượng và hiệu năng linh hoạt mà bạn cần để đáp ứng nhu cầu của khối lượng công việc độc đáo của bạn. Ngoài ra, các công cụ phần mềm nguồn mở, mạnh mẽ của chúng tôi giúp tăng tốc phát triển mã, vì các nhà phát triển có thể viết mã một lần và triển khai trên bất kỳ hệ thống nào trên trung tâm dữ liệu và đám mây.

Chọn phần cứng với hiệu năng và hiệu quả cao

Để bắt đầu xây dựng tổ hợp độc đáo các công nghệ HPC được tăng tốc bằng AI, chúng tôi khuyên bạn nên bắt đầu với nền tảng phần cứng mạnh mẽ, chẳng hạn như nền tảng được hỗ trợ bởi bộ xử lý Intel® Xeon® có thể mở rộng. Các CPU này có Intel® Accelerator Engines tích hợp cho AI và HPC, bao gồm Intel® Advanced Matrix Extensions (Intel® AMX) và Intel® Advanced Vector Extensions 512 (Intel® AVX-512), để mang lại hiệu năng vượt trội nhằm hỗ trợ khối lượng công việc HPC và AI đòi hỏi khắt khe.

Nếu công việc của bạn liên quan đến khối lượng công việc rất phức tạp tập trung vào đào tạo và suy luận quy mô lớn, bạn có thể muốn xem xét phần cứng chuyên dụng hơn mang lại mức thông lượng cao hơn.

 

  • Bộ gia tốc AI Intel® Gaudi® cung cấp điện toán có thể mở rộng hiệu quả cao, để cho phép các nhà khoa học dữ liệu và kỹ sư học máy tăng tốc đào tạo và xây dựng mới hoặc di chuyển các mô hình hiện có chỉ với một vài dòng mã. Bộ gia tốc AI Intel® Gaudi® cũng cung cấp hiệu quả năng lượng đáng kinh ngạc để giúp giảm chi phí và tăng tính bền vững.
  • Bộ xử lý CPU Intel® Xeon® Chuỗi Max mang lại hiệu năng đột phá mà bạn cần cho các khả năng AI-HPC trong tương lai đồng thời bỏ chặn các tắc nghẽn cho khối lượng công việc bị ràng buộc bộ nhớ. CPU Intel® Xeon® Chuỗi Max là bộ xử lý dựa trên x86 đầu tiên và duy nhất được siêu nạp với bộ nhớ băng thông cao có thể mang lại hiệu năng tốt hơn tới 4,8 lần so với khả năng cạnh tranh trên khối lượng công việc HPC và AI trong thế giới thực.1 Để tối đa hóa tác động của CPU Intel® Chuỗi Max và để đảm nhận khối lượng công việc khó khăn nhất của bạn, GPU Intel® Data Center GPU Max Series có thể được tích hợp như GPU rời. Nó gói hơn 100 tỉ bóng bán dẫn vào một gói và bao gồm kết cấu hợp nhất, mạch lạc, tốc độ cao Intel® Xe Link để giúp bạn linh hoạt chạy bất kỳ hệ số hình dạng nào nhằm cho phép mở rộng và mở rộng quy mô.

 

Các tổ chức trên toàn thế giới hiện đang sử dụng các công nghệ Intel® này để thúc đẩy công việc của họ. Ví dụ: Trung tâm Điện toán Nâng cao Texas (TACC) đang sử dụng CPU Intel® Xeon® Chuỗi Max, Intel® Data Center GPU Max Series và bộ xử lý có thể mở rộng Intel® Xeon® để hỗ trợ nghiên cứu học thuật trên khắp Hoa Kỳ. Trong khi Servicio Meteorológico Nacional (SMN) của Argentina, nơi có siêu máy tính mạnh nhất ở Mỹ Latinh để nghiên cứu học thuật, được xây dựng trên CPU và GPU Intel® Chuỗi Max.

Tăng tốc các dự án HPC và AI của bạn bằng các công cụ phần mềm mạnh mẽ

Khi nhu cầu về AI và HPC tăng lên, các nhà phát triển phải đối mặt với một số thách thức khi tìm cách xây dựng các ứng dụng HPC nhanh có thể mở rộng quy mô dễ dàng trên các cấu trúc. Việc chuyển đổi phần mềm sang hoạt động trên các cụm HPC và lập trình hiệu quả điện toán song song hiệu năng cao có thể đòi hỏi đầu tư thời gian đáng kể cho các nhà phát triển. Đồng thời, các nhà phát triển cần tăng tốc khối lượng công việc chuyên dụng trên các cấu trúc đồng thời đảm bảo mã của họ hoạt động với càng nhiều loại phần cứng và mô hình điện toán càng tốt—cũng là một nỗ lực tốn thời gian và tốn kém.

Để giúp các nhà phát triển vượt qua những thách thức này, Intel áp dụng cách tiếp cận mở đối với phần mềm HPC và tối ưu hóa HPC, cung cấp Bộ công cụ Intel® oneAPI ngôn ngữ mở hoạt động trên các mạng không đồng nhất. Điều này cho phép các nhà phát triển xây dựng các ứng dụng điện toán song song, hiệu năng cao‒được tối ưu hóa, cấu trúc chéo nhanh hơn và dễ dàng hơn.

Bộ dụng cụ Cơ sở Intel® oneAPI và Bộ dụng cụ HPC Intel® oneAPI cho phép các nhà phát triển xây dựng, phân tích, tối ưu hóa và mở rộng quy mô các ứng dụng HPC trên nhiều loại cấu trúc dễ dàng hơn và nhanh hơn. Đối với các nhà phát triển, nhà khoa học dữ liệu và nhà nghiên cứu làm việc với khối lượng công việc AI và phân tích, Intel cung cấp Bộ dụng cụ phân tích AI Intel® oneAPI, có các công cụ Python và khung AI quen thuộc để tăng tốc đường ống AI, tối đa hóa hiệu năng và cung cấp khả năng tương tác để phát triển hiệu quả hơn. Ngoài ra, cả HPC và bộ công cụ AI đều được xây dựng bằng các thư viện oneAPI để tối ưu hóa điện toán cấp thấp. Bằng cách xây dựng các ứng dụng HPC với oneAPI, các nhà phát triển có thể tránh khóa mã lập trình độc quyền để tối đa hóa khám phá và khám phá các cơ hội mới.

Tăng tốc khối lượng công việc HPC và AI của bạn với Intel

Khi bạn thực hiện các bước tiếp theo để triển khai AI trong HPC, các công nghệ hàng đầu của chúng tôi, hệ sinh thái đối tác rộng lớn và các kết nối cộng đồng sâu có thể giúp bạn đơn giản hóa và tăng tốc hành trình của mình. Để tìm hiểu thêm về những gì Intel cung cấp cho tổ chức của bạn và để bắt đầu, hãy kết nối với đại diện Intel® của bạn hoặc bất kỳ đối tác công nghệ Intel® AI hoặc HPC nào.