Chia sẻ về việc ra mắt Xeon 6 và Gaudi 3, ông Justin Hotard - Phó Chủ tịch Điều hành kiêm Tổng Giám đốc Nhóm Trung tâm Dữ liệu và Trí tuệ Nhân tạo tại Intel - nhấn mạnh nhu cầu của thị trường về phần cứng, phần mềm và công cụ phát triển đa dạng để hỗ trợ cơ sở hạ tầng AI.
"Nhu cầu ngày càng lớn về AI dẫn đến một sự chuyển đổi lớn trong lĩnh vực trung tâm dữ liệu. Ngành công nghệ đang đòi hỏi có nhiều lựa chọn hơn về phần cứng, phần mềm và các công cụ phát triển. Với Xeon 6 tích hợp P-core và bộ tăng tốc AI Gaudi 3, Intel đang hỗ trợ một hệ sinh thái mở để các doanh nghiệp có thể triển khai mọi ứng dụng tốt hơn, cả về hiệu năng xử lý, khả năng sử dụng điện, và tính bảo mật", Justin Hotard nói.
Việc ra mắt sản phẩm mới của Intel được hỗ trợ bởi một số đối tác trong ngành, bao gồm Dell Technologies, IBM, Supermicro, Google và Hewlett Packard Enterprise; nhằm cung cấp cho các doanh nghiệp cơ sở hạ tầng tiên tiến vừa tiết kiệm chi phí vừa sẵn sàng để phát triển và triển khai AI nhanh chóng.
Theo đó, Intel mang đến những cải tiến mới về công nghệ cho cơ sở hạ tầng AI thông qua hai sản phẩm mới trong danh mục trung tâm dữ liệu.
Trong đó, Intel Xeon 6 với P-core được thiết kế để chạy các ứng dụng đòi hỏi sức mạnh tính toán cao với hiệu quả sử dụng điện vượt trội, mang đến hiệu năng gấp đôi so với thế hệ tiền nhiệm. Dòng vi xử lý mới của Intel có số lượng nhân nhiều hơn, băng thông bộ nhớ gấp đôi và khả năng tăng tốc AI tích hợp. Qua đó, đáp ứng các yêu cầu về hiệu năng của AI từ các thiết bị vùng biên đến trung tâm dữ liệu và môi trường đám mây.
Cùng đó là Gaudi 3 được tối ưu hóa cho các mô hình generative AI (Gen AI) quy mô lớn, với 64 nhân xử lý Tensor (TPC) và 8 công cụ nhân ma trận (matrix multiplication engine, viết tắt là MME) để tăng tốc khả năng tính toán của mạng thần kinh nhân tạo (deep neural network). Bộ tăng tốc AI này có bộ nhớ HBM2e 128 gigabyte (GB) cho việc huấn luyện và suy luận, và 24 cổng Ethernet 200 Gigabit (Gb) cho khả năng mở rộng mạng. Gaudi 3 cũng cung cấp khả năng tương thích mượt mà với framework PyTorch và các mô hình transformer và diffuser tiên tiến từ Hugging Face.
Được biết, IBM và Intel đang hợp tác để cung cấp dịch vụ Gaudi 3 nhằm hỗ trợ khách hàng tận dụng tốt sức mạnh của AI. Thông qua sự hợp tác này, Intel và IBM đặt mục tiêu giảm tổng chi phí sở hữu để tận dụng và mở rộng quy mô AI, đồng thời nâng cao hiệu năng xử lý.
Đại diện Intel cho biết, việc triển khai AI trên quy mô lớn đòi hỏi doanh nghiệp phải cân nhắc đến nhiều yếu tố, như các tùy chọn triển khai có đủ linh hoạt để đáp ứng nhu cầu, tỉ lệ hiệu năng trên giá thành có thực sự cạnh tranh, và các công nghệ AI có thể sử dụng được. Hạ tầng x86 mạnh mẽ và hệ sinh thái mã nguồn mở rộng lớn của Intel hỗ trợ các doanh nghiệp xây dựng các hệ thống AI mang lại giá trị cao với tổng chi phí sở hữu và hiệu năng trên mỗi watt điện được tối ưu. Đáng chú ý, 73% các máy chủ tăng tốc bằng GPU đều sử dụng Intel Xeon làm CPU chính.
Được xây dựng trên Nền tảng Mở dành cho AI cấp Doanh nghiệp (Open Platform for Enterprise AI, viết tắt là OPEA), các giải pháp này tích hợp các dịch vụ con dựa trên OPEA vào một hệ thống RAG có khả năng mở rộng, được tối ưu hóa cho các hệ thống AI chạy Xeon và Gaudi. Hệ thống này được thiết kế để cho phép doanh nghiệp dễ dàng tích hợp các ứng dụng từ Kubernetes, Red Hat OpenShift AI, và Red Hat Enterprise Linux AI.
Danh mục Tiber của Intel cung cấp các giải pháp giúp doanh nghiệp giải quyết các thách thức như khả năng truy cập, chi phí, độ phức tạp, bảo mật, tiết kiệm điện năng, và khả năng mở rộng trên các môi trường AI, điện toán đám mây và thiết bị vùng biên. Intel Tiber Developer Cloud hiện cung cấp các hệ thống xem trước của Intel Xeon 6 để doanh nghiệp có thể đánh giá và thử nghiệm công nghệ.
Ngoài ra, một số khách hàng sẽ được tiếp cận Intel Gaudi 3 sớm để xác thực các phương án triển khai mô hình AI khi các cụm Gaudi 3 sẽ bắt đầu được triển khai trong quý tới cho quá trình sản xuất trên quy mô lớn.