Khi các dự án AI mở rộng, hạ tầng chính là tốc độ và niềm tin
WITIVE đang nghiên cứu, phát triển và thương mại hóa nhiều dự án AI khác nhau. Khi số lượng dự án tăng lên, các yếu tố then chốt bao gồm tài nguyên tính toán sẵn sàng, môi trường tiêu chuẩn có thể tái lập, độ ổn định ở mức vận hành dịch vụ và khả năng mở rộng.
Việc 확보 NVIDIA L40S và triển khai ASUS ESC4000-E11 không chỉ là bổ sung phần cứng, mà là nâng cấp nền tảng để kết nối liền mạch từ R&D đến production.
1. Tổng quan hệ thống — Máy chủ GPU ASUS ESC4000-E11
ASUS ESC4000-E11 là nền tảng máy chủ rack 2U, dual-socket được thiết kế cho môi trường AI/HPC cấp doanh nghiệp.
Đặc điểm chính:
– 2 × Intel® Xeon® Scalable (LGA4677)
– Tối đa 16 DIMM, ECC RDIMM DDR5-5600 (mở rộng tới mức TB)
– Tối đa 6 × NVMe/SATA/SAS hot-swap
– Nguồn dự phòng 1+1, 2600W (80 PLUS Titanium)
– 2 × 1GbE + cổng quản lý, OOB management (ASMB11-iKVM)
Hệ thống được thiết kế để cân bằng giữa hiệu năng, độ ổn định và khả năng vận hành.
2. Cấu hình hiện tại — Dual Xeon Gold 6430 + L40S 48GB
Máy chủ hiện tại của WITIVE được triển khai với cấu hình như sau.
✔ CPU : Intel Xeon Gold 6430 × 2 (Dual-socket)
✔ GPU : NVIDIA L40S 48GB × 1 (GPU AI tập trung vào inference và dịch vụ)
✔ RAM : DDR5-5600 ECC RDIMM 32GB × 2 = 64GB
✔ Lưu trữ : NVMe 4TB
✔ Nguồn điện : 2600W × 2 dự phòng (80 PLUS Titanium)
Mặc dù cấu hình ban đầu bắt đầu với 64GB RAM, nhưng nền tảng này được thiết kế để mở rộng quy mô lớn, cho phép linh hoạt đáp ứng khi khối lượng công việc tăng trong tương lai.
3. Hiệu quả kỳ vọng — Tăng tốc vòng lặp R&D và nâng cao chất lượng vận hành
Hiệu quả của AI phụ thuộc vào khả năng thử nghiệm nhanh và lặp lại liên tục. Việc sở hữu GPU nội bộ giúp giảm thời gian chờ, rút ngắn quá trình từ PoC đến MVP và production.
Ở giai đoạn vận hành, các yếu tố như độ trễ, xử lý đồng thời, khả năng phục hồi, triển khai/rollback và giám sát trở nên cực kỳ quan trọng. Hạ tầng mới giúp nâng cao cả tốc độ phát triển lẫn độ tin cậy của dịch vụ.
4. Các dự án AI của WITIVE — CONNECT WORKS, G2B AI, U:CON và hơn thế nữa
WITIVE đang liên tục phát triển các dự án như CONNECT WORKS, nền tảng phân tích dữ liệu đấu thầu công G2B AI, và hệ điều hành phân phối du lịch đa tenant U:CON.
Máy chủ GPU lần này không phục vụ cho một sản phẩm đơn lẻ mà cung cấp môi trường chuẩn hóa cho nhiều dự án song song, giúp giảm điểm nghẽn và tăng năng suất phát triển.
5. Bước tiếp theo — Xem xét xây dựng trung tâm dữ liệu quy mô nhỏ
WITIVE đã hoàn tất việc mua các văn phòng quy mô 45 pyeong tại các trung tâm công nghiệp tri thức gồm Daedeok Biz Center (Gwanpyeong-dong) và Gaon Biz Tower (Daehwa-dong), đồng thời đang xem xét việc xây dựng một trung tâm dữ liệu quy mô nhỏ dựa trên các không gian này.
Đối với các doanh nghiệp AI và nền tảng, trung tâm dữ liệu không chỉ là một cơ sở vật lý mà còn là một hệ thống vận hành đảm bảo dịch vụ được triển khai ổn định và có khả năng mở rộng.
– Khả năng mở rộng hạ tầng như bố trí rack, công suất điện, hệ thống làm mát và đi dây
– Thiết kế dự phòng: điện và mạng song song, UPS, cấu hình đường truyền
– Kiểm soát ra vào, chính sách bảo mật và quản lý quyền truy cập thiết bị
– Quy trình giám sát, bảo trì và xử lý sự cố
Việc triển khai máy chủ GPU là điểm khởi đầu cho chiến lược hạ tầng này. Trong tương lai, WITIVE hướng tới mở rộng theo từng giai đoạn có kế hoạch rõ ràng, nhằm xây dựng một mô hình tăng trưởng có thể vận hành bền vững, thay vì chỉ phản ứng thụ động theo tình huống.