Chuyển đến nội dung chính

High Performance Computing là gì?

Khi nói đến điện toán hiệu năng cao hay High Performance Computing, chúng ta thường hướng đến việc giải quyết một số loại bài toán. Những bài toán này thường sẽ rơi vào một trong bốn loại:

Nặng về Xử lý (compute intensive) – Một bài toán duy nhất đòi hỏi một lượng lớn tính toán.

Nặng về Dữ liệu (data intensive) – Một bài toán duy nhất hoạt động trên một tập dữ liệu lớn.

Nặng về Bộ nhớ (memory intensive) – Một bài toán duy nhất đòi hỏi một lượng lớn bộ nhớ.

Thông lượng cao (throughput intensive) – Nhiều bài toán không liên quan được tính toán đồng loạt.

Bài viết này sẽ giới thiệu chi tiết về HPC giúp bạn hiểu rõ ý nghĩa của chúng trong việc giải quyết các bài toán phổ biến được liệt kê ở trên.

Các workload nặng về xử lý

Đối với các bài toán đòi hỏi nhiều về xử lý, mục tiêu là phân phối công việc cho một bài toán duy nhất cho nhiều CPU để giảm thời gian xử lý càng nhiều càng tốt. Để thực hiện điều này, cần thực hiện song song các bước của bài toán. Mỗi process hoặc thread xử lý một phần khối lượng công việc và thực hiện chúng một cách đồng thời. Các CPU thường đòi hỏi phần cứng chuyên dùng cho việc giao tiếp để trao đổi dữ liệu nhanh chóng. Điển hình cho các loại bài toán này có thể kể đến là phân tích dữ liệu liên quan đến các tác vụ như mô hình hóa trong lĩnh vực tài chính, quản trị rủi ro hay chăm sóc sức khỏe. Đây được xem là phần lớn nhất trong các tập vấn đề của HPC và là lĩnh vực truyền thống của HPC.

Các workload nặng về dữ liệu

Đây có lẽ là loại workload phổ biến nhất và có lẽ là loại có nhiều buzzword nhất, chúng được gọi là các workload Big Data. Workload nặng về dữ liệu là loại workload phù hợp cho các gói phần mềm như Hadoop hoặc MapReduce. Đây thực chất là sự nghịch đảo của workload nặng về bộ nhớ trong việc di chuyển nhanh chóng dữ liệu từ các ổ đĩa quan trọng hơn vấn đề kết nối. Các workload này thường là trong lĩnh vực Life Science hay lĩnh vực nghiên cứu và có phạm vi rộng trong các ứng dụng thương mại, đặc biệt là xung quanh dữ liệu người dùng và sự tương tác.

Các workload nặng về bộ nhớ

Các workload nặng về bộ nhớ cần nhiều không gian bộ nhớ hơn là có nhiều CPU. Đây là một trong những vấn đề khó giải quyết nhất và thường đòi hỏi sự cẩn thận cao khi thiết lập nên hệ thống của bạn. Việc lập trình và chuyển mã sẽ dễ dàng hơn vì bộ nhớ sẽ liền lạc cho phép tạo ra một hình ảnh hệ thống duy nhất. Tuy nhiên, việc tối ưu hóa trở nên khó khăn hơn khi kéo dài ngày khởi tạo ban đầu của hệ thống vì tính đồng nhất của các component. Theo truyền thống, sẽ không thay thế các máy chủ sau mỗi ba năm một lần. Nếu muốn có nhiều tài nguyên hơn trong cluster và hiệu năng được đồng nhất, bộ nhớ không đồng nhất sẽ tạo ra độ trễ thực tế.

Các workload cần đến thông lượng cao

Các công việc xử lý hàng loạt được coi là workload nặng về thông lượng cao. Trong workload cần đến thông lượng cao, thông lượng trong một khoảng thời gian nhất định được quan tâm hơn là hiệu năng xử lý đối với bất kỳ bài toán nào. Có thể phân phối nhiều bài toán một cách độc lập trên nhiều CPU để giảm thời gian thực hiện tổng thể. Những workload này cần:

Chia thành các phần độc lập một cách tự nhiên

Có rất ít hoặc không có giao tiếp CPU-CPU

Được thực hiện trong các process hoặc thread riêng biệt trên một CPU (một cách đồng thời)

Workload nặng về xử lý cũng có thể được chia thành các workload nặng về thông lượng cao, tuy nhiên các workload thông lượng cao không nhất thiết đòi hỏi nhiều về CPU.

Nhận xét

Bài đăng phổ biến từ blog này

Sự khác biệt của AGV và AMR là gì?

  Tự động hóa hoạt động logistics nội bộ là một vấn đề rất được quan tâm đối với cả các công ty lớn và nhỏ. Tại sao phải sử dụng nguồn nhân lực thủ công để vận chuyển các nguyên vật liệu khi bạn có thể tự động hóa các nhiệm vụ này và để nhân viên tập trung vào các hoạt động có giá trị cao hơn? Bằng cách tự động hóa hoạt động vận chuyển hàng hoá & vật liệu, các doanh nghiệp có thể tối ưu hóa năng suất và có thể lên lịch giao hàng hiệu quả hơn để giảm tắc nghẽn trong sản xuất. Cho đến thời gian gần đây, các phương tiện xe tự hành (AGV) truyền thống là lựa chọn duy nhất để tự động hóa các nhiệm vụ vận chuyển nội bộ. AGV là thiết bị cố định quen thuộc trong các cơ sở lắp đặt lớn, cố định, nơi có nhu cầu phân phối vật liệu nhất quán, lặp đi lặp lại và nơi có thể chấp nhận chi phí ban đầu lớn và lợi tức đầu tư (ROI) lâu dài. Tuy nhiên, ngày nay AGV đang bị thách thức bởi công nghệ phức tạp hơn, linh hoạt hơn và tiết kiệm chi phí hơn, đó là các rô bốt di động tự động (AMR). Mặc d...

Edge Ai có thể mang tới những lợi ích gì trong kỷ nguyên AIoT

  Edge AI là một mô hình điện toán mới kết hợp AI trong các khung điện toán biên. Bài viết này sẽ mang tới cho các bạn thông tin về một số lợi ích và trường hợp sử dụng của nó. Việc áp dụng điện toán biên đã chứng kiến mức tăng trưởng đáng kể trong những năm gần đây. Một báo cáo gần đây của Research and Markets ghi lại rằng quy mô thị trường điện toán biên toàn cầu được dự đoán sẽ đạt 155,90 tỷ USD vào năm 2030. Một phần của những gì đã thúc đẩy sự phát triển của việc áp dụng điện toán cạnh trong các ngành công nghiệp là trí tuệ nhân tạo (AI). Với sự gia tăng của các ứng dụng IoT và dữ liệu kinh doanh, nhu cầu phát triển các thiết bị có thể xử lý thông tin nhanh hơn và thông minh hơn ngày càng tăng. Đây là nơi mà Edge AI đi vào cuộc sống. Việc tích hợp AI vào điện toán biên hoặc Edge AI đã giúp các thiết bị biên có thể sử dụng thuật toán AI để xử lý thông tin ở biên của thiết bị hoặc trên một máy chủ gần thiết bị, cắt giảm thời gian các thiết bị biên đưa ra quyết định....

Storage Server Là Gì?

Cùng với sự phát triển nhanh chóng của công nghệ kỹ thuật số, các nhà sản xuất dần nhận ra sự gia tăng về lượng dữ liệu được tạo ra từ các hoạt động kinh doanh trong nhiều năm qua. Các doanh nghiệp cũng phải nghiên cứu, tìm tòi các phương pháp mới để lưu trữ, sử dụng, truy cập và truy xuất thông tin quan trọng. Vì vậy, để đáp ứng nhu cầu lưu trữ dữ liệu ngày càng tăng này, các tổ chức đang chuyển sang sử dụng Storage Server làm giải pháp lưu trữ chính cùng những ưu điểm vượt trội như: chi phí thấp, khả năng mở rộng cao, tính tiện lợi và hiệu quả. Vậy Storage Server (hay còn gọi là máy chủ lưu trữ) là gì? Mời bạn cùng tìm hiểu qua bài viết này nhé. Khái niệm Storage Server Storage Server (hay còn được gọi là máy chủ lưu trữ) là một loại máy chủ được sử dụng cho mục đích lưu trữ, bảo mật, quản lý và truy cập dữ liệu hoặc các file dữ liệu kỹ thuật số. Storage Server cho phép lưu trữ và truy xuất lượng dữ liệu nhỏ và lớn qua Shared Network hoặc Internet. Tuy nhiên, sức mạnh xử lý ...