Rate limiting là một kỹ thuật để hạn chế số lượng yêu cầu mà một người dùng hoặc một ứng dụng có thể gửi đến một máy chủ trong một khoảng thời gian nhất định. Rate limiting có thể giúp bảo vệ máy chủ khỏi bị quá tải, ngăn chặn các cuộc tấn công từ chối dịch vụ (DDoS) và cải thiện hiệu suất của ứng dụng.
Tags: #system-design