Công cụ tính chi phí BigQuery là gì?
Công cụ này giúp bạn ước tính hóa đơn BigQuery trên Google Cloud hàng tháng theo mô hình tính phí on-demand (theo nhu cầu): bạn trả tiền cho lượng dữ liệu mà các truy vấn quét qua, cộng với dữ liệu bạn lưu trữ. Nhờ đó, bạn có thể dự trù chi phí trước khi chạy những tác vụ phân tích nặng và nhìn rõ tác động khi liên tục quét các bảng dữ liệu lớn. Lưu ý: giá thay đổi theo khu vực (region) và được Google Cloud niêm yết bằng USD — hãy nhập đúng mức giá áp dụng cho khu vực của dự án bạn.
Cách sử dụng
Nhập lượng dữ liệu quét trung bình mỗi truy vấn tính bằng terabyte, số truy vấn bạn chạy mỗi tháng, và giá truy vấn on-demand theo TB (mức mặc định của Google ở nhiều khu vực là khoảng 6,25 USD/TB). Thêm hạn mức truy vấn miễn phí (thông thường 1 TB đầu tiên mỗi tháng được miễn phí), sau đó là dung lượng lưu trữ đang hoạt động tính bằng GB và giá lưu trữ theo GB/tháng (khoảng 0,02 USD cho storage đang hoạt động). Công cụ sẽ nhân lượng dữ liệu tính phí với giá truy vấn rồi cộng thêm chi phí lưu trữ.
Giải thích công thức
Tổng dữ liệu quét = dữ liệu mỗi truy vấn × số truy vấn. Dữ liệu tính phí = tổng dữ liệu quét − hạn mức miễn phí (không bao giờ nhỏ hơn 0). Chi phí truy vấn = dữ liệu tính phí × giá theo TB. Chi phí lưu trữ = dung lượng GB × giá theo GB. Ước tính hàng tháng = chi phí truy vấn + chi phí lưu trữ.
$$\text{Total Cost} = \max\!\left(Q \cdot D - F,\; 0\right) \cdot P_q \;+\; S \cdot P_s$$ $$\text{where}\quad \left\{ \begin{aligned} D &= \text{Data Scanned (TB)} \\ Q &= \text{Queries / Month} \\ F &= \text{Free Tier (TB)} \\ P_q &= \text{Query Price (\$/TB)} \\ S &= \text{Storage (GB)} \\ P_s &= \text{Storage Price (\$/GB)} \end{aligned} \right.$$
Ví dụ minh họa
Giả sử mỗi truy vấn quét 1 TB, bạn chạy 1.000 truy vấn mỗi tháng, giá là 6,25 USD/TB, và hạn mức miễn phí là 1 TB. Tổng dữ liệu quét = \(1.000 \text{ TB}\); dữ liệu tính phí = \(999 \text{ TB}\); chi phí truy vấn = \(999 \times 6{,}25 = 6.243{,}75 \text{ USD}\). Cộng thêm 1.000 GB lưu trữ với giá 0,02 USD/GB = \(20 \text{ USD}\). Tổng cộng = 6.263,75 USD mỗi tháng.
Tham Chiếu Giá Trên Yêu Cầu Của BigQuery
Mô hình trên yêu cầu của Google BigQuery tính phí dựa trên khối lượng dữ liệu mà mỗi truy vấn quét, cộng thêm một khoản phí hàng tháng riêng biệt cho dữ liệu được lưu trữ. Các tỷ giá dưới đây là danh sách giá được ghi chép rộng rãi cho vùng đa khu vực Hoa Kỳ, được niêm yết bằng USD. Giá cả thay đổi theo từng khu vực (ví dụ, một số khu vực tính phí cao hơn trên mỗi TB), vì vậy hãy luôn xác nhận với trang giá hiện tại của Google Cloud và khu vực thanh toán của bạn.
| Thành Phần | Tỷ Giá Được Ghi Chép (Hoa Kỳ) | Ghi Chú |
|---|---|---|
| Giá truy vấn trên yêu cầu | ~$6.25 / TB quét | Tính phí dựa trên byte được xử lý, làm tròn lên; tối thiểu 10 MB trên mỗi truy vấn |
| Lưu trữ hoạt động | ~$0.02 / GB / tháng | Các bảng hoặc phân vùng được sửa đổi trong 90 ngày qua |
| Lưu trữ dài hạn | ~$0.01 / GB / tháng | Dữ liệu không được sửa đổi trong 90 ngày liên tiếp (~50% giảm giá) |
| Lớp truy vấn miễn phí | 1 TB / tháng | 1 TB đầu tiên của dữ liệu truy vấn được xử lý miễn phí mỗi tháng |
| Lớp lưu trữ miễn phí | 10 GB / tháng | 10 GB đầu tiên của lưu trữ miễn phí mỗi tháng |
Trong công thức chi phí, tỷ giá truy vấn ánh xạ tới \(P_q\) ($/TB), tỷ giá lưu trữ tới \(P_s\) ($/GB), khoảng cho phép truy vấn miễn phí tới \(F\) (TB), và khối lượng lưu trữ của bạn tới \(S\) (GB). Tải, sao chép và xuất dữ liệu nói chung là miễn phí, nhưng chèn luồng và một số hoạt động khác có các khoản phí riêng không được mô hình hóa ở đây.
Chi Phí Trên Các Tình Huống Khối Lượng Công Việc Phổ Biến
Bảng dưới đây áp dụng công thức \(\text{Tổng cộng} = \max(Q\cdot D - F,\,0)\cdot P_q + S\cdot P_s\) sử dụng giá truy vấn là $6.25/TB, lớp miễn phí 1 TB, lưu trữ cố định ở 500 GB, và lưu trữ được định giá ở $0.02/GB/tháng (khoản phí lưu trữ $10.00 trong mỗi hàng). Tổng số dữ liệu quét hàng tháng là \(Q\cdot D\).
| Tình Huống | Dữ Liệu / Truy Vấn | Truy Vấn / Tháng | Tổng Quét | Có Thể Tính Phí (sau 1 TB miễn phí) | Chi Phí Truy Vấn | Chi Phí Lưu Trữ | Tổng Cộng / Tháng |
|---|---|---|---|---|---|---|---|
| Nhẹ | 0.1 TB | 200 | 20 TB | 19 TB | $118.75 | $10.00 | $128.75 |
| Trung Bình | 1 TB | 1,000 | 1,000 TB | 999 TB | $6,243.75 | $10.00 | $6,253.75 |
| Nặng | 5 TB | 2,000 | 10,000 TB | 9,999 TB | $62,493.75 | $10.00 | $62,503.75 |
Chi phí truy vấn trong tình huống nhẹ được tính toán là \((200 \times 0.1 - 1) \times 6.25 = 19 \times 6.25 = \$118.75\), cộng với \(500 \times 0.02 = \$10.00\) lưu trữ. Những con số này làm rõ ràng rằng đối với các khối lượng công việc lớn, chi phí truy vấn (quét) vượt xa lưu trữ — kiểm soát byte quét là nơi tiết kiệm được chi phí.
Các Thuật Ngữ Chính Được Giải Thích
- Dữ liệu quét / byte được xử lý (\(D\))
- Khối lượng dữ liệu bảng mà một truy vấn đọc, được đo bằng byte và tính phí trên mỗi TB. BigQuery tính phí dựa trên byte được xử lý bất kể có bao nhiêu hàng được trả về; chọn ít cột hơn sẽ đọc ít byte hơn.
- Truy vấn trên mỗi tháng (\(Q\))
- Bạn chạy bao nhiêu truy vấn như vậy hàng tháng. Tổng khối lượng quét là \(Q \cdot D\), từ đó lớp miễn phí \(F\) được trừ đi trước khi áp dụng giá truy vấn \(P_q\).
- Trên yêu cầu vs. dung lượng (slot)
- Trên yêu cầu tính phí trên mỗi TB quét (mô hình trong máy tính này). Giá dung lượng thay vào đó dành riêng các đơn vị tính toán gọi là slot cho tỷ giá hàng giờ hoặc được cam kết, tách rời chi phí khỏi byte quét — tốt hơn cho việc sử dụng ổn định, lớn.
- Lưu trữ hoạt động vs. dài hạn
- Một bảng hoặc phân vùng là lưu trữ hoạt động khi được sửa đổi trong 90 ngày qua (~$0.02/GB). Nếu không chạm vào trong 90 ngày liên tiếp, nó trở thành lưu trữ dài hạn với giá khoảng một nửa (~$0.01/GB), không thay đổi hiệu suất.
- Lớp miễn phí (\(F\))
- Mỗi tháng BigQuery cung cấp 1 TB xử lý truy vấn và 10 GB lưu trữ miễn phí. Trong công thức, \(F\) là khoảng cho phép truy vấn miễn phí được trừ từ tổng khối lượng quét, được làm sàn tại 0.
- Phân vùng & Phân cụm
- Các kỹ thuật tổ chức một bảng sao cho truy vấn chỉ đọc các phần liên quan. Phân vùng hiệu quả (ví dụ, theo ngày) và phân cụm giảm \(D\) — byte được quét — trực tiếp giảm chi phí trên yêu cầu.
- Khu vực
- Vị trí địa lý của tập dữ liệu của bạn. Tỷ giá truy vấn trên mỗi TB và tỷ giá lưu trữ trên mỗi GB khác nhau theo khu vực; \(P_q\) và \(P_s\) trong công cụ này nên phù hợp với khu vực nơi dữ liệu của bạn nằm.
Câu hỏi thường gặp
Con số này có chính xác với hóa đơn của tôi không? Không — đây chỉ là ước tính. Chi phí BigQuery thực tế phụ thuộc vào khu vực, phiên bản (on-demand so với capacity/slots), mức giảm giá cho lưu trữ dài hạn so với đang hoạt động, và việc làm tròn đến MB gần nhất.
Làm sao để giảm chi phí truy vấn? Chỉ chọn những cột thật sự cần, phân vùng (partition) và phân cụm (cluster) bảng, cẩn thận khi xem trước bằng LIMIT (LIMIT không làm giảm số byte được quét), và dùng trình kiểm tra truy vấn (query validator) để xem số byte sẽ quét trước khi chạy.
Hạn mức miễn phí có được làm mới không? Hạn mức phân tích miễn phí của gói on-demand (thường là 1 TB) được làm mới mỗi tháng. Hãy đặt về 0 nếu nó không còn áp dụng cho tài khoản của bạn.