ํด๋ผ์ฐ๋ GPU ์ธ์คํด์ค ๋น์ฉ ๊ณ์ฐ๊ธฐ๋?
์ด ๊ณ์ฐ๊ธฐ๋ GPU ๊ฐ์ ํด๋ผ์ฐ๋ ์ธ์คํด์ค๋ฅผ ์ด์ํ ๋ ๋๋ ๋น์ฉ์ ์์ธกํด ์ค๋๋ค. ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ ํ์ต, ์์ ๋ ๋๋ง, ์ถ๋ก (inference) ์ํฌ๋ก๋ ์ฒ๋ฆฌ ๋ฑ ์ด๋ค ์์ ์ด๋ ํด๋ผ์ฐ๋ ์ฌ์ ์(AWS, Google Cloud, Azure ๋ฑ)๋ ๋ณดํต GPU 1๊ฐ๋น ์๊ฐ ๋จ์๋ก ์๊ธ์ ๋ถ๊ณผํฉ๋๋ค. ์ด ๋๊ตฌ๋ ์๊ฐ๋น ์๊ธ์ GPU ๊ฐ์์ ์ฌ์ฉ ์๊ฐ์ ๊ณฑํด ์ด๋น์ฉ์ ๋ช ํํ๊ฒ ์๋ ค์ฃผ๊ณ , ์์ฐ ์๋ฆฝ์ ์ ์ฉํ ์ผ๋ณยท์๋ณ ํ์ฐ ๋น์ฉ๊น์ง ํจ๊ป ๋ณด์ฌ์ค๋๋ค.
์ฌ์ฉ ๋ฐฉ๋ฒ
๋ค์ ์ธ ๊ฐ์ง ๊ฐ๋ง ์ ๋ ฅํ๋ฉด ๋ฉ๋๋ค. GPU 1๊ฐ๋น ์๊ฐ๋น ์๊ธ(์: $2.50/์๊ฐ), ์ธ์คํด์ค๋ ์์ ์ ์ฌ์ฉํ GPU ๊ฐ์, ๊ทธ๋ฆฌ๊ณ ์์ ์ฌ์ฉ ์๊ฐ์ ๋๋ค. ๊ณ์ฐ๊ธฐ๋ ์ด๋น์ฉ๊ณผ ํจ๊ป ํด๋น ๊ธฐ๊ฐ ๋์ GPU 1๊ฐ์ ๋๋ ๋น์ฉ, ๊ทธ๋ฆฌ๊ณ 24์๊ฐ ๊ธฐ์ค ๋ฐ 730์๊ฐ(ํ ๋ฌ) ๊ธฐ์ค ํ์ฐ ๋น์ฉ์ ๋ณด์ฌ์ค๋๋ค. ์ด๋ฅผ ํตํด ์จ๋๋งจ๋ ์๊ธ์ ์์ฝํ(reserved)์ด๋ ์์ ์ก ์๊ธ๊ณผ ์์ฝ๊ฒ ๋น๊ตํ ์ ์์ต๋๋ค.
๊ณ์ฐ ๊ณต์ ํ์ด
ํต์ฌ ๊ณต์์ ๋งค์ฐ ๊ฐ๋จํฉ๋๋ค. $$\text{๋น์ฉ} = \text{์๊ธ} \times \text{GPU ๊ฐ์} \times \text{์ฌ์ฉ ์๊ฐ}$$ ์ ํ์ฐ ๋น์ฉ์๋ 730์๊ฐ์ ์ ์ฉํ๋๋ฐ, ์ด๋ ํ ๋ฌ ํ๊ท ์๊ฐ์ ๋ํ๋ด๋ ์ ๊ณ ํ์ค๊ฐ์ ๋๋ค(\(365 \times 24 \div 12\)๊ฐ์). ๋จ, ์๊ธ์ ์ฌ์ ์, ๋ฆฌ์ (region), GPU ๋ชจ๋ธ์ ๋ฐ๋ผ ํฌ๊ฒ ๋ฌ๋ผ์ง๋ฏ๋ก ๋ฐ๋์ ํ์ฌ ๊ณต์๋ ๊ฐ๊ฒฉ์ ํ์ธํ์๊ธฐ ๋ฐ๋๋๋ค.
๊ณ์ฐ ์์
GPU 8๊ฐ๋ฅผ GPU ์๊ฐ๋น $2.50์ 10์๊ฐ ๋์ ๋น๋ฆฐ๋ค๊ณ ๊ฐ์ ํด ๋ด ์๋ค. ์ด๋น์ฉ $$\text{๋น์ฉ} = 2.50 \times 8 \times 10 = \textbf{\$200}$$ ์ ๋๋ค. ์ด 10์๊ฐ ๋์ GPU 1๊ฐ์ ๋๋ ๋น์ฉ์ \(2.50 \times 10 = \$25\)์ด๊ณ , GPU 8๊ฐ๋ฅผ ํ ๋ฌ ๋ด๋ด ๋๋ฆด ๊ฒฝ์ฐ์ ์ ํ์ฐ ๋น์ฉ์ \(2.50 \times 8 \times 730 = \$14{,}600\)์ด ๋ฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
์คํ ๋ฆฌ์ง๋ ๋ฐ์ดํฐ ์ ์ก ์๊ธ๋ ํฌํจ๋๋์? ์๋์. ์ด ๊ณ์ฐ๊ธฐ๋ GPU ์ปดํจํ ๋น์ฉ๋ง ๋ค๋ฃน๋๋ค. ์คํ ๋ฆฌ์ง, ๋คํธ์ํน, ๋ฐ์ดํฐ ์ ์ก(egress) ์๊ธ์ ๋๋ถ๋ถ์ ํด๋ผ์ฐ๋์์ ๋ณ๋๋ก ์ฒญ๊ตฌ๋ฉ๋๋ค.
์ ํ์ฐ์ ์ 730์๊ฐ์ ์ฐ๋์? 730์๊ฐ์ 1๋ ์ ๊ธฐ์ค์ผ๋ก ํ ๋ฌ ํ๊ท ์๊ฐ์ผ๋ก, ํด๋ผ์ฐ๋ ์ฌ์ ์๋ค์ด ์์ ์ก ์๊ธ์ ๋น๊ตํ ๋ ์ฌ์ฉํ๋ ํ์ค ๊ธฐ์ค์ ๋๋ค.
์ด๋ค ํตํ๋ ์ฌ์ฉํ ์ ์๋์? ๋ค. ์ฌ์ ์๊ฐ ์ฒญ๊ตฌํ๋ ํตํ ๋จ์๋ก ์๊ธ์ ์ ๋ ฅํ๋ฉด ๊ฒฐ๊ณผ๋ ๋์ผํ ๋จ์๋ก ํ์๋ฉ๋๋ค.