حاسبة متطلبات ذاكرة VRAM لنماذج اللغة الكبيرة (LLM)

الاتصال عبر MCP →

أدخل الحساب

صيغة رياضية

نتائج

ذاكرة VRAM المقدّرة المطلوبة

١٦٫٨

جيجابايت

أوزان النموذج الخام	١٤ GB
الهامش الإضافي (KV cache، التنشيطات، إلخ)	٢٫٨ GB

ما هي حاسبة متطلبات ذاكرة VRAM لنماذج اللغة الكبيرة؟

تساعدك هذه الأداة على تقدير حجم ذاكرة كرت الشاشة (VRAM) اللازمة لتحميل نموذج لغوي كبير (LLM) وتشغيله في مرحلة الاستدلال. يتحدد حجم الذاكرة المطلوب في المقام الأول بعدد معاملات النموذج وبدقة التمثيل الرقمي المستخدمة لتخزين كل وزن. أما عامل الهامش (الأمان الإضافي) فيأخذ في الحسبان ذاكرة الـ KV cache والتنشيطات وسياق CUDA، وهي عناصر تستهلك ذاكرة إضافية تتجاوز حجم الأوزان الخام وحده.

كيفية الاستخدام

أدخل حجم النموذج بالمليارات من المعاملات (مثلاً 7 لنموذج بحجم 7B، أو 70 لنموذج Llama-3 70B). ثم اختر دقة التخزين: تستهلك دقة FP32 أربعة بايت لكل وزن، بينما تستهلك FP16/BF16 بايتين، وتستهلك INT8 بايتًا واحدًا، أما تكميم INT4 فيستهلك نصف بايت فقط. وأخيرًا حدّد عامل الهامش الإضافي — تُعدّ القيمة 1.2 (أي هامش إضافي بنسبة 20%) خيارًا افتراضيًا معقولًا للاستدلال ضمن سياق قصير، ويُنصح برفعها مع السياقات الطويلة أو معالجة الدفعات (batching).

شرح المعادلة

$$\text{VRAM (GB)} = \text{Params (B)} \times \text{Bytes/Param} \times \text{Overhead}$$ وبما أن المليار بايت يساوي تقريبًا 1 جيجابايت، فإن ضرب عدد المعاملات بالمليارات في عدد البايتات لكل معامل يعطينا الناتج مباشرةً بالجيجابايت. ثم يأتي عامل الهامش ليضاعف هذه القيمة بما يكفي لتغطية ذاكرة التشغيل الفعلية.

اعلان

مقارنة بالأعمدة لعدد البايتات لكل معامل لدقّات FP32 وFP16 وINT8 وINT4 — الصيغ ذات الدقة الأقل تستخدم بايتات أقل لكل معامل، مما يقلل من VRAM.

رسم يوضح ضرب عدد معاملات النموذج في عدد البايتات لكل معامل وفي معامل الحمل الإضافي للحصول على إجمالي ذاكرة VRAM لوحدة معالجة الرسومات — ذاكرة VRAM = عدد المعاملات × البايتات لكل معامل × معامل الحمل الإضافي.

مثال تطبيقي

لنموذج بحجم 7B بدقة FP16 وبعامل هامش 1.2: $$7 \times 2 \times 1.2 = 16.8 \text{ جيجابايت}$$ وهو ما يتسع له بأريحية كرت بسعة 24 جيجابايت. وأما النموذج نفسه بدقة INT4: $$7 \times 0.5 \times 1.2 = 4.2 \text{ جيجابايت}$$ وهو قابل للتشغيل بسهولة على كرت شاشة بسعة 8 جيجابايت.

الأسئلة الشائعة

لماذا يكون الاستهلاك الفعلي أكبر من حجم الأوزان الخام؟ لأن ذاكرة الـ KV cache تتزايد مع طول السياق وحجم الدفعة، كما تحجز أطر العمل ذاكرة إضافية للتنشيطات والمخازن المؤقتة — وهذا تحديدًا ما يقدّره عامل الهامش الإضافي.

هل يشمل هذا التقدير مرحلة التدريب؟ لا. فالتدريب يحتاج إلى ذاكرة أكبر بنحو 3 إلى 4 أضعاف لتخزين حالات المُحسِّن (optimizer) والتدرجات؛ أما هذا التقدير فموجّه لمرحلة الاستدلال.

ما عامل الهامش المناسب؟ استخدم نحو 1.2 للمطالبات القصيرة، و1.5 إلى 2.0 أو أكثر مع السياقات الطويلة أو معالجة الدفعات الثقيلة.

آخر تحديث: 19 يونيو 2026

الآلات الحاسبة ذات الصلة

حاسبة تحويل رموز LLM (التوكنز) إلى كلمات

حوّل بين رموز نماذج LLM والكلمات فورًا. احسب عدد الكلمات المقابلة لعدد التوكنز أو العكس بالاعتماد على قاعدة ‎0.75‎ كلمة لكل توكن.
حاسبة سرعة الإنترنت المطلوبة

اكتشف كم ميجابت في الثانية يحتاجه إنترنت منزلك. اجمع البث والألعاب ومكالمات الفيديو والتصفّح عبر كل الأجهزة مع هامش أمان للسرعة.
حاسبة تكلفة واجهة LLM البرمجية (API)

احسب تكلفة استخدام واجهات نماذج LLM البرمجية من عدد توكنات الإدخال والإخراج والسعر لكل 1000 توكن، واعرف كلفة الطلب الواحد وإجمالي الإنفاق.
حاسبة تكلفة توكنات نماذج الذكاء الاصطناعي (LLM)

احسب تكلفة استدعاءات واجهات LLM البرمجية انطلاقًا من توكنات الإدخال والإخراج وأسعار كل 1000 توكن. قدّر تكلفة كل استدعاء وإجمالي الإنفاق عبر آلاف الطلبات.
حاسبة تحويل توكنات نماذج LLM إلى كلمات وتكلفة الاستخدام

حوّل توكنات نماذج LLM إلى عدد كلمات تقديري واحسب تكلفة الـ API بناءً على سعر كل 1000 توكن. تقدير سريع لنماذج GPT وClaude وغيرها.
حاسبة متطلبات ذاكرة VRAM لنماذج اللغة الكبيرة

قدّر حجم ذاكرة كرت الشاشة (VRAM) اللازمة لتشغيل نموذج لغوي كبير. أدخِل عدد المعاملات بالمليارات واختَر دقة FP16 أو 8-بت أو 4-بت.

اكتشف

حاسبة قدرة مزود الطاقة (PSU) بالواط لتجميعة الكمبيوتر

احسب قدرة مزود الطاقة المناسبة لتجميعة جهازك. أضف المعالج وكرت الشاشة والرام والتخزين والمراوح لتحصل على الواط الموصى به مع هامش أمان 20%.
حاسبة نسبة وقت التشغيل في اتفاقية مستوى الخدمة (SLA)

احسب نسبة وقت التشغيل والتوافر في اتفاقية مستوى الخدمة انطلاقًا من زمن التوقف خلال أي فترة، وحوّل دقائق الانقطاع إلى نسب توافر مثل 99.9%.
حاسبة تكلفة الخوادم السحابية / إنستنس EC2

احسب التكلفة الشهرية واليومية والسنوية لتشغيل الخوادم السحابية أو إنستنس AWS EC2 انطلاقًا من عدد الخوادم والسعر بالساعة وساعات التشغيل شهريًا.
محول Mbps إلى Gbps

حوّل سرعة الإنترنت من Mbps إلى Gbps فورًا. أدخل السرعة بالميغابت في الثانية واحصل على ما يعادلها بالغيغابت في الثانية (Gbps = Mbps ÷ 1000).
حاسبة تكلفة استهلاك الكهرباء للخوادم

احسب تكلفة الكهرباء الشهرية والسنوية لتشغيل الخوادم على مدار الساعة. أدخل الواط وسعر الكيلوواط/ساعة وعدد الخوادم لتقدير المصروفات.