حاسبة متطلبات ذاكرة VRAM لنماذج اللغة الكبيرة

الاتصال عبر MCP →

أدخل الحساب

صيغة رياضية

نتائج

ذاكرة VRAM التقديرية المطلوبة

١٦٫٨

جيجابايت من ذاكرة كرت الشاشة

الحجم الخام للأوزان	١٤ GB
عدد البايتات لكل معامل	٢
عامل الهامش الإضافي	١٫٢×

ماذا تفعل هذه الحاسبة

تساعدك حاسبة متطلبات ذاكرة VRAM لنماذج LLM على تقدير حجم ذاكرة كرت الشاشة (GPU) اللازمة لتحميل وتشغيل نموذج لغوي كبير. تعمل الحاسبة بضرب عدد معاملات النموذج (بالمليارات) في عدد البايتات التي يشغلها كل معامل وفق مستوى الدقة الذي تختاره، ثم تطبّق عامل هامش إضافي لتغطية التنشيطات (activations) وذاكرة KV cache والمخازن المؤقتة الخاصة بإطار العمل.

طريقة الاستخدام

أدخِل حجم النموذج بعدد المعاملات بالمليارات (مثلاً 7 لنموذج بحجم 7B، أو 70 لنموذج بحجم 70B). ثم اختَر مستوى التكميم: تستخدم دقة FP16/BF16 بايتين لكل وزن، وINT8 بايتاً واحداً، و4-بت نصف بايت (0.5)، و2-بت ربع بايت (0.25). أما الهامش الافتراضي البالغ 1.2 (أي زيادة 20%) فهو نقطة بداية معقولة لعمليات الاستدلال (inference)؛ ارفعه عند العمل بسياقات طويلة أو بدفعات متعددة.

شرح المعادلة

$$\text{VRAM (GB)} = \text{Params (B)} \times \text{Bytes/Param} \times \text{Overhead}$$ يعطي الحدّان الأولان الحجم الخام لأوزان النموذج بالجيجابايت. أما مُضاعِف الهامش فيحجز ذاكرة إضافية تستهلكها أطر العمل مثل PyTorch وCUDA إضافةً إلى ذاكرة KV cache الخاصة بالانتباه أثناء التشغيل، وهي ذاكرة لا يأخذها حجم الأوزان الخام في الحسبان.

اعلان

ثلاثة أعمدة تقارن ذاكرة VRAM لتكميم FP16 و8 بت و4 بت — الدقة الأقل (8 بت، 4 بت) تخفّض تقريبًا إلى النصف عدد البايتات لكل معامل وحجم VRAM المطلوب.

مخطط أعمدة مكدّسة يوضح تقسيم ذاكرة VRAM إلى أوزان وذاكرة KV مؤقتة وحمل إضافي — تهيمن أوزان النموذج على إجمالي ذاكرة VRAM، إضافةً إلى مساحة لذاكرة KV المؤقتة والحمل الإضافي.

مثال تطبيقي

لنأخذ نموذجاً بحجم 7B بدقة 4-بت: $7 \times 0.5 = 3.5$ جيجابايت من الأوزان. وبتطبيق عامل هامش 1.2: $3.5 \times 1.2 = 4.2$ جيجابايت. هذا يتسع بأريحية ضمن كرت شاشة استهلاكي سعة 8 جيجابايت. أما النموذج نفسه بدقة FP16 فيحتاج إلى $7 \times 2 \times 1.2 = 16.8$ جيجابايت، وهو ما يستلزم كرتاً بسعة 24 جيجابايت.

الأسئلة الشائعة

هل هذا التقدير دقيق تماماً؟ لا — إنه تقدير لعمليات الاستدلال. يختلف الاستهلاك الفعلي حسب طول السياق وحجم الدفعة وإطار العمل المستخدم. استعمله لأغراض التخطيط، لا لتحديد آخر ميجابايت.

هل يشمل ذاكرة التدريب؟ لا. يحتاج التدريب إلى ذاكرة أكبر بكثير (حالات المُحسِّن والتدرّجات)، وغالباً ما تبلغ 4 أضعاف رقم الاستدلال أو أكثر.

أي قيمة هامش ينبغي أن أستخدم؟ القيمة 1.2 مناسبة للاستدلال بسياق قصير؛ استخدم 1.3–1.5 للسياقات الطويلة أو الطلبات المتزامنة.

آخر تحديث: 19 يونيو 2026

الآلات الحاسبة ذات الصلة

حاسبة تحويل رموز LLM (التوكنز) إلى كلمات

حوّل بين رموز نماذج LLM والكلمات فورًا. احسب عدد الكلمات المقابلة لعدد التوكنز أو العكس بالاعتماد على قاعدة ‎0.75‎ كلمة لكل توكن.
حاسبة تكلفة واجهة LLM البرمجية (API)

احسب تكلفة استخدام واجهات نماذج LLM البرمجية من عدد توكنات الإدخال والإخراج والسعر لكل 1000 توكن، واعرف كلفة الطلب الواحد وإجمالي الإنفاق.
حاسبة تكلفة توكنات نماذج الذكاء الاصطناعي (LLM)

احسب تكلفة استدعاءات واجهات LLM البرمجية انطلاقًا من توكنات الإدخال والإخراج وأسعار كل 1000 توكن. قدّر تكلفة كل استدعاء وإجمالي الإنفاق عبر آلاف الطلبات.
حاسبة تحويل توكنات نماذج LLM إلى كلمات وتكلفة الاستخدام

حوّل توكنات نماذج LLM إلى عدد كلمات تقديري واحسب تكلفة الـ API بناءً على سعر كل 1000 توكن. تقدير سريع لنماذج GPT وClaude وغيرها.
حاسبة متطلبات ذاكرة VRAM لنماذج اللغة الكبيرة (LLM)

احسب حجم ذاكرة كرت الشاشة (VRAM) بالجيجابايت اللازمة لتشغيل نموذج لغوي كبير، انطلاقًا من عدد المعاملات ودقة التخزين وعامل الهامش الإضافي.

اكتشف

حاسبة جرعة ماء الأكسجين (بيروكسيد الهيدروجين) للكلاب

احسب جرعة ماء الأكسجين بتركيز 3% لتحفيز التقيؤ لدى الكلاب حسب الوزن (1–2 مل/كجم، بحد أقصى 45 مل). استشر الطبيب البيطري أولاً قبل الاستخدام.
حاسبة تكلفة الكهرباء لتعدين العملات الرقمية

احسب تكلفة الكهرباء لتشغيل جهاز تعدين العملات الرقمية. أدخل الواط وسعر الكيلوواط/ساعة وعدد الأيام لمعرفة التكلفة اليومية والشهرية والإجمالية.
حاسبة نسبة الزيادة في الراتب

احسب نسبة الزيادة في راتبك انطلاقًا من راتبك القديم والجديد. أدخل المبلغين لمعرفة قيمة الزيادة بالدولار ونسبتها المئوية فورًا.
حاسبة ضريبة المبيعات في ولاية نيويورك

احسب ضريبة المبيعات في نيويورك والسعر الإجمالي. الافتراضي هو معدل مدينة نيويورك المُجمَّع 8.875%، مع إمكانية تعديله لأي مقاطعة (الولايات المتحدة).
حاسبة وقت تنزيل الملفات ونقل البيانات

احسب المدة التي يستغرقها تنزيل ملف أو نقل بيانات بناءً على حجم الملف وسرعة الاتصال. تدعم الوحدات من KB وMB وGB وTB ومن Kbps إلى Gbps وMB/s.