Fine Tuning LLMs شرح ببساطة (مع مخططات وكود حقيقي)

Fine Tuning LLMs : الأساسيات في مقال واحد — كود حقيقي، مخططات وخطوات ملموسة، مقتطفات من دورة مكونة من 37 درسًا.

Fine Tuning LLMs شرح ببساطة (مع مخططات وكود حقيقي)

دليل مباشر وموجز: Fine Tuning LLMs مفكك بالرسوم البيانية والأمثلة العملية والأوامر المختبرة. كل المحتوى مستمد من دورة منظمة تضم 11 فصلاً — وإليكم أفضل ما فيها.

tl;dr
  • المقدمة والتثبيت
  • أساسيات نماذج اللغة الكبيرة
  • إعداد البيانات
  • الضبط الدقيق الكامل
  • LoRA و QLoRA PEFT
~$ cat ./parcours.md # Fine Tuning LLMs — 9 فصول
01
مقدمة وتثبيت
→ تقديم الدورة ولماذا الضبط الدقيق؟→ تثبيت Python و PyTorch و Hugging Face+ 1 دروس أخرى
02
أساسيات نماذج اللغة الكبيرة
→ بنية Transformer باختصار→ التدريب المسبق، SFT، RLHF، DPO+ 2 دروس أخرى
03
إعداد البيانات
→ جمع وتنظيف البيانات→ صيغ Alpaca، ChatML، ShareGPT، JSONL+ 2 دروس أخرى
04
الضبط الدقيق الكامل
→ مفاهيم الضبط الدقيق الكامل→ Hugging Face Trainer و TrainingArguments+ 2 دروس أخرى
05
LoRA و QLoRA PEFT
→ مبدأ LoRA التكيف منخفض الرتبة→ QLoRA تكميم 4-bit و NF4+ 2 دروس أخرى
06
التدريب والمعاملات الفائقة
→ معدل التعلم، حجم الدفعة والحقب→ جدولة cosine، linear، warmup+ 2 دروس أخرى
07
المحاذاة المتقدمة DPO RLHF
→ DPO تحسين التفضيل المباشر→ ORPO و KTO بدائل حديثة+ 1 دروس أخرى
08
النشر والاستدلال
→ تكميم GGUF مع llama.cpp→ الخدمة مع vLLM أو TGI (أداء عالي)+ 1 دروس أخرى
🏁
المشروع النهائي (+ 1 فصول في الطريق)
→ تغادر بمشروع ملموس وقابل للعرض

Ollama والتكامل المحلي

NOTEالهدف — نشر نموذجك المضبوط بدقة عبر Ollama، الأداة الأبسط لتشغيل نموذج لغة كبير محليًا (macOS، Windows، Linux) مع واجهة REST API في 30 ثانية.

الأهداف التعليمية

TIPعند إتمام هذه الوحدة
  • تثبيت Ollama وتشغيل نموذج جاهز مسبقًا
  • استيراد نموذج GGUF المخصص عبر Modelfile
  • استخدام واجهة REST API الخاصة بـ Ollama من أي لغة برمجة
  • دمج Ollama في تطبيق Python / Node / Rust
  • تحسين الأداء حسب العتاد (CPU، M2، RTX)

تثبيت Ollama

تشغيل نموذج موجود

API الأصلية

العتادالنموذجالرموز/ثانية
M2 16 GBMistral 7B Q4_K_M40
M3 Max 64 GBMistral 7B Q4_K_M80
M3 Max 64 GBLlama 3 70B Q4_K_M10
RTX 4090 24 GBMistral 7B Q4_K_M100+
RTX 3060 12 GBMistral 7B Q4_K_M35

حالات استخدام Ollama في الإنتاج

إثبات مفهوم داخلي

تعريف الفرق التشغيلية بالنموذج دون بنية تحتية سحابية.

تطبيق سطح المكتب

مدمج في تطبيقات Tauri / Electron / Swift للتحليل المحلي.

الحافة / المحلي

بيانات حساسة يجب ألا تغادر الشبكة الداخلية.

قيود Ollama

رفع نموذجك إلى ollama.com

يمكنك مشاركة نموذجك المخصص على سجل Ollama العام:

تنسيقات Alpaca و ChatML و ShareGPT و JSONL

NOTEالهدف — التعرف على التنسيقات القياسية لمجموعات البيانات المستخدمة في الضبط الدقيق لنماذج اللغة الكبيرة وكيفية التحويل بينها. فهم أهمية قالب الدردشة الخاص بكل نموذج.

الأهداف التعليمية

TIPعند إتمام هذه الوحدة
  • تحديد التنسيقات الأربعة الأكثر استخدامًا في 2026
  • تحويل مجموعة بيانات بين Alpaca و ChatML و ShareGPT
  • تطبيق قالب الدردشة الصحيح حسب النموذج المستهدف
  • حفظ مجموعة البيانات بتنسيق JSONL قابل للبث
  • اكتشاف أخطاء التنسيق قبل التدريب

التنسيق 1: Alpaca (الأبسط)

مستمد من مشروع Stanford Alpaca (2023). ثلاثة حقول: instruction، input (اختياري) و output.

التحويل بين التنسيقات

Alpaca → ChatML

يتولى Hugging Face ذلك تلقائيًا عبر tokenizer.apply_chat_template(). لا تكتب هذه القوالب يدويًا أبدًا.

تثبيت Python و PyTorch و Hugging Face

NOTEالهدف — إعداد بيئة Python نظيفة للضبط الدقيق: Python 3.11، PyTorch مع CUDA، وكامل مكدس Hugging Face (Transformers، PEFT، Datasets، TRL).

الأهداف التعليمية

TIPعند إتمام هذه الوحدة
  • تثبيت Python 3.11 وبيئة افتراضية مخصصة
  • اختيار وتثبيت الإصدار المناسب من PyTorch (CPU مقابل CUDA)
  • تثبيت مكدس Hugging Face الكامل بإصدارات متوافقة
  • التحقق من اكتشاف وحدة معالجة الرسوميات بواسطة PyTorch
  • إنشاء حساب Hugging Face وتهيئة الرمز المميز

متطلبات النظام

المكونالموصى بهالحد الأدنى
Python3.113.10
الذاكرة العشوائية32 GB16 GB
GPU NVIDIARTX 4090 (24 GB)RTX 3060 (12 GB) أو Colab T4
مساحة القرص الحرة200 GB SSD50 GB
CUDA Toolkit12.111.8
WARNINGتنبيه بشأن Python 3.12: في 2026، بعض التبعيات (خاصة bitsandbytes على Windows) لا تدعم Python 3.12 بشكل كامل بعد. التزم بـ 3.11 لهذه الدورة.

الخطوة 1: تثبيت Python 3.11 وبيئة افتراضية

أنشئ مجلد عمل ثم بيئة افتراضية مخصصة للدورة. يجنب ذلك أي تعارض مع مشاريع Python الأخرى.

GPU NVIDIA مع CUDA 12.1

peft

الضبط الدقيق الموفر للمعاملات. ضروري لـ LoRA و QLoRA.

bitsandbytes

التكميم 8 بت و4 بت. يتيح QLoRA. يجب أن يطابق إصدار CUDA لديك.

الخطوة 4: إنشاء حساب ورمز مميز على Hugging Face

va-plus-loin

تغطي هذه المقالة أكثر المقتطفات فائدة — الدورة الكاملة Fine Tuning LLMs (11 فصلاً، 37 درسًا، تمارين محلولة ومشروع ختامي) تأخذك إلى النهاية.

./acceder-au-cours-complet cours gratuit : Ingénierie de prompts

الأسئلة الشائعة

كم من الوقت يستغرق تعلم الضبط الدقيق لنماذج اللغة الكبيرة؟
مع تقدم منظم (11 فصلاً، 37 درسًا قصيرًا وعمليًا)، يمكن الوصول إلى مستوى تشغيلي في بضعة أسابيع بمعدل 30 إلى 60 دقيقة يوميًا. الأهم هو تطبيق كل مفهوم فورًا.
هل هناك متطلبات سابقة؟
تكفي أساسيات في علوم الحاسب. إذا كنت تستطيع استخدام الطرفية وقراءة كود بسيط، فأنت جاهز.
من أين أبدأ عمليًا؟
طبّق أوامر هذه المقالة، ثم تابع الدورة الكاملة Fine Tuning LLMs: فهي تربط الـ 37 درسًا بالترتيب مع تمارين ومشروع ختامي.

📬 هل تريد تلقي هذا النوع من الأدلة أسبوعيًا؟ اشترك مجانًا — كود حقيقي، بدون حشو.