CNN Computer Vision: الخطوات التسع الرئيسية للانتقال من الصفر إلى التشغيل

CNN Computer Vision: الأساسيات في مقال واحد — كود حقيقي، مخططات وخطوات ملموسة، مقتطفات من دورة تتكون من 43 درسًا.

CNN Computer Vision: الخطوات التسع الرئيسية للانتقال من الصفر إلى التشغيل

يمكن للجميع تعلم CNN Computer Vision — بشرط اتباع الخطوات بالترتيب الصحيح. لقد لخصنا دورة كاملة من 43 درسًا في مسار واضح، مع أكثر مقتطفات الكود فائدة.

tl;dr
  • مقدمة وتثبيت
  • أساسيات الرؤية الحاسوبية
  • بناء أول CNN
  • المعماريات الكلاسيكية
  • التعلم بالنقل والضبط الدقيق
~$ cat ./parcours.md # CNN Computer Vision — 10 فصول
01
مقدمة وتثبيت
→ تقديم الدورة وما هي الرؤية الحاسوبية؟→ تثبيت Python، TensorFlow، Keras و OpenCV+ 1 دروس أخرى
02
أساسيات الرؤية الحاسوبية
→ التمثيل الرقمي للصورة (بكسلات، قنوات)→ المرشحات الكلاسيكية (Sobel، Gauss، Canny)+ 2 دروس أخرى
03
بناء أول CNN
→ طبقات Conv2D، النوى، الخطوة، الحشو→ التجميع، MaxPool و AveragePool+ 2 دروس أخرى
04
الهندسات الكلاسيكية
→ LeNet و AlexNet، الرواد→ VGG، البساطة في العمق+ 2 دروس أخرى
05
التعلم بالنقل والضبط الدقيق
→ مبدأ التعلم بالنقل→ استخراج الميزات باستخدام نموذج مدرب مسبقاً+ 2 دروس أخرى
06
كشف الأجسام
→ من مشكلة التصنيف إلى مشكلة الكشف→ Faster R-CNN، الهندسة ذات الخطوتين+ 2 دروس أخرى
07
تجزئة الصور
→ التجزئة الدلالية مقابل تجزئة الكائنات→ U-Net، هندسة التشفير-فك التشفير+ 1 دروس أخرى
08
تعزيز البيانات والتحسين
→ تعزيز البيانات، التدوير، القلب، القص→ تطبيع الدفعات و dropout+ 1 دروس أخرى
🏁
المشروع النهائي (+ 2 فصول في الطريق)
→ تعود بمشروع ملموس وقابل للعرض

حالة عملية: تصنيف الكلاب مقابل القطط

NOTEالهدف — تطبيق التعلم بالنقل من البداية إلى النهاية على مشكلة الكلاب مقابل القطط الكلاسيكية: تحضير البيانات، بناء النموذج، التدريب على مرحلتين والوصول إلى دقة ممتازة.

الأهداف التعليمية

TIPفي نهاية هذه الوحدة
  • تنظيم مجموعة بيانات صور في مجلدات حسب الفئة
  • تحميل الصور باستخدام خط أنابيب Keras
  • بناء نموذج تعلم بالنقل ثنائي
  • التدريب باستخدام استخراج الميزات ثم الضبط الدقيق
  • تفسير الدقة المحققة

تحضير البيانات

تحتوي مجموعة بيانات الكلاب مقابل القطط على آلاف الصور. ننظمها في مجلدات، واحد لكل فئة، وهو ما يقرأه Keras تلقائيًا.

التصنيف الأول للصور باستخدام MNIST

NOTEالهدف — تدريب أول نموذج تصنيف صور لديك على MNIST، "Hello World" في الرؤية، وفهم كل خطوة في خط الأنابيب من البداية إلى النهاية.

الأهداف التعليمية

TIPفي نهاية هذه الوحدة
  • تحميل واستكشاف مجموعة بيانات MNIST
  • تطبيع الصور قبل التدريب
  • بناء نموذج بسيط باستخدام Keras
  • التدريب والتقييم وتفسير الدقة المحققة
  • فهم خط الأنابيب الكامل: البيانات، النموذج، التدريب، التقييم

ما هو MNIST؟

MNIST هو مجموعة من 70 000 صورة لأرقام مكتوبة بخط اليد (من 0 إلى 9)، كل منها بحجم 28×28 بكسل بتدرجات الرمادي. 60 000 صورة للتدريب و10 000 للاختبار. إنها مجموعة البيانات التاريخية في الرؤية: بسيطة بما يكفي للتدريب في ثوانٍ، لكنها غنية بما يكفي لتوضيح جميع المفاهيم الأساسية.

الهدف: إعطاء صورة رقم للنموذج والحصول على الفئة الصحيحة من بين 10 فئات. إنها مشكلة تصنيف متعدد الفئات.

NOTEملاحظة: تم إنشاء MNIST في 1998 بواسطة Yann LeCun من نماذج بريدية أمريكية. ولا يزال يُستخدم حتى اليوم كأول اختبار لأي خوارزمية رؤية جديدة.

الخطوة 1: تحميل واستكشاف البيانات

الخطوة 2: تطبيع الصور

تتعلم الشبكات بشكل أفضل عندما تكون المدخلات صغيرة ومركزة. لذلك نقسم على 255 لجعل كل بكسل بين 0 و1.

الخطوة 4: التدريب والتقييم

العنصرالدور
epochsعدد المرات التي يرى فيها النموذج كامل مجموعة البيانات
validation_splitجزء البيانات المخصص لمراقبة الإفراط في التكيف
evaluateقياس الأداء على بيانات لم يسبق رؤيتها

جدولة معدل التعلم والإيقاف المبكر

NOTEالهدف — إتقان رافعتين حاسمتين للتحسين: ضبط معدل التعلم أثناء التدريب، والإيقاف التلقائي في الوقت المناسب لتجنب الإفراط في التكيف.

الأهداف التعليمية

TIPفي نهاية هذه الوحدة
  • فهم تأثير معدل التعلم
  • استخدام مخطط معدل التعلم
  • تطبيق الإيقاف المبكر
  • حفظ أفضل نموذج باستخدام نقطة تحقق
  • دمج هذه الاستدعاءات في fit

معدل التعلم: الرافعة الرئيسية

يتحكم معدل التعلم (learning rate) في حجم تحديثات الأوزان. وهو أهم معامل فائق. إذا كان مرتفعًا جدًا، يتباعد التدريب أو يتذبذب. وإذا كان منخفضًا جدًا، يصبح التدريب طويلًا ويعلق. المثالي يتطور أثناء التدريب.

معدل تعلم مرتفع جدًا

تتذبذب الخسارة أو تنفجر أو لا تنخفض. يقفز النموذج فوق الحد الأدنى.

معدل تعلم منخفض جدًا

تنخفض الخسارة ببطء شديد. التدريب مكلف وقد يتوقف.

جدولة معدل التعلم

الفكرة: البدء بمعدل تعلم كبير بما يكفي للتقدم سريعًا، ثم تقليله تدريجيًا للضبط الدقيق. استراتيجية شائعة هي تقسيم معدل التعلم عندما تتوقف خسارة التحقق عن التحسن.

va-plus-loin

تغطي هذه المقالة المقتطفات الأكثر فائدة — الدورة الكاملة CNN Computer Vision (11 فصول، 43 درسًا، تمارين محلولة ومشروع نهائي) تأخذك حتى النهاية.

./acceder-au-cours-complet cours gratuit : Maîtriser Claude Code

الأسئلة الشائعة

كم من الوقت يستغرق تعلم CNN Computer Vision؟
مع تقدم منظم (11 فصول، 43 درسًا قصيرًا وعمليًا)، يمكن الوصول إلى مستوى تشغيلي في بضعة أسابيع بمعدل 30 إلى 60 دقيقة يوميًا. المهم هو تطبيق كل مفهوم فورًا.
هل هناك متطلبات مسبقة؟
تكفي أساسيات في علوم الحاسب. إذا كنت تعرف استخدام الطرفية وقراءة كود بسيط، فأنت جاهز.
من أين نبدأ عمليًا؟
طبّق أوامر هذه المقالة، ثم تابع دورة CNN Computer Vision الكاملة: فهي تربط الـ43 درسًا بالترتيب، مع تمارين ومشروع نهائي.

📬 هل تريد تلقي هذا النوع من الأدلة كل أسبوع؟ اشترك مجانًا — كود حقيقي، بدون كلام فارغ.