ابدأ في التعلم الآلي للمبتدئين: خطوتك الأولى الملموسة اليوم
تعلم الآلة للمبتدئين: الأساسيات في مقال واحد — كود حقيقي، مخططات وخطوات ملموسة، مقتطفات من دورة مكونة من 44 درسًا.
أفضل طريقة لتعلم تعلم الآلة للمبتدئين هي بالممارسة. يضعك هذا المقال على الطريق الصحيح مع مقتطفات عملية مستمدة من دورة تضم 44 درسًا — ما يكفي للحصول على نتيجة أولى اليوم.
- مقدمة والخطوات الأولى
- التعلم من البيانات
- العائلات الثلاث الكبرى للتعلم الآلي
- التصنيف مقابل الانحدار
- النموذج الأول باستخدام Orange
التدريب مقابل الاختبار — لماذا الفصل؟
الأهداف التعليمية
- فهم الفرق بين الحفظ والتعميم
- معرفة نسب الفصل الكلاسيكية (80/20، 70/30)
- التمييز بين مجموعة التدريب والتحقق والاختبار
- فهم التحقق المتقاطع (cross-validation)
- تحديد فخ "تسرب البيانات" (data leakage)
الفخ: الاختبار على بيانات التدريب
تخيل طالبًا يستعد لامتحان. يعطيه الأستاذ 50 تمرينًا مع حلولها، ويقول له "ادرسها جيدًا". يوم الامتحان، يطرح الأستاذ نفس الـ50 تمرينًا. قد يحصل الطالب على 100% دون فهم شيء: لقد حفظ فقط.
هذا بالضبط ما يحدث إذا اختبرت نموذج تعلم آلي على البيانات التي تم تدريبه عليها. قد "يحفظ" نموذج مفرط البارامترات الأمثلة ويحصل على 100% في التدريب، بينما يكون عديم الفائدة تمامًا على بيانات جديدة.
الحل: تقسيم التدريب/الاختبار
الحل بسيط: نقسم مجموعة البيانات إلى حزمتين عشوائيًا قبل التدريب.
مجموعة التدريب (train)
70 إلى 80% من البيانات. تستخدم لتدريب النموذج. هي "دفتر التمارين مع الحلول" الذي يدرسه الطالب.
مجموعة الاختبار (test)
20 إلى 30% من البيانات. تستخدم لتقييم النموذج بعد التدريب. هي الامتحان النهائي بتمارين لم تُرَ من قبل.
| المجموعة | النسبة | الدور |
|---|---|---|
| Train | 60–70% | تدريب معاملات النموذج |
| Validation | 15–20% | ضبط البارامترات الفائقة، مقارنة عدة نماذج |
| Test | 15–20% | التقييم النهائي، مرة واحدة فقط، في النهاية |
لماذا ثلاث حزم؟ لأنك إذا ضبطت نموذجك بالنظر إلى نتائج الاختبار، تنتهي بـ"الإفراط في التحسين" لهذا الاختبار بالذات: فيصبح هو نفسه شكلاً من التدريب غير المباشر.
التحقق المتقاطع (k-fold cross-validation)
مشكلة التقسيم البسيط تدريب/اختبار: تعتمد النتيجة على البيانات التي وقعت في الاختبار. سحب سيء = مقياس متشائم أو متفائل.
يحل التحقق المتقاطع بـk طيات هذا بأخذ المتوسط على عدة تقسيمات:
تسرب البيانات: الفخ الخفي
تسرب البيانات (data leakage) هو الخطأ الأكثر دقة والأكثر شيوعًا. يحدث عندما "تتسرب" معلومات من الاختبار إلى التدريب، مما يعطي نتائج جيدة اصطناعيًا في التحقق لكنها كارثية في الإنتاج.
أمثلة نمطية
كيفية تجنبه
تصور النموذج وتنبؤاته
الأهداف التعليمية
- تصور شجرة باستخدام ويدجت Tree Viewer
- قراءة القواعد التي تعلمها النموذج
- إجراء تنبؤات باستخدام ويدجت Predictions
- إكمال أول سير عمل كامل
رؤية الشجرة: ويدجت Tree Viewer
الميزة الكبرى لشجرة القرار هي إمكانية رؤيتها. يرسم ويدجت Tree Viewer الشجرة فرعًا بفرع، مع أسئلتها وإجاباتها.
إجراء التنبؤات: ويدجت Predictions
لتطبيق النموذج على حالات جديدة، نستخدم ويدجت Predictions. يأخذ مدخلين: النموذج المدرب والبيانات المراد التنبؤ بها.
العثور على الأنماط — الحدس البصري
الأهداف التعليمية
- تعريف ما هو النمط في تعلم الآلة
- تصور نمط في سحابة نقاط
- فهم مفهوم حدود القرار
- التمييز بين نمط بسيط (خطي) ونمط معقد (غير خطي)
- استيعاب الرابط بين النمط المكتشف والتعميم
ما هو النمط؟
النمط (بالفرنسية: motif récurrent) هو انتظام إحصائي في البيانات. هو ما تبحث عنه الآلة لاكتشافه لتتمكن من إجراء التنبؤات.
التصور: سحابة نقاط وحدودها
أبسط طريقة لتصور نمط: رسم بياني بميزتين. لنفترض مجموعة بيانات لزهور بميزتين (طول البتلة، عرض البتلة) ونوعين (A وB).
الأنماط الخطية مقابل غير الخطية
ليس كل الأنماط متساوية في التعقيد.
نمط خطي
الحدود خط مستقيم (أو مستوى في 3D، أو مستوى فائق في N أبعاد).
مثال: "كلما زادت جرعة السكر، زاد خطر الإصابة بالسكري" (علاقة مباشرة).
الخوارزميات المناسبة: الانحدار الخطي، الانحدار اللوجستي، SVM خطي.
نمط غير خطي
الحدود منحنية، لولبية، أو أشكال معقدة.
مثال: "يزداد خطر السرطان مع العمر، لكنه يعتمد أيضًا على تركيبات معقدة (الوراثة، نمط الحياة)".
الخوارزميات المناسبة: أشجار القرار، الغابات العشوائية، الشبكات العصبية، XGBoost.
النمط ليس القاعدة النهائية: مجرد تقريب
مهم: نمط تعلم الآلة ليس أبدًا قاعدة مطلقة. إنه اتجاه إحصائي. يعطي النموذج احتمالات، لا يقينًا.
| النمط المكتشف | الحالات التي يعمل فيها | الحالات التي يفشل فيها |
|---|---|---|
| "البريد الإلكتروني الذي يحتوي 'ربحت 1M€' = سبام" | 95% من الحالات | اليانصيب الرسمي الذي فزت به فعليًا |
| "شاب + رصيد صغير = يلغي" | 70% من الحالات | طالب سيبقى عميلاً 30 سنة |
| "بكسلات حمراء دائرية = تفاحة" | 80% من الحالات | طماطم، فراولة، كرة |
لهذا السبب يُقيَّم كل نموذج تعلم آلي بمقاييس (الدقة، الاستدعاء، إلخ). لا نبحث عن الكمال بل عن أفضل أداء ممكن — مع العلم أن هناك دائمًا أخطاء.
لماذا يغير البعد كل شيء: لعنة الأبعاد
عندما يكون لديك ميزتان، يمكنك رسم رسم بياني ثنائي الأبعاد ورؤية الأنماط. مع ثلاث ميزات، لا يزال ممكنًا (ثلاثي الأبعاد). لكن عمليًا، غالبًا ما تحتوي مجموعات البيانات على 10، 100، أحيانًا 1000 ميزة. يصبح التصور مستحيلاً.
يغطي هذا المقال المقتطفات الأكثر فائدة — الدورة الكاملة تعلم الآلة للمبتدئين (11 فصلاً، 44 درسًا، تمارين محلولة ومشروع نهائي) تأخذك إلى النهاية.
./acceder-au-cours-complet دورة مجانية: إتقان Claude Codeالأسئلة الشائعة
كم من الوقت لتعلم تعلم الآلة للمبتدئين؟
هل هناك متطلبات مسبقة؟
من أين نبدأ عمليًا؟
📬 هل تريد تلقي هذا النوع من الأدلة كل أسبوع؟ اشترك مجانًا — كود حقيقي، بدون كلام فارغ.