Task 1 (Introduction)
📌 الفكرة: كيف نقيس النجاح؟ (Measuring Success)
- السؤال: كيف نعرف إن فريق الـ SOC شاطر وفعّال؟
- الجواب: باستخدام مؤشرات ومقاييس رقمية. مثلما نقيس سرعة السيارة بالكيلومتر/ساعة، نقيس سرعة الـ SOC بمصطلحات مثل MTTD و MTTR.
- الهدف: تحسين هذه الأرقام يعني اكتشاف الهكر أسرع وإيقافه قبل أن يدمر الشركة. تجاهلها يعني كوارث!
🎯 أهداف التعلم (Learning Objectives)
في هذه الغرفة، سنتعلم لغة الأرقام في الـ SOC:
- المصطلحات الأربعة الكبار: فهم معاني SLA, MTTD, MTTA, MTTR. (هذه أهم شيء في الغرفة).
- معدل الخطأ (False Positive Rate): فهم أهمية تقليل الإنذارات الكاذبة.
- التحسين (Improvement): كيف تساهم أنت (كمحلل L1) في تحسين هذه الأرقام.
- تطبيق عملي: إدارة مقاييس فريق SOC في سيناريو تدريبي.
📚 المتطلبات (Prerequisites)
يفضل أن تكون قد أنهيت غرفة SOC Workbooks and Lookups وتعرف الفرق بين الـ SOC الداخلي والـ Managed SOC.
Task 2: Core Metrics (المقاييس الأساسية)
🔢 1. عدد التنبيهات (Alerts Count - AC)
- المعنى: كم تنبيه وصل للفريق اليوم؟
- المشكلة:
- عدد كبير جداً (80): ضغط هائل، واحتمال كبير نضيع التهديد الحقيقي وسط الزحمة.
- عدد قليل جداً (0): مريب! قد يعني أن النظام عطلان أو لا يرى شيئاً.
- الرقم المثالي: 5 إلى 30 تنبيه يومياً لكل محلل L1.
🚫 2. معدل الإيجابية الكاذبة (False Positive Rate - FPR)
- المعنى: كم نسبة التنبيهات التي طلعت "كذب" (ضجيج) من المجموع الكلي؟
- المشكلة:
- إذا كانت 94% من التنبيهات كاذبة، المحلل سيصاب بالملل ويصير يغلق التنبيهات بدون تركيز (وهذا خطير جداً).
- الهدف: تقليل هذا الرقم قدر الإمكان (عن طريق تحسين قواعد الكشف - Tuning). نسبة 80% وأكثر تعتبر مشكلة خطيرة.
📈 3. معدل التصعيد (Alert Escalation Rate - AER)
- المعنى: كم نسبة التنبيهات التي يرفعها الـ L1 إلى الـ L2؟
- ماذا يقيس؟ خبرة واستقلالية المحلل المبتدئ (L1).
- إذا كان يرفع كل شيء ← قليل الخبرة أو خائف.
- إذا كان لا يرفع شيئاً ← متهور أو واثق زيادة.
- الرقم المثالي: يجب أن يكون أقل من 50%، والأفضل أقل من 20%. (يعني تحل معظم المشاكل بنفسك).
🛡️ 4. معدل كشف التهديدات (Threat Detection Rate - TDR)
- المعنى: من أصل كل الهجمات التي حدثت، كم هجوم اكتشفنا؟
- المثال: 6 هجمات حدثت، اكتشفنا 4 وفوتنا 2. النسبة = 67%.
- المشكلة: هذه النسبة سيئة جداً!
- الهدف: يجب أن يكون دائماً 100%. لأن هجوماً واحداً تفوته قد يدمر الشركة (Ransomware).
Task 3: Triage Metrics (مقاييس الفرز والاستجابة)
📜 ما هو الـ SLA؟
هو Service Level Agreement (اتفاقية مستوى الخدمة).
- ببساطة، هو "عقد" أو "وعد" بين فريق الـ SOC والشركة.
- الوعد: "نحن نعدكم أننا سنكتشف الهجوم ونبدأ العمل عليه ونحله خلال وقت محدد (مثلاً ساعة واحدة)".
⏱️ مقاييس الوقت الثلاثة (The Big 3 Metrics)
انظر للصورة التالية، فهي تلخص دورة حياة الهجوم وعلاقتها بالوقت:
☝️ شرح المخطط الزمني (من اليسار لليمين):
- MTTD (Mean Time to Detect) - متوسط وقت الكشف:
- المعنى: الوقت بين "لحظة وقوع الهجوم" ولحظة "ظهور التنبيه" في النظام.
- المثال: الهكر دخل الساعة 10:00، النظام أرسل تنبيهاً الساعة 10:05. الـ MTTD هو 5 دقائق.
- MTTA (Mean Time to Acknowledge) - متوسط وقت الاستلام:
- المعنى: الوقت بين "ظهور التنبيه" ولحظة "بدء المحلل (أنت) بالعمل عليه".
- المثال: التنبيه ظهر 10:05، أنت فتحته وغيرت حالته لـ "In Progress" الساعة 10:10. الـ MTTA هو 5 دقائق. (هذا يقيس سرعتك أنت!).
- MTTR (Mean Time to Respond) - متوسط وقت الاستجابة/الإصلاح:
- المعنى: الوقت الكلي حتى يتم "إيقاف الهجوم" تماماً (عزل الجهاز، طرد الهكر).
- المثال: بدأنا 10:10، وتم طرد الهكر 10:30. العملية أخذت 20 دقيقة. الـ MTTR الكلي (من لحظة التنبيه للحماية) هو 25 دقيقة.
📊 الجدول المرجعي (Common SLA Targets)
في الشركات المحترفة، هذه هي الأرقام التي يطمحون لها:
| المقياس | الهدف المثالي (SLA) | الوصف |
|---|---|---|
| MTTD | < 5 دقائق | أدوات الحماية لازم تكون سريعة جداً في كشف الهكر. |
| MTTA | < 10 دقائق | لازم المحلل ينتبه للتنبيه ويبدأ الشغل خلال 10 دقايق. |
| MTTR | < 60 دقيقة | لازم المصيبة تنحل بالكامل خلال ساعة واحدة. |
Task 4: Improving Metrics (تحسين المقاييس)
🛠️ كيف تصلح الأرقام السيئة؟
إليك أبرز 4 مشاكل قد تواجه فريقك وكيف تقترح حلولاً لها:
1️⃣ مشكلة: الضجيج العالي (False Positive Rate > 80%)
- السبب: الفريق يغرق في تنبيهات تافهة وكاذبة.
- الحل:
- استثناء النشاطات الموثوقة: اطلب تعديل قواعد الكشف لتتجاهل أشياء مثل "تحديثات النظام" الموثوقة.
- الأتمتة (SOAR): استخدم أدوات للرد الآلي على التنبيهات المتكررة والسهلة.
(SOAR: اختصار لـ "Security Orchestration, Automation, and Response". وهو حلٌّ يُساعد المؤسسات على تبسيط عملياتها الأمنية وأتمتتها).
2️⃣ مشكلة: بطء الكشف (MTTD > 30 min)
- السبب: الهجوم يحدث، والنظام يكتشفه متأخراً جداً.
- الحل:
- تسريع القواعد: اطلب من مهندسي الـ SOC جعل قواعد الكشف تعمل بشكل متكرر أكثر (كل دقيقة بدل كل 30 دقيقة).
- الـ Real-time Logs: تأكد أن السجلات تصل للـ SIEM فوراً بدون تأخير في الشبكة.
3️⃣ مشكلة: بطء الاستجابة (MTTA > 30 min)
- السبب: التنبيه يظهر، لكن المحللين (أنت وزملاؤك) يتأخرون في فتحه.
- الحل:
- تنبيهات فورية: تأكد أن التنبيه يصلك كإشعار (Notification) فوراً.
- توزيع العمل: وزع التنبيهات بالتساوي بين المحللين في الشفت لكي لا ينضغط أحد ويتأخر.
4️⃣ مشكلة: بطء الحل (MTTR > 4 hours)
- السبب: الفريق يأخذ وقتاً طويلاً جداً لإيقاف الهجوم.
- الحل:
- سرعة التصعيد: كـ L1، لا تضيع وقتاً، صعد التهديدات الحقيقية للـ L2 بأقصى سرعة.
- التوثيق (Playbooks): تأكد أن لديكم خططاً مكتوبة (Workbooks) جاهزة لكل سيناريو لعدم التفكير طويلاً وقت الأزمة.
Task 5: Practice Scenarios (سيناريوهات عملية)
🎮 طريقة اللعب
اضغط على زر View Site لفتح اللوحة. سترى سيناريو (رسالة شكوى أو تقرير). عليك ملء 3 خانات:
- Problematic Metric: ما هو المقياس السيئ هنا؟ (MTTD, MTTR, FPR...؟).
- Improvement Task: ما هو الحل؟ (أتمتة، تدريب، تحسين قواعد...).
- Assign Task To: من ينفذ الحل؟ (Engineer, L2, Manager...).
🛠️ دليل الحلول (Cheat Sheet)
استخدم هذا الدليل لتجاوز السيناريوهات الثلاثة:
1️⃣ السيناريو الأول: "تأخرنا في طرد الهكر 6 ساعات!"
- المشكلة: الرسالة تقول "استغرق الأمر 6 ساعات لطرد الهكر".
- المقياس السيئ: MTTR (Mean Time to Respond). (لأن الاستجابة كانت بطيئة جداً).
- الحل: Create a workbook explaining credential rotation. (عمل دليل إرشادي لتسريع عملية تغيير الباسوردات).
- المسؤول: Assign to the L2 that handled the incident. (الـ L2 هو من يكتب الأدلة).
2️⃣ السيناريو الثاني: "الفريق غارق في تنبيهات تافهة"
- المشكلة: الرسالة تقول "المحللون يشتكون من كثرة التنبيهات الكاذبة والضجيج".
- المقياس السيئ: False Positive Rate.
- الحل: Tune detection rules to exclude safe activities. (تعديل القواعد لاستثناء الأنشطة الآمنة).
- المسؤول: Assign to SOC Engineer. (المهندس هو المسؤول عن ضبط الأدوات).
3️⃣ السيناريو الثالث: "اكتشفنا الهجوم بعد أسبوع!"
- المشكلة: الرسالة تقول "الهجوم حدث يوم الاثنين واكتشفناه يوم الجمعة!".
- المقياس السيئ: MTTD (Mean Time to Detect). (وقت الكشف طويل جداً).
- الحل: Check log collection latency and detection frequency. (التأكد من سرعة وصول السجلات).
- المسؤول: Assign to SOC Engineer.

