الساعة الثانية: تصنيف الصور
8 د
كان يتحدث مع صديقه عن ماكينة تحضير القهوة التي اشتراها حديثًا، وعن ميزاتها الرائعة. أعجَبت الماكينة الصديق وقرر أن يشتري واحدة منها، فما كان منه إلا أن التقط صورة لها وذهب إلى تطبيق أمازون ومن ثم حمّل الصورة، فرشح له التطبيق الماكينة ذاتها، بالإضافة إلى عشرات الخيارات المشابهة.
هذه العملية على بساطتها تُخفي وراءها تكنولوجيا يمكن وصفها بالثورية، لما لها من تطبيقات رائعة ومفيدة إلى أقصى الحدود. بدءًا من خيار البحث عن طريق غوغل إلى التطبيقات الزراعية والصناعية والطبية وكذلك العسكرية. فإذا كان لديكم فضول لمعرفة كيف تعمل هذه التقنية التي تُعرف بتصنيف الصور، فهذا المقال مناسب لكم.
هذه المقالة هي جزء من سلسلة تتحدث عن مواضيع مشابهة، بدأناها بالحديث عن الرؤية الحاسوبية بشكل عام، والآن سنتعمق في تصنيف الصور بشكل خاص.
ما هو تصنيف الصور
تصنيف الصور هو عملية تحليل وتصنيف الصور إلى فئات محددة باستخدام تقنيات الذكاء الاصطناعي والتعلم الآلي. يعتمد هذا التصنيف على نماذج متقدمة من الشبكات العصبية العميقة التي تتعلم من كمية ضخمة من البيانات المصنفة مسبقًا. هذه التقنية تُمكن الحواسيب من التعرف على محتوى الصور وفهمها "كما يفعل البشر"، مما يتيحُ تطبيقاتٍ واسعة مثل البحث عن الصور، التعرف على الوجوه، وتحليل الصور الطبية.
إذًا، فالفكرة بشكل مبسط هي أن يكون لدينا صور مثل صورة الهامستر اللطيف هذا، وتقوم تقنية تصنيف الصور على تحديد ماهية الصور
لكن السر يكمن كله في هذا السهم الاسود، فيمكن ان نقول بداية أن الحل هو السحر.
لكن للاسف لا يوجد سحر في الحياة الواقعية لذلك علينا أن نخترعه. لذلك سنقوم باستبدال الصور السحرية بمرحلتين:
المرحلة الأولى وهي التدريب. في هذه المرحلة نعطي النموذج (model) الصورة مع الصفة. أي أن نغذي النموذج ببيانات موصوفة، أي أن لكل صورة صفة أو تسمية خاصة فيها (labeled images).
يمكن أن نرى في الصور في الأسفل كيف نغذي النموذج بصور مختلفة لحيوانات منها الهامستر بالطبع. في كل مرة يجب أن نخبر النموذج أنه يشاهد صور الهامستر الآن أو الكلب أو القطة …
أما المرحلة الثانية، فهي مرحلة الاختبار حيث علينا أن نعطي النموذج الصورة فقط بدون الصفة وعليه هو أن يعطينا الصفة الصحيحة. بناء على النتائج في مرحلة الاختبار علينا أن نُقرر فيما اذا كانت مرحلة التدريب قد تمت أو أننا بحاجة إلى تدريب النموذج بشكل أكبر.
حسنًا، عرفنا إلى هذه المرحلة أننا بحاجة إلى تدريب نموذج ما، ومن ثمّ اختباره، لكن ماذا نقصد هنا بكلمة نموذج وكيف ندربه بالضبط. حان الوقت للتعرف على النموذج الأول.
النموذج الأول … خوارزمية الجار الأقرب
نموذج أو خوارزمية الجار الأقرب هي واحدة كلاسيكيات تنصيف الصور وواحدة من أقدم الخوارزميات، ويرجع الفضل إلى "إيفلين فيكس" و"جوزيف هودجز" في الأفكار الأولية حول نموذج الجار الأقرب (K-Nearest Neighbors). وهي تُعرف اختصارًا ب KNN
تمّ نشرها في هذه الورقة البحثية لعام 1970، ومن ثمّ توسع توماس كوفر في مفهومهما في بحثه.
ما هي هذه الخوارزمية
لنفرض أن لدينا صفين A و B.
لتسهيل الموضوع A هي صف القطط وB هي صف الهامستر.
عندما تأتي صورة جديدة باللون الأصفر فعلينا أن نحدد فيما إذا كانت هي صورة لقط أم صورة لهامستر.
تعتمد هذه الخوارزمية على التصويت ويفوز صاحب الأغلبية
نقرر عدد الأصوت عن طريق المعامل K
إذا كان K=1 مثلًا، فإن صوت واحد هو من يقرر النتيجة، وبالتالي نبحث عن أقرب جار.
نجد أن اقرب جار ينتمي إلى الصف B وبالتالي نقرر أن البيانات الجديدة تنتمي إلى B.
في المثال السابق إذا اخترنا k=5 فإننا في هذه الحالة نبحث عن أقرب 5 جيران، ونعد كم من هذه الجيران ينتمي إلى الصف B وكم ينتمي إلى الصف A والعدد الأكبر هو من يقرر النتيجة.
في المثال السابق:
2 تنتمي إلى B
3 تنتمي إلى A
بالتالي نقرر أن البيانات الجديدة تنتمي إلى A.
كيف نختار K؟
الجواب لا يوجد طريقة عامة واغلب مستخدمي الطريقة يعتمدون على التجريب.
كيف نحسب المسافة؟
يوجد عدة طرق. أهم طريقتين لحساب المسافة هي المسافة الاقليدية أو مسافة مانهاتن
حسنًا كيف نستعمل KNN في تصنيف الصور
مرة أخرى لدينا صور لهامستر لطيف، يجب علينا الآن أن نستعمل النموذج الاول الذي تعرفنا عليه، ليحدد إلى أي صف ستنتمي هذه الصورة. بالطبع سنقوم بذلك على مرحلتين الأولى هي التدريب والثانية هي الاختبار.
مرحلتي التدريب والاختبار
مرحلة التدريب عبارة فقط عن تخزين بكسلات كل صورة من الصور التي سنستعملها للتدريب.
مرحلة الاختبار حساب المسافة عن كل صورة من مجموعة التدريب.
كيف نحسب المسافة
نتذكر أن الصور عبارة عن مصفوفة من الارقام
يتم حساب مسافة مانهاتن عن طريق الصيغة التالية
بالطبع بعد أن نحسب كل المسافات. نرى من هي الصور الأقرب وحسب K المختار نعرف التصنيف الصحيح.
في الحقيقة KNN لا يتم تطبيقها على الصور إلا نادرًا جدًا لماذا؟
عدة أسباب
- لا يوجد طريقة أمثلية لايجاد K الأمثل، وطريقة حساب المسافة المثلى.
- سريعة عند التدريب (لا يوجد تدريب في الحقيقة)، وبطيئة جدًا عند الاختبار. وعند التطبيق على صور جديدة.
- غير مستقر. لأن أي تغيير في الاضاءة او في زاوية التصوير لها تأثير كبيرة على النتيجة، لأن تغيير الاضاءة سيغير قيم الارقام، وبالتالي المسافات كلها ستتغير والنتيجة النهائية ستكون مختلفة. مثل الصورة التالية.
سنتعرف في المقالات اللاحقة على نماذج مناسبة أكثر للصور، وسنركز على الحديثة منها والتي تعتمد بشكل شبه كلي على التعليم العميق. فانتظرو المقالات. لكن قبل ذلك تعالوا نتعرف أكثر على صعوبات تصنيف الصور وكذلك بعض تطبيقاتها بشيء من التفصيل.
صعوبات وتحديات تصنيف الصور
تصنيف الصور يعد من التحديات الكبيرة في مجال التعلم الآلي ومعالجة الصور. تتعدد هذه الصعوبات وتتراوح بين الاختلافات داخل نفس الفئة والتشابهات مع الفئات الأخرى، إلى جانب العديد من العوامل البيئية التي تؤثر على جودة التصنيف.
الاختلافات ضمن الصف الواحد
الاختلافات داخل الفئة الواحدة تعتبر من أكبر التحديات، حيث يمكن أن تختلف الصور لنفس الكائن بشكل كبير. على سبيل المثال، صور الهامستر قد تظهر في أوضاع وإضاءة مختلفة، مما يجعل من الصعب على الأنظمة التمييز بدقة.
التشابهات مع الصفوف الأخرى
التشابهات بين الفئات المختلفة تشكل عائقًا آخر. فقد تتشابه بعض الكائنات في الشكل والألوان مع كائنات أخرى، مثل التشابه بين الهامستر وفأر المنزل وخنزير غينيا، مما يزيد من احتمالية حدوث أخطاء في التصنيف.
فار الحقل
فأر المنزل
خنزير غينيا
الأرنب القزم الهولندي
السنجاب الصيدناني المخطط
اختفاء جزء من الكائن
غالبًا ما يحدث أن تختفي أجزاء من الكائن في الصورة بسبب الزاوية أو الحجب الجزئي، مما يعقد عملية التعرف عليه. مثلاً، قد يكون جزء من جسم فأر المنزل محجوبًا خلف شيء ما في الصورة.
اختلافات الاضاءة
الإضاءة المتغيرة بين الصور يمكن أن تؤثر بشكل كبير على مظهر الكائنات. فقد يظهرالهامتسر بألوان مختلفة تحت إضاءة مختلفة، مما يصعب على النظام التعرف عليه بشكل صحيح.
مشكلة الخلفية
خلفيات الصور المتنوعة تساهم في تعقيد عملية التصنيف. أنظر الصور التالية
تشوه الكائن
يمكن أن تحدث تشوهات في صور الكائنات بسبب جودة الصورة أو الحركة أثناء التقاطها. هذا التشوه قد يجعل من الصعب على النظام تحديد الكائن بدقة.
تطبيقات تصنيف الصور
تصنيف الصور في الرعاية الصحية
- يتضمن تحليل الصور الطبية مثل الأشعة السينية والرنين المغناطيسي والأشعة المقطعية
- تشخيص الأمراض والحالات الطبية بسرعة ودقة، مثل السرطان والالتهاب الرئوي وأمراض القلب
- تشخيص أكثر دقة، والكشف المبكر عن الأمراض، وتحسين نتائج المرضى.
تصنيف الصور في النقل
- اكتشاف الأشياء وتتبعها، وتحليل حركة المرور، وفحص السلامة.
- التعرف على صور المركبات والمشاة والأشياء الأخرى التي تلتقطها الكاميرات على الطرق والجسور والأنفاق وتصنيفها
- تقديم رؤى قيمة حول تدفق حركة المرور وسلوك المركبات والمشاة والمخاطر المحتملة على السلامة
- يلعب تصنيف الصور أيضًا دورًا حيويًا في المركبات ذاتية القيادة، حيث يمكّنها من التنقل واتخاذ القرارات بناءً على الأشياء والمواقف التي تواجهها على الطريق.
تصنيف الصور في الزراعة
- يمكن للمزارعين تحديد المحاصيل التي تتطلب الاهتمام بسرعة ودقة، ومراقبة نمو النباتات، والتنبؤ بالعائد
- تحسين المحاصيل وتحسين الكفاءة
- لا يزال استخدام تقنية تصنيف الصور في الزراعة في مراحله الأولى.
تصنيف الصور في الغابات
- يمكّن الباحثين ومديري الغابات من تحليل ورصد مساحات كبيرة من الغطاء الحرجي باستخدام صور الأقمار الصناعية
- تصنيف الصور تلقائيًا إلى فئات مختلفة مثل الغابات والأراضي العشبية والمسطحات المائية والمناطق الحضرية.
تصنيف الصور في الدفاع والعسكرية
- العثور على المركبات والمباني والأشخاص
- اكتشاف الاختلافات والأنماط الدقيقة في الصور، والتي قد لا تكون مرئية للعين البشرية
- يمكن للمؤسسات الدفاعية والعسكرية تحديد التهديدات المحتملة وتتبع تحركات العدو ومراقبة الأنشطة في منطقة معينة
تصنيف الصور في البيع بالتجزئة
- يمكن لتجار التجزئة تحليل صور منتجاتهم وعملائهم للحصول على فهم أعمق لسلوك المستهلك وتفضيلاته
- يمكن استخدام تصنيف الصور لتحديد لون ونمط وحجم العناصر الموجودة في المخزون
- تحسين سلسلة التوريد وإدارة مستويات المخزون بشكل أكثر كفاءة.
تصنيف الصور في التصنيع
- تحسين جودة المنتج، وزيادة الكفاءة، وخفض التكاليف
- تحديد العيوب أو الحالات الشاذة بدقة وتنبيه المشغلين في الوقت الفعلي
- أتمتة المهام الشاقة والمعرضة للخطأ، وتقليل الهدر
تصنيف الصور في إدارة النفايات
- تحديد وفرز أنواع مختلفة من النفايات، مثل البلاستيك والورق والمعادن، بدقة عالية
- يحسن كفاءة فرز النفايات ويقلل من الأخطاء البشرية ويعزز جهود إعادة التدوير
تصنيف الصور في التأمين
- يمكن لشركات التأمين تسريع عملية المطالبات وتقليل الأخطاء اليدوية
- تقديم تقديرات أكثر دقة لعملائها
- يساعد شركات التأمين على اكتشاف المطالبات الاحتيالية المحتملة من خلال تحليل الصور بحثًا عن علامات التلاعب أو عدم الاتساق.
تصنيف الصور في الجيولوجيا
- تصنيف ورسم أشكال الأرض المختلفة، مثل الجبال والأنهار والسواحل
- يساعد ذلك الجيولوجيين على تحديد المناطق ذات الإمكانات المعدنية العالية
- مراقبة المخاطر الطبيعية، وتتبع التغيرات في استخدام الأراضي مع مرور الوقت
تصنيف الصور في التحليل الرياضي
- تحديد الأحداث الرئيسية واللاعبين على أرض الملعب
- تحديد الأهداف والأخطاء وحوادث التسلل، مما يوفر بيانات قيمة للمدربين واللاعبين على حد سواء
تصنيف الصور في الصناعات الغذائية
- التمييز بين المواد الغذائية المختلفة
- أتمتة العمليات مثل مراقبة الجودة وإدارة المخزون
- تبسيط العمليات وتقليل مخاطر الأخطاء
في الختام، يعد تصنيف الصور تقنية متقدمة في الذكاء الاصطناعي والتعلم الآلي، تسهم في تطوير تطبيقات متعددة من الطب إلى الزراعة والصناعة والدفاع. استعرضنا خوارزمية الجار الأقرب (KNN) وتحديات تصنيف الصور، مثل الاختلافات ضمن الفئة الواحدة والتشابهات بين الفئات المختلفة وتأثير العوامل البيئية.
رغم هذه التحديات، يستمر تطوير نماذج أكثر دقة وفعالية، خاصةً مع التعليم العميق. في المقالات القادمة، سنستعرض هذه النماذج الحديثة وتقنياتها، وكيفية تحسين أداء التصنيف والتغلب على الصعوبات الحالية. تابعونا لاكتشاف المزيد عن هذه التقنية الثورية وتطبيقاتها المتنوعة.
أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية
بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك
عبَّر عن رأيك
إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.