Post Top Ad- blog3

Friday, October 5, 2018

الجزيرة تحلل 6500 صورة على موقعها..إليكم النتائج

نُشِر هذا المقال للمرة الأولى على صفحة معامل “الجزيرة” بموقع Medium
مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقع
يعتبر اختيار الصورة الصحيحة لسرد قصتك على نفس القدر من الأهمية مع عنوان إخباري جيد، ومع قرب انتهاء عام 2017، قررنا أن نقوم بجمع كافة الصور التي قمنا بنشرها على صفحتنا الرئيسية خلال هذا العام، ونسأل أنفسنا ما هي أنماط الصور التي رآها قراؤنا عند زيارتهم لموقعنا؟
طرح الأسئلة الصحيحة
استعنا بـVision API، الخاص بجوجل، من أجل تحليل محتوى وسياق كل صورة، إذ يستخدم هذا النموذج القوي، المعتمد على تعلم الآلة، قواعد بيانات جوجل الضخمة الخاصة بالصور، من أجل تحديد الوجوه والمعالم والعناصر اليومية داخل صورة، وتعتمد طريقة عمله على أنه يسمح لك بتحميل أي صورة من خلال هذه الخدمة، ومن ثم تستقبل سمات الصورة على هيئة أرقام ترجيحية.
إذا قمت بتحميل صورة الرئيس الأمريكي “دونالد ترامب”، ستعود إليك مع التفاصيل التالية:
للاستفادة من هذه التقنية وضعنا عاملان رئيسيان في عين الاعتبار:
ما الذي نريد أن نتعلمه من صورنا الـ6500؟
كيف يمكن للآلات  البصرية المعتمدة على هذه التقنية أن تُستخدم في غرف الأخبار؟
بدأنا استكشافنا بطرح الأسئلة التالية على أنفسنا:
– من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟
– كم عدد المرات التي استخدمنا فيها أوجه أشخاص ومن هم هؤلاء الأشخاص؟
– كم كان منهم من النساء وكم كان منهم من الرجال؟
– كم مرة استخدمنا صور محتجين؟
– كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟
– كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟
– ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟
بالطبع، لم نكن واثقين من مدى دقة أو قصور Vision API في تحليل قاعدة البيانات الخاصة بنا، وعليه بدأنا بعينة صغيرة من الصور، وما لبثت أن أخذت في الازدياد حتى انتهى بنا الأمر بأن نضع استفساراتنا ونقسم أكثر من 25 ألف سجل من البيانات.
المسائل التقنية
استخدمنا “بايثون” في البرمجة النصية والاستفسار عن البيانات، وMySQL في تخزين وفرز البيانات.
استغرق تشغيل البرمجة النصية ثماني ساعات، مُضاف إليها أربع ساعات أخرى من أجل إتمام استفسارات SQL والتحليل.
نتائج أولية
رغم أن جوجل Vision API يعتبر أحد أكثر منصات الكشف عن الصور تقدمًا، فإن به أوجه قصور، فمثلما هو متوقع لا يحدد العناصر المتواجدة داخل إطار بصورة صحيحة دائمًا، وفي بعض الحالات، يكون هامش الخطأ هذا مقبولًا تمامًا، لكن في حالات أخرى يكون ذلك بعيدًا عن الهدف كليًّا.
الآن وقد اتضح هذا، إليكم بعض العوامل التي تستحق أن توضع في الاعتبار عند استخدام Vision API الخاص بجوجل:
– كانت الميزة الأكثر إفادة لتحليل صور الأخبار هي خاصية web entities، أو الكشف عن المواضع التي أشار فيها أحد المواقع إلى صورة، إذ تزودك هذه الخاصية بقائمة من الكلمات المفتاحية الترجيحية، بالإضافة إلى روابط قصص في نفس السياق تحتوي على الصورة. كثيرًا ما كان ذلك دقيقًا جدًّا في الكشف عن الأشخاص المعروفين.
– أما في حالات الأشخاص الأقل شهرة، أسفر الدمج بين web entities وlabel entities (أي الكشف عن المواضع المُشار فيها إلى تصنيف)، عن نتائج أفضل.
– أما الصور التي تحتوي على مجموعات من الأشخاص، فلم تشهد نجاحًا كبيرًا. في أمثلة عديدة، كان كثيرًا ما يتم تبديل تصنيف مجموعة كبيرة من اللاجئين المتواجدين في قوارب ويرتدون سترات نجاة، خطأً وبكل ثقة  الى “مرح” .
– وفي بعض الأحيان، تم إهمال عناصر مهمة في صورة. على سبيل المثال، لم ينتج عن إدخال صورة مقاتلين أعلى شاحنة نصف نقل في الصحراء، سوى “مركبة” باعتبارها كلمة مفتاحية.
– الصور المرسومة يدويا أو الرسوم التوضيحية أسفرت عن نتائج سيئة جدًّا.
لا تعمل هذه التقنية بشكل جيد في الصور المرسومة يدويا او التي تحوي مجموعة من الناس
إجابات على أسئلتنا
من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟
“ترامب”، يليه الرئيس التركي “رجب طيب إردوجان” ووزير الخارجية الأمريكي السابق “ريكس تيلرسون”، وبحثنا بدرجة أعمق فوجدنا أن تعبيرات وجه “ترامب” كان 20% منها فرحة، و6.% غضبًا، و3% حزنًا، و2% مفاجأة.
كم عدد المرات التي استخدمنا فيها أوجه أشخاص؟
3,726 مرة.
كم كان منهم من النساء وكم كان منهم من الرجال؟
للأسف، لم نستطع الإجابة على هذا السؤال.

كم مرة استخدمنا فيها صور محتجين؟

414 مرة.

كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟

أعدنا استخدام 1703 صورة خلال العام الماضي في قصص إخبارية.

كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟

143 مرة.

ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟

قائمة الأشخاص الذين ظهروا 5 مرات أو أكثر:
أفكار ختامية
إن استخدام أدوات تحليل الصور بمفردها لا يعني شيئًا ما لم يتم طرح الأسئلة الصحيحة، ومن أجل أن نحصل على نتائج عملية، ينبغي أن يتم إدماج هذه الأنماط التقنية بصورة مثالية داخل غرف الأخبار المتواجدة الحالية، من أجل تقديم قيمة لكل من الصحفيين والمشاهدين.
الخطة الآن هي أن نحاول تجربة عمليات ادماج هذه الأنماط التقنية بآليات عمل محددة كتلك : 
– وضع وسوم على ملفات الصور، داخل نظام إدارة المحتوى الخاص بنا، من أجل تسهيل الأمر على صحفيينا أن يجدوا صورًا محددة بسرعة كبيرة. على سبيل المثال: العثور على كل صور “دونالد ترامب” إلى جانب “إيمانويل ماكرون” بابتسامة على وجهه. 
– مساعدة الصحفيين على إيجاد أفضل صورة تتماشى مع القصة، أو ما هو أفضل؛ أن نقوم بفلترة جميع الصور التي لن تتماشى مع الصورة.
– الاستفادة من خدمة Cloud Video Intelligence الخاصة بجوجل من أجل تحليل محتوى الفيديوهات الحية واستخراج محتوى يستحق النشر، بسرعة.
– تطبيق التقنية على VR (أي الواقع الافتراضي)،على صور ثلاثية الأبعاد، بحيث يمكن الكشف عن أشياء موضوعة في إطار معين.


هذه كانت أسئلتنا. إذا كان لك أن تحلل نفس مجموعة الصور، أي أسئلة ستطرحها؟



Post Top Ad-blog4