🎞️ Netflix

“Whisk” !أداة ذكاء اصطناعي من جوجل تستخدم الصور كأوامر

أراجيك تِك
أراجيك تِك

3 د

تُحوّل أداة "Whisk" من جوجل الصور المُحمّلة إلى أفكار بصرية جديدة باستخدام الذكاء الاصطناعي.

تعتمد الأداة على نموذج Gemini للوصف النصي وImagen 3 لتوليد الصور النهائية.

تُظهر النتائج جوهر الصورة فقط مع اختلافات في التفاصيل الدقيقة.

الأداة متاحة حالياً للمستخدمين في الولايات المتحدة عبر Google Labs.

في خطوة جديدة نحو تعزيز أدوات الذكاء الاصطناعي التوليدي، كشفت جوجل عن أداة جديدة تُدعى "Whisk"، وهي جزء من تجارب مختبرات Google Labs. تُمكّن الأداة المستخدمين من توليد صور جديدة مستوحاة من صور أصلية مُحمّلة، ما يفتح الباب أمام أفكار بصرية مبتكرة، وإن كانت النتائج لا تزال تُظهر بعض التحديات في التفاصيل المعقدة.


تفاصيل الأداة

تصف جوجل "Whisk" بأنها أداة إبداعية تستهدف المصممين والمهتمين بالتصوّرات السريعة للأفكار البصرية. الأداة لا تُعيد إنتاج الصورة الأصلية، بل تلتقط جوهرها العام فقط. فبمجرد تحميل صورة، تُستخدم كمدخل لإنشاء صورة جديدة بتفاصيل مُغايرة، مما يجعلها مناسبة للرسوم البسيطة والابتكارات السريعة.

وعلى عكس أدوات التعديل الاحترافية، لا تُعتبر "Whisk" أداة دقيقة لتصميم محتوى جاهز للاستخدام النهائي. تُوصي جوجل باستخدام أداة Whisk في "الاستكشاف البصري السريع" أكثر من اعتمادها في إنتاج صور مُتقدّمة أو مشروعات تتطلب دقة عالية.


كيف تعمل الأداة

تستند أداة "Whisk" إلى دمج تقنيات الذكاء الاصطناعي المتطورة في مرحلتين:

  • المرحلة الأولى: يستخدم نموذج "Gemini" اللغوي لتحليل الصورة الأصلية وتقديم وصف نصي تفصيلي لها.
  • المرحلة الثانية: يُقدّم هذا الوصف إلى نموذج توليد الصور "Imagen 3" الذي يُنتج صورة جديدة بناءً على النص بدلاً من التفاصيل البصرية المباشرة.

مثال على ذلك: عند تحميل صورة لشخصية ما ومحاولة تحويلها إلى "دمية محشوة" أو مشهد فني، قد تُنتج الأداة نسخة مبتكرة لكنها قد تختلف من حيث الملامح أو النمط الدقيق.


الخيارات المتاحة

عند بدء الاستخدام، تتيح الأداة للمستخدم اختيار أحد الأنماط الثلاثة التالية:

  • ملصقات (Stickers).
  • دبابيس معدنية (Enamel Pins).
  • دمى محشوة (Plushies).

هذا التحديد يُظهر تركيز جوجل على جعل "Whisk" أداة تجريبية مُصمّمة لتصوّرات أولية سريعة وبسيطة، بعيداً عن التعقيدات الفنية العالية.


التحديات الحالية

بالرغم من كونها أداة مبتكرة، إلا أن "Whisk" تُظهر بعض القيود. على سبيل المثال:

  • النتائج قد تفتقر إلى الدقة في التمثيل التفصيلي.
  • بعض العناصر الأساسية للصورة قد يتم استبدالها أو إغفالها تماماً.
  • الاستجابة لأوصاف معقدة أو دقيقة تكون أحياناً غير مُرضية.

في تجربة عملية، عند محاولة توليد صورة لشخصية شهيرة بأسلوب "دمية محشوة" داخل مشهد مُحدّد، جاءت النتائج بعيدة عن المطلوب. ورغم ذلك، تُعد هذه التجارب مُبرّرة بالنظر إلى الهدف الأساسي من الأداة، وهو توليد أفكار إبداعية أولية.


إتاحة الأداة

ذو صلة

حتى الآن، تتوفر أداة "Whisk" حصرياً في الولايات المتحدة، ويمكن الوصول إليها عبر موقع Google Labs الرسمي. ولم تُعلن جوجل بعد عن موعد الإطلاق العالمي للأداة أو عن إضافة خيارات جديدة مستقبلاً.

في ظل المنافسة الشرسة بين عمالقة التكنولوجيا على تطوير أدوات الذكاء الاصطناعي التوليدي، تُقدّم "Whisk" بُعداً جديداً للأفكار الإبداعية. ومع أنها ليست حلاً نهائياً لإنتاج صور دقيقة، إلا أنها تُلبي حاجة المستخدمين للاستكشاف البصري السريع. تُجسّد الأداة خطوة واعدة، قد تُمهّد الطريق لتحسينات مستقبلية تُمكّنها من الوصول إلى جمهور أوسع.

أحلى ماعندنا ، واصل لعندك! سجل بنشرة أراجيك البريدية

بالنقر على زر “التسجيل”، فإنك توافق شروط الخدمة وسياسية الخصوصية وتلقي رسائل بريدية من أراجيك

عبَّر عن رأيك

إحرص أن يكون تعليقك موضوعيّاً ومفيداً، حافظ على سُمعتكَ الرقميَّةواحترم الكاتب والأعضاء والقُرّاء.

ذو صلة