على عكس أداة التشويه الموجودة في فوتوشوب، تعمل DragGAN على تلاعب الصور بطرق واقعية بدلاً من مجرد تشويهها.
تم توضيح هذا في مقاطع الفيديو المشتركة عبر الإنترنت، حيث يمكنك رؤية كيف يمكن للأداة تحريك رأس الأسد ليتثاءب أو جعل أي شخص يبتسم بشكل طبيعي.
ما يجعل هذه الأداة مدهشة، هو أنها تنتج نتائج متسقة وواقعية، وقد تم تطويرها كجزء من البحث الأكاديمي من قبل معهد ماساتشوستس للتكنولوجيا وجامعة بنسلفانيا وجوجل.
بالإضافة إلى ذلك، يمكن لهذه الأداة أن تعزز نماذج الذكاء الاصطناعي القائمة على التوليد مثل DALL-E 2 أو Stable Diffusion أو Midjourney، حيث يمكنها ضبط النتائج التي تنتجها هذه النماذج لتحقيق ما ترغب فيه بالضبط.
بشكل عام، يعتبر DragGAN نموذجًا يسمح لك بتعديل أبعاد العناصر في الصورة، ولكن قدرات هذا النموذج تتجاوز بكثير ما يمكن أن نقوم به باستخدام أدوات معالجة الصور التقليدية. ووفقًا للباحثين، يتيح النموذج التحكم الدقيق والمرن في موضع وشكل وتعبير العناصر داخل الصورة من خلال إيماءات السحب.
من خلال تغيير أبعاد أو شكل العناصر، يقوم النموذج بتكييف الصورة بحيث تظل واقعية وتحتفظ جميع أجزائها بالتناسق. وبالتالي، يمكن الحصول على النتائج المرجوة عن طريق تعديل الصور فيما بعد باستخدام DragGAN بالاستفادة
Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold
— AK (@_akhaliq) May 19, 2023
paper page: https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA