هوش مصنوعی هنرمند

یادمه چند سال قبل اساتید و صاحب‌نظران مدعی در فلسفه‌ی ذهن می‌گفتند «خلاقیت انسانی» اون جاییه که هوش مصنوعی هیچوقت به انسان  نمیرسه و به این نحو یک اصالت یا بقول دکارت جوهر اندیشنده‌ (res cogitans) ای برای انسان قائل بودند که اون رو از ماشین متمایز می‌کنه. ولی خب سخت در اشتباه بودند. چون هوش مصنوعی این یک مقوله رو هم فتح کرد.

هوش‌های مصنوعیِ خلاقی توسعه پیدا کرده‌اند که فقط با دادن یک پرامپت متنی در عرض چند ثانیه شاهکارهای هنری خلق می‌کنند. البته من هم ازشون استفاده می‌کنم و ایده‌ها و ویژن‌هام رو به کمک AI به تصویر می‌کشم. این اثرات هنری رو اخیرا در یک پیج‌ اینستاگرامی به نام imAIgine اشتراک می‌‌گذارم.

 

DALL-E 2

توسعه‌یافته شده توسط OpenAI؛ دال‌ای۲ تصاویر واقع‌گرایانه، هنری و اورجینال رو بر اساس توضیحات متنی ایجاد می‌کنه و می‌تونه کانسپت‌ها، مشخصه‌ها و استایل‌های متفاوت رو با هم ترکیب کنه. همچنین می‌تونه variation‌های مختلفی از یک تصویر هم ارائه بده. . یکی دیگه از قابلیت‌هاش هم outpainting  کردنه؛ یعنی مرزهای یک اثر دیگر رو بر اساس تصویر ارسالی بطور خلاقانه گسترش بده.

یک نمونه آرت ایجاد شده با دال‌ای
یه نمونه‌ همراه با کپشنی که خودم دادم؛ «مردی که بجای سر کندوی زنبور داره و به سبک داوینچی‌ هم باشه. »

خیلی اوقات تصاویر ایجاد شده میتونه اعجاب آور و سورپرایز کننده باشه مثلا در مورد نمونه‌ی زیر من صرفا از کپشن “Natural Intelligence”  یا «هوش طبیعی» استفاده کردم؛ بدون اینکه بدونم دقیقا چی میخوام و همچین شاهکاری رو به تصویر کشید. من هم گذاشتمش آواتار پیج imAIgine.

هوش طبیعی
Natural Intelligence

البته اینو بگم همیشه تصاویر ایجاد شده لزوما شاهکارهای هنری نیستند و بهتره که جزئیات بیشتر و سبک مورد نظر داخل پرامپت اورده بشه و حتی اون موقع هم ممکنه که اون تصویری رو که می‌خواهید بهتون نده. نهایتا می‌تونید با امتحان بیشتر به یک تصویر بهتر برسید.

OpenAI  قبل از DallE یک مدل یادگیری عمیق داشت به نام CLIP که کارش کپشن‌گذاری روی تصاویر بود. حالا اونها به این image generation stack شون میگن unCLIP چون تصاویر رو با معکوس کردن انکودر CLIP ایجاد میکنه. در  اینجا می‌تونید با جزئیات بیشتر در مورد نحوه‌ی کارکرد این مدل آشنا بشید.

یک شمای کلی از آنکلیپ
یک شمای کلی از unCLIP

Midjourney

هوش مصنوعی میدجرنی نتایج هنری خیلی خوبی میده. تقریبا تمامی پرامپت‌هایی که بهش داده میشه میتونه یه اثر هنری تلقی بشه. در قالب یک بات دیسکوردی توسعه‌یافته شده. اگر Discord داشته باشید می‌تونید امتحانش کنید. اگر از عکس ایجاد شده خوشتون بیاد می‌تونید اون رو Upscale کنید و از بات بخواهید که اون رو با جزئیات بیشتر نشون بده. همچنین میشه بعنوان ورودی از یک تصویر هم در کنار متن استفاده کرد. یا میشه دو تا تصویر رو با هم آپلود کرد و میدجرنی استایل این دو تصویر رو با هم ترکیب می‌کنه.  

 

Antichrist's Last Supper
Zombies and monsters behind the desk in the last supper painting by Leonardo da Vinci

Stable Diffusion

استیبل دیفیوژن هم یه ایجاد‌کننده‌ی تصویر اوپن‌سورسه که توسط Stability AI  ایجاد شده. خوبیش به اوپن سورس بودنشه . اینکه هر کسی می‌تونه ازش استفاده کنه و ابزارهایی که میخواد رو باهاش بسازه. کدش اینجا توی گیتهاب در دسترسه.

stable-diffusion examples

در آخر باید بگم که هوش مصنوعی میتونه برای توسعه‌ی هنر استفاده بشه. ابزار خیلی خوبیه برای افرادی مثل من که ویژن‌ها و ایده‌های هنری زیادی دارند؛ ولی دست هنرمندی ندارند که اونها به تصویر بکشه.