هوش مصنوعی هنرمند
یادمه چند سال قبل اساتید و صاحبنظران مدعی در فلسفهی ذهن میگفتند «خلاقیت انسانی» اون جاییه که هوش مصنوعی هیچوقت به انسان نمیرسه و به این نحو یک اصالت یا بقول دکارت جوهر اندیشنده (res cogitans) ای برای انسان قائل بودند که اون رو از ماشین متمایز میکنه. ولی خب سخت در اشتباه بودند. چون هوش مصنوعی این یک مقوله رو هم فتح کرد.
هوشهای مصنوعیِ خلاقی توسعه پیدا کردهاند که فقط با دادن یک پرامپت متنی در عرض چند ثانیه شاهکارهای هنری خلق میکنند. البته من هم ازشون استفاده میکنم و ایدهها و ویژنهام رو به کمک AI به تصویر میکشم. این اثرات هنری رو اخیرا در یک پیج اینستاگرامی به نام imAIgine اشتراک میگذارم.
DALL-E 2
توسعهیافته شده توسط OpenAI؛ دالای۲ تصاویر واقعگرایانه، هنری و اورجینال رو بر اساس توضیحات متنی ایجاد میکنه و میتونه کانسپتها، مشخصهها و استایلهای متفاوت رو با هم ترکیب کنه. همچنین میتونه variationهای مختلفی از یک تصویر هم ارائه بده. . یکی دیگه از قابلیتهاش هم outpainting کردنه؛ یعنی مرزهای یک اثر دیگر رو بر اساس تصویر ارسالی بطور خلاقانه گسترش بده.
خیلی اوقات تصاویر ایجاد شده میتونه اعجاب آور و سورپرایز کننده باشه مثلا در مورد نمونهی زیر من صرفا از کپشن “Natural Intelligence” یا «هوش طبیعی» استفاده کردم؛ بدون اینکه بدونم دقیقا چی میخوام و همچین شاهکاری رو به تصویر کشید. من هم گذاشتمش آواتار پیج imAIgine.
البته اینو بگم همیشه تصاویر ایجاد شده لزوما شاهکارهای هنری نیستند و بهتره که جزئیات بیشتر و سبک مورد نظر داخل پرامپت اورده بشه و حتی اون موقع هم ممکنه که اون تصویری رو که میخواهید بهتون نده. نهایتا میتونید با امتحان بیشتر به یک تصویر بهتر برسید.
OpenAI قبل از DallE یک مدل یادگیری عمیق داشت به نام CLIP که کارش کپشنگذاری روی تصاویر بود. حالا اونها به این image generation stack شون میگن unCLIP چون تصاویر رو با معکوس کردن انکودر CLIP ایجاد میکنه. در اینجا میتونید با جزئیات بیشتر در مورد نحوهی کارکرد این مدل آشنا بشید.
Midjourney
هوش مصنوعی میدجرنی نتایج هنری خیلی خوبی میده. تقریبا تمامی پرامپتهایی که بهش داده میشه میتونه یه اثر هنری تلقی بشه. در قالب یک بات دیسکوردی توسعهیافته شده. اگر Discord داشته باشید میتونید امتحانش کنید. اگر از عکس ایجاد شده خوشتون بیاد میتونید اون رو Upscale کنید و از بات بخواهید که اون رو با جزئیات بیشتر نشون بده. همچنین میشه بعنوان ورودی از یک تصویر هم در کنار متن استفاده کرد. یا میشه دو تا تصویر رو با هم آپلود کرد و میدجرنی استایل این دو تصویر رو با هم ترکیب میکنه.
Stable Diffusion
استیبل دیفیوژن هم یه ایجادکنندهی تصویر اوپنسورسه که توسط Stability AI ایجاد شده. خوبیش به اوپن سورس بودنشه . اینکه هر کسی میتونه ازش استفاده کنه و ابزارهایی که میخواد رو باهاش بسازه. کدش اینجا توی گیتهاب در دسترسه.
در آخر باید بگم که هوش مصنوعی میتونه برای توسعهی هنر استفاده بشه. ابزار خیلی خوبیه برای افرادی مثل من که ویژنها و ایدههای هنری زیادی دارند؛ ولی دست هنرمندی ندارند که اونها به تصویر بکشه.