پرش به محتوا

اثر هنری با هوش مصنوعی

از ویکی‌پدیا، دانشنامهٔ آزاد
تصویری که با دال ئی ۲ تولید شده است و پراپمت آن: «گاو دزدیده شده توسط موجودات فضایی» است.

هنر هوش مصنوعی به هنری گفته می‌شود که در آن تنها هوش مصنوعی دست داشته باشد. به عبارتی در خلق این اثر هنری که وجود خارجی ندارد و حتی می‌تواند غیر واقعی باشد تنها هوش مصنوعی دخیل است.

ابزارات و کار‌ها

[ویرایش]

تصویر سازی

[ویرایش]

روش‌های مختلفی برای ایجاد هنر هوش مصنوعی وجود دارد، از جمله این موارد می‌توان به تولید تصاویر رویه‌ای مبتنی بر قانون با استفاده از الگوهای ریاضی، الگوریتم‌هایی که ضربات قلم مو و دیگر جلوه‌های نقاشی شده را شبیه‌سازی می‌کنند، و هوش مصنوعی یا الگوریتم‌های یادگیری عمیق مانند شبکه‌های متخاصم و ترانسفورماتورهای مولد اشاره کرد.

یکی از اولین کار‌ها AARON بود که توسط هارولد کوهن در دهه 60 میلادی ساخته شد[۱]. AARON بر مبنای رویه مبتنی بر قانون کار می‌کرد و در آن زمان بسیار کارایی داشت.دلیل اصلی کوهن برای توسعه AARON ترسیم در رمزگذاری بود که در ادامه تغییرات زیادی داشت. آن در ابتدا تنها تصاویر سیاه و سفید تولید می‌کرد که خود کوهن آن‌ها را رنگ‌آمیزی می‌کرد. ولی در ادامه کوهن با استفاده از روش‌های دیگر توانست کاری کند که با استفاده از برس‌های رنگ آمیزی این‌کار را خودش انجام دهد[۲].

از سال ۲۰۱۴ که، شبکه‌های متخاصم مولد (GAN) معرفی شدند اغلب توسط هنرمندان هوش مصنوعی از آن‌ها استفاده می‌کنند. این سیستم از دو تابع بهره می‌برد که یکی از آن‌ها مولدی است که تصاویر را تولید کرده و دیگری تصمیم گیرنده‌ای است که از بین تصاویر تولیدی بهترین را انتخاب می‌کند[۳].  مدل‌های جدیدتر از شبکه خصمانه تولید کوانتیزه برداری و آموزش زبان متضاد تصویر (VQGAN+CLIP) استفاده می‌کنند.  که این شبکه‌ها در دقت تصمیم گیری بهتر برای نقاشی و اثر صحیح تر خودشان معروف هستند[۴].

رؤیای عمیق که توسط گوگل در سال 2015 منتشر شد، از یک شبکه عصبی پیجشی برای یافتن و بهبود الگوها در تصاویر از طریق الگوریتم پاریدولیا می‌کند، بنابراین تصاویری عمداً بیش از حد پردازش شده ایجاد می‌کند. پس از انتشار رؤیای عمیق و موفقیت‌های آن در دید عموم، چندین شرکت برنامه‌هایی را منتشر کردند که می‌توانند عکس‌ها را به تصاویر هنری با سبک مجموعه‌های معروف نقاشی تبدیل کنند[۵][۶]. این کار حتی از رؤیای عمیق هم بیشتر مورد استقبال قرار گرفت تا جایی که امروزه یکی از بحث‌های داغ موجود همین برنامه‌ها هستند.

۲۰۲۰

[ویرایش]

در دهه ۲۰۲۰، مدل‌های متن به تصویر که بر اساس پرامپت Prompts تصاویر را تولید می‌کنند ، به طور گسترده مورد استفاده قرار گرفتند.

در سال ۲۰۲۱، اوپن‌ای‌آی، با استفاده از مدل‌های ترنسفورمر تولیدگر از پیش آموزش‌دیده (GPT) (مدل زبانی بزرگ (LLM) که در جی‌پی‌تی ۲ و جی‌پی‌تی ۳ استفاده می‌شوند)، یک سری از تصاویر ایجاد شده با مدل هوش مصنوعی متن به تصویر دال ئی را منتشر کرد. این در واقع اساس معماری جی‌پی‌تی ۳ بود.

تصویری از فیلم مستند رقص کوتوله قرمز اثر اریک میلیکین

از همان سال تلاشهایی توسط کمپانیهای دیگر مثل EleutherAI، دیفیوژن Diffusion model[۷][۸][۹]، گوگل برین، میدجرنی، ادوبی، بلندر، گیمپ، کریتا و دیگر برنامه‌های رابط کاربری مدل متن‌باز ترنسفورمر تولیدگر از پیش آموزش‌دیده (GPT) انجام شده‌است.

در سال ۲۰۲۳، اریک میلیکین، فیلم مستند رقص کوتوله قرمز (The Dance of the Nain Rouge) را، با کمک فناوری دیپ فیک هوش مصنوعی درباره افسانه فولکلور دیترویت نائین روژ ساخت. و "جایزه بهترین فناوری های نوآورانه" از جشنواره فیلم ربات پیزا 2024 در ایتالیا[۱۰] و "بهترین فیلم انیمیشن" در جشنواره فیلم پوچ 2024 ایتالیا[۱۱] را دریافت کرد.


منابع

[ویرایش]
  1. McCorduck, Pamela (1991). AARONS's Code: Meta-Art. Artificial Intelligence, and the Work of Harold Cohen (به انگلیسی). New York: W. H. Freeman and Company. pp. 210. ISBN 0-7167-2173-2.
  2. "Fine art print - crypto art". Kate Vass Galerie (به انگلیسی). Retrieved 2022-05-07.
  3. Goodfellow, Ian; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde-Farley, David; Ozair, Sherjil; Courville, Aaron; Bengio, Yoshua (2014). Generative Adversarial Nets (PDF). Proceedings of the International Conference on Neural Information Processing Systems (NIPS 2014). pp. 2672–2680.
  4. Burgess, Phillip. "Generating AI "Art" with VQGAN+CLIP". Adafruit. Retrieved July 20, 2022.
  5. "A.I. photo filters use neural networks to make photos look like Picassos". Digital Trends (به انگلیسی). 18 November 2019. Retrieved 9 November 2022.
  6. Biersdorfer, J. D. (4 December 2019). "From Camera Roll to Canvas: Make Art From Your Photos". The New York Times. Retrieved 9 November 2022.
  7. Sohl-Dickstein, Jascha; Weiss, Eric; Maheswaranathan, Niru; Ganguli, Surya (2015-06-01). "Deep Unsupervised Learning using Nonequilibrium Thermodynamics" (PDF). Proceedings of the 32nd International Conference on Machine Learning. 37. PMLR: 2256–2265. arXiv:1503.03585.
  8. Dhariwal, Prafulla; Nichol, Alexander (2021). "Diffusion Models Beat GANs on Image Synthesis". Advances in Neural Information Processing Systems. 34. Curran Associates, Inc.: 8780–8794. arXiv:2105.05233.
  9. Rombach, Robin; Blattmann, Andreas; Lorenz, Dominik; Esser, Patrick; Ommer, Björn (2021-12-20), High-Resolution Image Synthesis with Latent Diffusion Models, arXiv:2112.10752
  10. "PISA ROBOT FILM FESTIVAL 3 - I vincitori - CinemaItaliano.info". www.cinemaitaliano.info. Retrieved 2024-06-03.
  11. "Awards of December 2023 – January 2024". Absurd Film Festival (in Italian). 2024-02-01. Retrieved 2024-03-31.