کاربردهای
هوش مصنوعی به صورت پیوسته در حال گسترش است و یکی از جالبترین موارد استفاده از آن، خلق تصاویر و آثار شبه هنری است که میتواند جنبههای جدیدی از این فناوری را پیش روی علاقهمندان قرار دهد. هم اکنون ابزارهای هوش مصنوعی
تبدیل متن به
عکس به شکل رایگان یا پولی در دسترس کاربران قرار دارند؛ اما کدام یک از آنها نسبت به رقبای خود برتری دارد؟ در ادامه این مطلب با دیجیاتو همراه باشید تا به پاسخ سوال مطرح شده و قابلیتهای ابزارهای گوناگون بپردازیم.
هوش مصنوعی تبدیل متن به عکس
در اوایل سال ۲۰۲۲ تعداد انگشت شماری از هوش های مصنوعی تبدیل نوشته به عکس به صورت عمومی در دسترس عموم قرار داشت؛ اما با انتشار نسخه آزمایشی ابزار DALL-E 2 شرایط فرق کرد و کمی بعد هم ابزار Stable Diffusion منتشر شد. در حال حاضر هم تعداد زیادی از وب سایتها و اپلیکیشنها به همین منظور ارائه شدهاند که برخی از آنها امکانات خود را به شکل رایگان عرضه میکنند. در پایین میتوانید لیستی از ابزارهای مبتنی بر هوش مصنوعی برای تبدیل متن به عکس را مشاهده نمایید.
۱. ابزار ساخت تصویر DALL-E 2
هوش مصنوعی DALL-E 2 محصولی از لابراتوار تحقیقاتی OpenAI است که ایلان ماسک یکی از همبنیانگذاران آن به شمار میرود و در بیشتر مواقع تنها با عنوان DALL-E از آن یاد میشود. این ابزار یکی از شناخته شدهترین گزینههای این لیست است که احتمالا نام آن برای بسیاری از کاربران آشنا به نظر میرسد. دو تصویر مشهوری که در فروردین ماه ۱۴۰۱ توسط هوش مصنوعی DALL-E 2 خلق شدند و توانستند توجه رسانهای زیادی را به سوی خود جلب کنند.
توانایی این هوش مصنوعی در تبدیل نوشته به عکس های واقعگرایانه در ابتدای عرضه موجب جلب توجه رسانهها شد و توانست افکار عمومی را روی قابلیتهای خود، متمرکز سازد. هنگامی که تنها افراد معدودی امکان استفاده از ابزار DALL-E 2 را داشتند، خلق یک تصویر از راکون فضانورد با بازتاب جهان در کلاه فضانوردی او توانست سر و صدای زیادی به پا کند و در ادامه هم شاهد انتشار تصویری از یک خرس عروسکی در حال خرید روزمره درون مصر باستان بودیم.
در واقع یکی از نقاط قوت اصلی هوش مصنوعی DALL-E 2، تبدیل نوشتههای کوتاه به عکسهای نسبتا واقعگرایانه است و در مقایسه با رقبای خود، نیاز کمتری به توضیحات دستوری تکمیلی دارد. همین مسئله موجب شده است تا استفاده از این ابزار بسیار آسان باشد و بتواند
بهترین نتیجه را با کمترین تلاش برای کاربران فراهم سازد. تصویری ساخته شده از گذاره «یک مرد که در حال عکاسی با دوربین دیجیتال خود است» توسط هوش مصنوعی DALL-E 2.
واضح است که DALL-E 2 تنها هوش مصنوعی آموزش دیده با یادگیری ماشینی نیست و نرم افزارهای متعدد دیگری به همین منظور توسعه یافتهاند. اما چه چیزی باعث شهرت محصول OpenAI شده است؟ و چرا بسیاری از افراد معتقدند که این فناوری جنجالی و انقلابی محسوب میشود؟
اولین و شاید مهمترین دلیل موفقیت DALL-E 2، خروجی واقعگرایانه آن است که از لحاظ بصری چشمنواز و جذاب به نظر میرسد. این در حالی است که سایر ابزارهای هوش مصنوعی فعال در این زمینه، بیشتر خروجیهایی مشابه با آثار هنری ارائه میکنند که حس تاریک و فضای آخرالزمانی را تداعی مینمایند. اما DALL-E 2 توانسته است به خوبی از چنین فضایی فاصله بگیرد و خود را به واقعیت روزمره نزدیکتر کند. همچنین تصاویر ساخته شده از نظر زیبایی شناختی هم بسیار بیشتر به مذاق اهالی هنر خوش میآید. تصویر ساخته شده توسط DALL-E 2 با گذاره «مغازه شست و شوی لباس در نیمه شب، مهآلود، نئون».
بدون شک DALL-E 2 پیشرفت بزرگی در زمینه هوش مصنوعی تبدیل نوشته به عکس محسوب میشود و بهبود زیادی را نسبت به نسلهای قبلی خود شاهده بوده است. برای مثال در این نسخه، امکان کنترل جنبههای بیشتری به کاربر داده میشود که شامل استایل، سوژه و حتی انتخاب نوع لنز و فاصله کانونی آن میشود. به همین دلیل به نظر برسد که کاربردهای بینهایتی برای این فناوری در آینده متصور باشیم.
یکی دیگر از نقاط قوت DALL-E 2، توانایی بالای آن در درک نوشتههای وارد شده از سوی کاربران در مقایسه با رقبای خود است. یکی از دلایل این امر، بهرهگیری از الگوریتم GPT-3 است که توسط OpenAI توسعه یافته و بدون شک پیشرفتهترین الگوریتم یادگیری ماشینی و پردازش زبانهای طبیعی به شمار میرود. همین موضوع موجب شده است تا این هوش مصنوعی بتواند با دقت بالایی دستورات نوشتاری را تشخیص دهد و آنها را به خروجی بصری تبدیل نماید. مجموعهای از خروجیها که با وارد کردن تصویر قبلی توسط DALL-E 2 ساخته شده است.
هوش مصنوعی DALL-E 2 تنها برای تبدیل متن به عکس کاربرد ندارد و میتواند با دریافت یک تصویر، مجموعهای از خروجیهای مشابه با آن را هم تحویل کاربر دهد. یکی دیگر از قابلیتهای انقلابی آن، امکان دریافت دستورات ویرایش از طریق نوشته و اعمال آنها روی تصاویر آماده است. برای مثال میتوانید به هوش مصنوعی دستور بدهید تا قسمتی از عکس را حذف کند یا سوژه جدید در محل دلخواه اضافه نماید. این ابزار به خوبی میتواند جزئیاتی مثل بازتاب نور را تشخیص دهد و خروجی نهایی را با توجه به تغییرات صورت گرفته، به روزرسانی خواهد کرد.
از دیگر ویژگیهای جدید و مهم DALL-E 2 باید به قابلیت Outpainting اشاره نمود که به کمک آن میتوان یک تصویر را خارج از قاب اصلی آن توسعه داد. در نتیجه تصویری بزرگتر از نسخه اصلی با ابعاد دلخواه در اختیار خواهیم داشت. هوش مصنوعی قادر است با تحلیل المانهای موجود در تصویر اصلی، اقدام به گسترش آنها در حاشیه عکس نماید. تمامی سایهها، بازتابها و بافتهای نسخه اصلی در قسمتهای جدید هم ظاهر میشوند و پسزمینه از تطابق بالایی با نمونه اصلی برخوردار خواهد بود. نسخه گسترش یا آموزش آشپزی و مطالب جالب جدید...
ما را در سایت آموزش آشپزی و مطالب جالب جدید دنبال می کنید
برچسب : نویسنده : موزیک دان ash بازدید : 85 تاريخ : پنجشنبه 31 شهريور 1401 ساعت: 11:17