В областта на генерирането на изображения с помощта на изкуствен интелект OpenAI продължава да представя напредък, който изглежда прекрачва границата на възможното. Доказателството е представянето през същия месец септември на DALL-E3, нов алгоритъм, който представлява истинска революция в света на генерирането на текст към изображение.
DALL-E3 е модел, който е базиран на DALL-E 2 и ChatGPT, но преди всичко се откроява в задачата на "превежда" текстови описания в изображения, с голямо ниво на детайлност и прецизност. Резултатите, с оглед на изображенията, които са изтекли до момента (включваме някои от тях в тази статия), са просто впечатляващи.
Този мощен AI модел Все още е в ранен етап на развитие и изследване.. Но това, което се знае до момента, със сигурност буди ентусиазъм. Това е обявяването на бъдещето на технологията за генериране на изображения, сценарий, който изглежда няма граници и който несъмнено ще ни остави без думи много пъти.
Все още има много подробности за разкриване на DALL-E 3, но с това, което вече е известно, можем да направим малка презентация на това, което този инструмент може да ни предложи:
Какво е генериране на текст към изображение?
Това е една от областите, в които влиянието на изкуствения интелект върху живота ни е най-очевидно. Модели като DALL-E 3 създават невронни мрежи, за да трансформират текстове в ярки, изключително реалистични изображения.
Тези модели разберете и интерпретирайте нашето писане, улавяйки сложни детайли, цветове и контексти, за да генерирате удивителни визуални представяния. Има множество приложения за този нов начин за генериране на изображения: изкуство, дизайн, създаване на съдържание... Мощен инструмент за вдъхване на творчески идеи.
Нов начин за генериране на изображения от текст
DALL-E 3 е специално проектиран да предефинира начина, по който генерирате изображения от текст. Решенията, представени досега, често не успяват, тъй като пренебрегват определени думи или изрази. С други думи: само тези потребители, които са експерти в езика за бързо инженерство, могат да се възползват от него.
Напротив, DALL-E 3 представлява радикална промяна. Напредък, който означава, че всеки потребител може да използва тази технология и постигане на невероятни резултати, без усложнения.
Перфектно интегриран с ChatGPT, DALL-E 3 се превръща в креативен и отзивчив партньор към нашите изисквания. Всичко, което трябва да направим, е да му предадем нашите идеи чрез думи и описания, оставяйки алгоритъма да свърши останалата работа: дават живот на нашите мисли, генерирайки персонализирани изображения с голямо визуално въздействие.
повече прецизност
В предишната версия на DALL-E възникнаха същите проблеми, както в останалите модели с генеративен изкуствен интелект. Начинът за тълкуване на сложни текстови съобщения не винаги е правилен. Понякога концепциите дори се смесват при генерирането на изображения, което води до абсурдни или гротескни резултати.
Но за разлика от своите предшественици, DALL-E 3 е проектиран да разбира текстови подкани със забележителна степен на точност, улавяйки нюанси и детайли както никога досега.
Етични въпроси и прозрачност
Етичният дебат около изображенията, генерирани от изкуствения интелект, вече е в устата на много хора, не само на експерти. За избягвайте генерирането на изображения с насилствено, порнографско съдържание или които могат да подбуждат към омраза, DALL-E 3 включва определени мерки за сигурност, които ограничават някои аспекти на генерирането на съдържание. Освен това има филтър, който предотвратява генерирането на изображения на публични личности, като по този начин защитава тяхната поверителност и се бори с тази форма на фалшиви новини.
Друга грижа на отговорните за DALL-E 3 е да бъдат възможно най-прозрачни с потребителите по отношение на „реалността“ на техните изображения. Не може да бъде иначе, тъй като съдържанието, генерирано от изкуствен интелект, става все по-често в интернет, то расте необходимостта да бъдете възможно най-прозрачни при идентифицирането на споменатото съдържание. Отново, намерението е да се избегнат измама и недоразумения, като се полагат основите за отговорно използване на тази нова технология. Това ако не е химера.
Поради тази причина OpenAI активно проучва нови начини да помогне на хората да разграничат генерираните от AI изображения от тези, създадени от хора. Сега се тества вътрешен инструмент, който вече е наименуван "класификатор на произхода". На теория, благодарение на този инструмент ще бъде възможно да се определи дали дадено изображение е генерирано от DALL-E 3 и следователно не е истинско изображение.
Дата на издаване
Ако всичко върви по план, DALL-E 3 ще бъде представен на публиката през октомври 2023 г. Първите, които ще имат възможност да видят как работи новият алгоритъм, ще бъдат потребителите на ChatGPT Plus и ChatGPT Enterprise. OpenAI възнамерява да внедри DALL-E 3 в поетапен модел, тоест дозиране на неговите функционалности, въпреки че все още не е потвърдила конкретна дата за публично и безплатно стартиране.