Компанія Midjourney анонсувала нову модель ШІ-інструменту для створення зображень, яка отримала можливість генерувати осмислений текст.
We're now alpha-testing our V6 models Midjourney. Just type /settings and click V6 or add –v 6 after your prompt. Image coherence and prompt understanding are greatly improved. You can draw text and dolphins and there's new upscalers too. Happy holidays everyone!
— Midjourney (@midjourney) December 21, 2023
Згідно з повідомленням у Discord-каналі, Midjourney V6 позиціюється як «капітальний ремонт» і в рази перевершує попередника, випущеного в березні цього року.
«Точніше дотримання рекомендацій, а також довгі підказки, поліпшена зв’язність і знання моделі», — описали нову версію нейромережі розробники.
Одним із найважливіших компонентів V6 є можливість генерації осмисленого тексту, а не набору символів, як це було раніше. Однак розробники зазначили, що це не основний елемент моделі.
Завдяки поліпшенням Midjourney тепер може скласти конкуренцію провідним генеративним моделям на кшталт DALL-E 3 та Ideogram.
Порівняння генеративних ШІ-моделей. Джерело: Decrypt.
Через нові можливості шоста версія ШІ стала трохи повільнішою і дорожчою, але розробники пообіцяли попрацювати над її продуктивністю в майбутньому.
Midjourney V6, навчена з нуля на суперкластерах ШІ, також може похвалитися поліпшеними модулями масштабування в «тонкому» і «творчому» режимах, що підвищують роздільну здатність зображення вдвічі.
Альфа-версія нейромережі підтримує кілька нових аргументів, зокрема «-ar» для зміни роздільної здатності, «-chaos» для вибору варіацій генерації зображень, «-stylize» для зміни творчого стилю (що меншим є значення, то швидше нейромережа видасть результат, жертвуючи деталізацією).
«Вам доведеться заново навчитися підказувати», — попередила команда проєкту.
Інші функції на кшталт зуму і панорамування з’являться під час релізу моделі.
Поки що взяти участь у тестування Midjourney V6 можна на Discord-сервері, надсилаючи бажаний запит у чат.
«Команда проєкту ввімкнула системи модерації та забезпечуватиме дотримання стандартів нашої спільноти з підвищеною суворістю. Не будьте придурками та не створюйте образи, які провокують драму», — підкреслили розробники.
Користувачі вже почали ділиться отриманими результатами.
Midjourney V6 …. We have TEXT!
It can be hit or miss but still learning how it works.
These 4 were all from one generation.
Maybe got lucky 🤷♂️
Prompt in image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489— Orcton (@OrctonAI) December 21, 2023
Більшість відзначає високий ступінь деталізації у створених зображень навіть без апскейла.
Midjourney V6 is looking mighty tasty!
Huge increase in detail at the same resolution.
These are NOT final model images and are not upscaled.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC— GifCo (@giffboake) December 20, 2023
Для демонстрації можливостей Midjourney один із користувачів попросив згенерувати «92-річного зморшкуватого злого старого в студійному світлі».
Midjourney v1 until v6, same prompt"
white background, closeup portrait of a very old mean man, 92 years old, wrinkles, realistic skin, studio lighting,, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3
— Marco Nedermeijer (@MNedermeijer) December 21, 2023
Раніше Google представила глобальне оновлення для чат-бота Bard, яке покликане розширити можливості нейромережі. Апдейт отримав назву Gemini.
Нагадаємо, у листопаді ШІ-стартап Anthropic анонсував нову модель Claude 2.1 зі збільшеним контекстним вікном на 200 000 токенів, еквівалентним 500 сторінкам тексту.