| Murchik пишет: |
| Если действительно хороший, то скорее всего сомнений не будет. Впрочем, кто знает до чего техника дойдет еще через несколько лет. Мне кажется, с моделями нужно экспериментировать не давая им указания что изображать, а заставить текстовую модель выдавать какой-нибудь артистический бред, и скармливать его графической модели |
А что такое "хороший рисунок"? Если реальный главный критерий в том, чтобы был узнаваемый человек в узнаваемом образе (костюм, поза), то конечно ИИ всегда будет проигрывать, потому что уже постановка задачи заведомо проигрышная. Рисунок, что я привёл, он хороший? Или плохой, и что в нём плохого тогда? Он смотрится как ИИ сгенерённый только потому, что слишком сложный для непрофессионального художника, но вдруг его рисовал профессионал? Не фанат, кто рисует известных спортсменов по фото, а кто серьёзно учится разным стилям, и просто рисует на разные темы?
Если же условия равные, "вот фотография, переложите её на рисунок", то здесь люди проиграют. Потому что тут люди добровольно отказываются от того, в чём они выигрышно отличаются от нейросетей.
Ещё раз акцентирую, что нейросетям больше 3 лет. И новой волне, новому стремительному их росту и развитию больше, тут 10-15 лет скорее. 3 года назад появились публичные LLM (большие языковые модели), их главная фишка в том, что с ними можно "общаться" на естественном языке. Другие нейросети так не могут, с ними надо быть немного инженером. чтобы получить результат. LLM пока плохо умеют выходить за рамки тексового домена.
Нейросети умеют находить закономерности и воспроизводить их. Графические сети, им на вход дают массу изображений, они находят в них закономерности по стилю, штрихам, манере рисовать, и после они могут перерисовать другую картинку в этом стиле. Но это совсем другой домен, чем слова. Они не в состоянии связывать изображение и слова, равно как они не понимают свойства физического мира, связывать изображение и что-то материальное (они вообще не понимают, что такое материальное). Хотя развитие в этом направлении идёт, но текущие массово доступные варианты пока слабоваты.