OpenAI представила новую модель ChatGPT Images 2.0, способную генерировать изображения в разрешении 2K с корректным текстом и сложной графикой. Главным обновлением стал режим «размышления», в котором нейросеть анализирует данные из интернета перед отрисовкой, чтобы точнее передавать актуальные события и детализированные инструкции.
Обновление Images 2.0 фокусируется на точности мелких деталей, которые раньше были слабым местом генеративных моделей. Теперь ChatGPT справляется с отрисовкой иконок, плакатов и даже комиксов, поддерживая не только латиницу, но и сложные восточные шрифты — от японских иероглифов до бенгальской вязи. Руководитель продуктовой команды Адель Ли рассчитывает, что инструмент станет востребован в науке и образовании, где критически важна четкость схем и сопроводительного текста.Для платных подписчиков стал доступен режим thinking, в котором нейросеть создает до восьми вариантов изображения за раз. Если запрос касается недавних новостей, модель сначала ищет информацию в сети, используя найденные кадры как референсы. Это позволяет избежать «галлюцинаций» при визуализации событий, которые произошли после завершения обучения базовой версии алгоритма. Так нейросеть может подготовить страницу комикса или эскиз интерьера, опираясь на актуальные визуальные тренды.
Комментарии (0)
Пока нет комментариев. Будьте первым!