Последняя модель OpenAI создает жизнь, похожую на изображения и читаемый текст, попробуйте бесплатно

OpenAI внедрила в ChatGPT свою модель 4o, чтобы обеспечить возможность генерации изображений в атмосфере чат-бота. Это обновление позволяет вам не использовать модель генерации изображений Dall-E OpenAI как отдельный объект, хотя Dall-E остается доступным для них в качестве предпочтения. Бренд AI также включил в ChatGPT свой видеогенератор Sora AI.

Новые функции в настоящее время доступны для бесплатных пользователей ChatGPT, а также для пользователей ChatGPT Plus , Team и Pro. Доступность станет доступна для корпоративных и образовательных пользователей на следующей неделе.

Изображение, сгенерированное OpenAI — откровенная фотография Карла Маркса в стиле папарацци, торопливо идущего по парковке торгового центра Mall of America. Изображение, сгенерированное OpenAI. Реалистичная фотография лошади, скачущей справа налево по огромной спокойной поверхности океана. OpenAI сгенерировал изображение — фотореалистичное изображение фермерского рынка в Торонто в субботу летом 2006 года.

Ранее Dall-E 3 был плагином для создания изображений для платных подписчиков ChatGPT. Между тем, те, кто хотел опробовать генератор бесплатно, могли сделать это через базовый уровень Microsoft Copilot .

Модель была отмечена как один из лучших доступных генераторов изображений, особенно в платной версии. Несмотря на то, что все пользователи ChatGPT имеют возможность использовать генерацию изображений в модели 4o, те, кто использует бесплатный уровень ChatGPT, должны быть готовы столкнуться с некоторыми ограничениями, такими как максимальные значения для загрузки файлов и анализа данных, отмечает CNET .

Несмотря на это, ChatGPT выиграет от более реалистичных изображений с более разборчивым текстом после того, как OpenAI потратила год на то, чтобы GPT-4o прошел обучение после запуска под названием «обучение с подкреплением на основе отзывов людей» (RLHF), по данным Wall Street Journal .

После анонса GPT-4o в мае 2024 года у OpenAI была команда из более чем 100 «тренеров-людей», которые проверяли модель на предмет опечаток, а также распространенных ошибок в руках и лицах, рассказал изданию ведущий исследователь проекта Габриэль Го.

Модель GPT-4o также предоставит ChatGPT возможность создавать прозрачный фон. Это должно стать большим преимуществом для бизнес-пользователей и креативщиков, поскольку позволит им создавать логотипы или другую иконографию, отметил в интервью WSJ руководитель мультимодального продукта ChatGPT Джеки Шеннон.

Несмотря на улучшения, которые внес OpenAI , обновленная модель GPT-4o в целом все еще имеет свои недостатки. У него все еще есть склонность к галлюцинациям, что является общей особенностью ИИ, которую еще предстоит решить. Поддержание единообразия редактирования остается проблемой в атмосфере ChatGPT; однако OpenAI пообещала быстрые обновления уже на следующей неделе.

Еще одна актуальная проблема для OpenAI — это вопросы этики и законности. Бренд настаивает, что его модель была обучена на «общедоступных данных», а также на собственных данных, которыми он владеет благодаря партнерству с брендами, включая Shutterstock, отмечает WSJ.

Изображения, созданные с помощью ChatGPT на основе модели 4o, не будут иметь водяных знаков AI. Однако бренд заявил, что изображения будут включать метаданные C2PA⁠, что означает, что они созданы искусственным интеллектом. Это остается отраслевым стандартом.