Последняя модель OpenAI создает жизнь, похожую на изображения и читаемый текст, попробуйте бесплатно
OpenAI внедрила в ChatGPT свою модель 4o, чтобы обеспечить возможность генерации изображений в атмосфере чат-бота. Это обновление позволяет вам не использовать модель генерации изображений Dall-E OpenAI как отдельный объект, хотя Dall-E остается доступным для них в качестве предпочтения. Бренд AI также включил в ChatGPT свой видеогенератор Sora AI.
Новые функции в настоящее время доступны для бесплатных пользователей ChatGPT, а также для пользователей ChatGPT Plus , Team и Pro. Доступность станет доступна для корпоративных и образовательных пользователей на следующей неделе.
Ранее Dall-E 3 был плагином для создания изображений для платных подписчиков ChatGPT. Между тем, те, кто хотел опробовать генератор бесплатно, могли сделать это через базовый уровень Microsoft Copilot .
Модель была отмечена как один из лучших доступных генераторов изображений, особенно в платной версии. Несмотря на то, что все пользователи ChatGPT имеют возможность использовать генерацию изображений в модели 4o, те, кто использует бесплатный уровень ChatGPT, должны быть готовы столкнуться с некоторыми ограничениями, такими как максимальные значения для загрузки файлов и анализа данных, отмечает CNET .
Несмотря на это, ChatGPT выиграет от более реалистичных изображений с более разборчивым текстом после того, как OpenAI потратила год на то, чтобы GPT-4o прошел обучение после запуска под названием «обучение с подкреплением на основе отзывов людей» (RLHF), по данным Wall Street Journal .
После анонса GPT-4o в мае 2024 года у OpenAI была команда из более чем 100 «тренеров-людей», которые проверяли модель на предмет опечаток, а также распространенных ошибок в руках и лицах, рассказал изданию ведущий исследователь проекта Габриэль Го.
Модель GPT-4o также предоставит ChatGPT возможность создавать прозрачный фон. Это должно стать большим преимуществом для бизнес-пользователей и креативщиков, поскольку позволит им создавать логотипы или другую иконографию, отметил в интервью WSJ руководитель мультимодального продукта ChatGPT Джеки Шеннон.
Несмотря на улучшения, которые внес OpenAI , обновленная модель GPT-4o в целом все еще имеет свои недостатки. У него все еще есть склонность к галлюцинациям, что является общей особенностью ИИ, которую еще предстоит решить. Поддержание единообразия редактирования остается проблемой в атмосфере ChatGPT; однако OpenAI пообещала быстрые обновления уже на следующей неделе.
Еще одна актуальная проблема для OpenAI — это вопросы этики и законности. Бренд настаивает, что его модель была обучена на «общедоступных данных», а также на собственных данных, которыми он владеет благодаря партнерству с брендами, включая Shutterstock, отмечает WSJ.
Изображения, созданные с помощью ChatGPT на основе модели 4o, не будут иметь водяных знаков AI. Однако бренд заявил, что изображения будут включать метаданные C2PA, что означает, что они созданы искусственным интеллектом. Это остается отраслевым стандартом.