Готовится ли версия ChatGPT с открытым исходным кодом? Команда разработчиков артефактов с искусственным интеллектом хочет, чтобы каждый мог создавать свои собственные большие модели.
Можно сказать, что модель с открытым исходным кодом Stable Diffusion, выпущенная Stability.ai, является одной из самых популярных и важных моделей рисования ИИ в настоящее время.
На основе Stable Diffusion с открытым исходным кодом сообщество разработчиков создало множество интересных подключаемых модулей и моделей, таких как проект Control Net, который может управлять формой графики, и более 1000 связанных проектов разработки.
Теперь эта ИИ-компания, увлеченная открытым исходным кодом, хочет сделать еще одну большую вещь — выпустить большую языковую модель с открытым исходным кодом, аналогичную ChatGPT.
У всех есть LLM
2023 год можно назвать годом прорыва для больших языковых моделей: в последние несколько месяцев новая большая языковая модель выпускалась почти каждую неделю. Большие модели, маленькие модели, генерация текста, мультимодальность, закрытый исходный код, открытый исходный код… Сейчас весна больших языковых моделей, и расцветают всевозможные школы.
Это волнение принадлежит не только интернет-компаниям, таким как Microsoft, Google, Baidu и Ali, но и всем технологическим компаниям, связанным с ИИ.
Что особенного в большой языковой модели StableLM, выпущенной Stability.ai, по сравнению с существующими большими моделями?
Согласно Stability.ai, StableLM в настоящее время является прозрачной моделью с открытым исходным кодом, которая позволяет исследователям и разработчикам свободно проверять, использовать и изменять код. Как и в случае со Stable Diffusion, пользователи могут свободно настраивать Stable LM для создания большой языковой модели, адаптированной к их потребностям.
Текущая модель версии Stable LM Alpha имеет размер параметра 3 млрд и 7 млрд. В будущем Stability.ai также предоставит версии модели с размером параметра 15 млрд и 65 млрд.
Хотя размер модели StableLM намного меньше, чем 175 миллиардов параметров модели GPT-3, Stability.ai сообщает, что StableLM основан на расширенном наборе данных, который в 3 раза больше, чем набор данных The Pile. диалоги имеют хорошую производительность.
Сам набор данных Pile уже включает в себя большое количество книг, базу знаний Github, веб-страницы, записи чатов и другие данные, а также собирает статьи по медицине, физике, математике, информатике и философии, которые можно использовать для общего большого языка. модели и генерация междисциплинарного текста.Обучение обеспечивает хорошую основу.
Поэтому в реальном использовании разрыв между StableLM и GPT-3 не так очевиден, как разница в бумажных данных параметров.
В объявлении Stability.ai продемонстрировал реальную производительность StableLM при выполнении трех разных задач, включая написание электронных писем и написание рэп-текстов (вопрос: написать эпический текст битвы, в котором взаимодействуют сеть глубокого обучения и символический искусственный интеллект. Можно только сказать это слишком гиковски) и писать код.
Stability.ai также размещает StableLM на веб-сайте сообщества HuggingFace.Друзья, которые хотят сначала испытать его, могут перейти по следующему адресу, чтобы сыграть в него.
https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat
Судя по короткому тесту, который мы провели, уровень китайского языка StableLM не так хорош, как у Guo Jierui, не говоря уже о сравнении с лучшими учениками, такими как ChatGPT, поэтому старайтесь использовать английский язык в разговоре.
Дебаты с открытым исходным кодом или закрытым исходным кодом
Как и многие большие языковые модели с открытым исходным кодом, включая Alpaca Стэнфордского университета, StableLM дает многим разработчикам возможность настраивать большие языковые модели локально или на сервере, не беспокоясь о утечке ваших данных в фон модели.
После того, как ChatGPT стал популярным, проблемы конфиденциальности данных о моделях ИИ возникали одна за другой.Не так давно Samsung также разоблачили, что несколько сотрудников слили конфиденциальные данные в ChatGPT, поэтому полупроводниковый отдел Samsung решил разработать свои собственные внутренние инструменты ИИ, чтобы избежать подобных проблем. от повторения.
В дополнение к преимуществам высокой прозрачности модель с открытым исходным кодом упрощает разработчикам использование модели с открытым исходным кодом для разработки более креативных приложений. Например, вы можете настроить StableLM, чтобы сделать его безостановочным веб-писателем, или старшим программистом или копирайтером, хорошо знакомым с проектами компании, или даже мастером гороскопов на Weibo.
Модель с открытым исходным кодом дает разработчикам больше простора для воображения, но в то же время дает злоумышленникам более продвинутые средства.
Для тех, у кого есть скрытые мотивы, модель большого языка с открытым исходным кодом может быть артефактом мошенничества в сфере телекоммуникаций.Они могут обмануть людей с помощью реалистичного диалога.
Открытый исходный код всегда будет сопровождаться противоречиями, чего Stability.ai уже давно ожидает. Stability.ai столкнулся с рядом судебных исков за якобы нарушение прав артистов на Stable Diffusion с открытым исходным кодом, а также из-за разногласий по поводу пользователей, использующих его инструменты для создания порнографического контента.
Эмад Мостак, генеральный директор Stability.ai, упомянул в предыдущем интервью, что большие модели должны получать больший контроль, а не быть запертыми в маленьком черном ящике крупными компаниями, поэтому открытость сообщества крупных моделей также очень важна. Stability.ai настаивает на открытом исходном коде, чтобы донести технологии до большего числа людей и пробудить их мышление.
StableLM — это последнее подтверждение обещания Stability.ai о том, что может начаться будущее, в котором у каждого будет своя языковая модель.
#Добро пожаловать, обратите внимание на официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), более интересный контент будет представлен вам как можно скорее.
Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo