Илон Маск говорит, что в мире не хватает данных для обучения ИИ
Генеральный директор Tesla/X Илон Маск, похоже, считает, что обучение моделей ИИ исключительно на данных, созданных человеком, становится невозможным. Маск утверждает, что растет нехватка реальных данных для обучения моделей ИИ, включая его чат-бота Grok AI.
«Мы в основном исчерпали совокупную сумму человеческих знаний… в области обучения искусственному интеллекту», — сказал Маск во время интервью X в прямом эфире, которое провел председатель Stagwell Марк Пенн. «Это произошло практически в прошлом году».
Комментарии Маска отражают мнение бывшего исследователя OpenAI Ильи Суцкевера, который в декабре прошлого года предсказал , что индустрия ИИ достигла «пиковых показателей». Решение Маска этой проблемы — синтетические данные — также отражает ситуацию в более крупной отрасли. Google, OpenAI, Anthropic и Meta уже используют синтетические данные для обучения своих моделей.
«Единственный способ дополнить [реальные данные] — это синтетические данные, когда ИИ создает [обучающие данные]», — сказал Маск. «С синтетическими данными… [ИИ] как бы оценивает себя и проходит процесс самообучения».
Хотя использование синтетических данных может предложить компаниям значительную экономию средств, некоторые исследования показывают, что чрезмерная зависимость от синтетических данных может привести к краху модели, когда ответы ИИ со временем становятся менее творческими и более предвзятыми, поскольку они неоднократно обучаются на рекурсивно сгенерированных данных. данные.
Отсутствие данных, полученных человеком, не помешало X в четверг внедрить функцию Grok AI в собственное приложение для iOS . Чат-бот и генератор изображений, отличающиеся полным отсутствием интеллектуальной собственности или ограничений контента , раньше были доступны только тем, кто платил 8 долларов в месяц за премиум-аккаунт X. Однако новое приложение доступно для бесплатного скачивания каждому.