Новый ИИ Маска решил проблему тысячелетия, но его срочно остановили? Почему эта «шутка» не давала спать ИИ-сообществу всю ночь?

18 ноября, 2024 Дядя Влад

Подтвердил ли Грок-3 «гипотезу Римана»?

Твит, опубликованный исследователем xAI Хьеу Фамом на выходных, вызвал бурю негодования в кругах ИИ. Первоначальные слова твита были следующими:

Система искусственного интеллекта «Грок-3» только что подтвердила гипотезу Римана. Чтобы проверить правильность этого доказательства, мы решили приостановить обучение системы. Если доказательства подтвердятся, мы больше не будем продолжать его обучение, поскольку такой ИИ считается слишком умным и может представлять угрозу для человека.

По старому правилу, сначала давайте поговорим о заключении. Это всего лишь шутка.

Однако, поскольку твиты продолжали бродить, они быстро привлекли внимание и обсуждение более чем двух миллионов пользователей сети и даже распространились на круги общественного мнения ИИ в стране и за рубежом.

Происхождение этого вопроса, вероятно, восходит к более раннему «разоблачению» пользователя сети Эндрю Каррана, который утверждал, что катастрофический инцидент произошел во время тренировки Грока-3.

Впоследствии один за другим ходили всевозможные причудливые слухи.

Пользователи сети освистали, что генеральный директор OpenAI Сэм Альтман направил огромный лазер на крупнейший учебный кластер xAI, что привело к серьезному повреждению данных; некоторые также серьезно предположили, что кто-то намеренно саботировал операцию по обучению LLM следующего поколения.

Есть даже шутки о том, что ИИ, похоже, обрел самосознание и решил гипотезу Римана, но «15 точек с запятой были намеренно опущены» в коде доказательства, что сделало невозможным проверку людьми.

Даже основатель Runway Кристобаль Валенсуэла присоединился к веселью:

Gen-4 только что выиграл все «Оскары», включая «Лучший фильм». Чтобы глубже вникнуть в ее инновационные достижения в области искусства, мы решили приостановить ее обучение. Если фильм действительно настолько революционен, как утверждают ранние критики, мы не будем возобновлять обучение, потому что он показывает, что ИИ достиг такого высокого уровня художественного мастерства, что может поставить под угрозу человеческое творчество.

Слухи становились все хуже и хуже.

Многие исследователи xAI также пересылали твиты Эндрю Каррана, чтобы присоединиться к этому коллективному «большому тимбилдингу».

Например, наш старый знакомый соавтор xAI Грег Янг сначала пошутил, что Грок-3 внезапно избил пожилого охранника в офисе во время тренировки.

Другой исследователь, Генрих Каттлер, сказал: «Да, ситуация была очень плохой! Позже мы заменили все аномальные веса на нан (не число, не число), прежде чем выздороветь».

Конечно, более рациональные пользователи сети напрямую спрашивали текущую версию Грока на X о том, как она понимает гипотезу Римана. Как и ожидалось, выступление Грока было очень «Макабака».

В конце концов фарс завершил зачинщик, исследователь xAI Хиеу Фам:

Ладно, субботний вечер в прямом эфире окончен. Что касается того, почему доказывать гипотезу Римана опасно, я настоятельно рекомендую превосходный роман Мэтта Хейга (@matthaig1) «Люди».

Итак, вопрос в том, почему новость о том, что Грок-3 доказывает гипотезу Римана, привлекает всеобщее внимание? Во-первых, это важность самой гипотезы Римана.

Гипотеза Римана — важная гипотеза о распределении простых чисел в математике. Она была предложена немецким математиком Бернхардом Риманом в 1859 году. Гипотеза внесена в список исследовательских проектов Института математики Клея.

Он включает в себя дзета-функцию Римана, которая определяется как:
ζ(s)=1+12s+13s+14s+⋯zeta(s) = 1 + frac{1}{2^s} + frac{1}{3^s} + frac{1}{4 ^s} + cdotsζ(s)=1+2s1+3s1+4s1+⋯

Основное содержание гипотезы Римана таково: действительная часть нулевых точек всех нетривиальных дзета-функций Римана равна 1/2. Другими словами, если ss — нетривиальный нуль дзета-функции Римана, т. е. ζ(s)=0ζ(s)=0, то ее действительная часть должна быть ℜ(s)=1/2ℜ(s )=1/2 .

Институт математики Клея заявил, что если кто-нибудь сможет успешно доказать гипотезу Римана, он наградит премию в размере 1 миллиона долларов США. Однако эта гипотеза до сих пор не доказана и не опровергнута, и многие считают ее неразгаданной загадкой современной теории чисел.

Доказательство этой гипотезы имело далеко идущие последствия для теории чисел — раздела математики.

В настоящее время многие современные технологии шифрования (например, защита онлайн-платежей, конфиденциальность данных и т. д.) опираются на свойства простых чисел. Доказательство гипотезы Римана может позволить людям лучше понять основу этих технологий и повлиять на будущие алгоритмы безопасности.

Если Грок-3 сможет доказать гипотезу Римана, это не только будет способствовать существенному прогрессу в теоретической математике, физике, криптографии и других областях, но также ознаменует огромный прогресс в рассуждениях ИИ и решении сложных проблем.

Можно даже сказать, что это станет знаковым событием для того, чтобы искусственный интеллект превзошел человеческий интеллект.

Ян Жилин, основатель Dark Side of the Moon, однажды сказал, что математические сценарии — самые идеальные сценарии для тренировки мыслительных способностей ИИ.

Математика — чрезвычайно строгая логическая система, а рассуждения ИИ часто основаны на строгих логических выводах.

Процесс решения математических задач ИИ — это, по сути, непрерывный мыслительный процесс. В этом процессе он будет продолжать пробовать разные идеи и находить правильный ответ путем повторных проб и ошибок. Даже если при расчетах возникают ошибки, ИИ может исправить результаты путем проверки и корректуры.

Подобная концепция также отражена в обучении с подкреплением OpenAI o1.

Если предыдущие большие модели обучали данным, то o1 больше похоже на обучение мышлению. Точно так же, как когда мы решаем задачу, мы должны записывать не только ответ, но и процесс рассуждения. Можно заучить вопрос наизусть, но если научишься рассуждать, то сможешь делать выводы.

Таким образом, в тесте AIME этого года для выдающихся старшеклассников в США GPT-4o ответил только на 13% вопросов. Для сравнения, точность o1 достигает 83 процентных пунктов.

Что касается оценки научных исследований GPQA Diamond на уровне доктора философии, GPT-4o набрал 56,1%, а o1 показал еще лучшие результаты. Он не только превзошел 69,7% докторов наук, но и достиг точности 78%.

При оценке Международной олимпиады по информатике (IOI), когда для каждого вопроса было разрешено 50 попыток, модель достигла рейтинга 49%, или 213 баллов, а когда возможности подачи для каждого вопроса были увеличены до 10 000, ее финал. Оценка улучшилась до 362 очков.

Это проще понять на примере AlphaGo, которая победила чемпиона мира по Го.

AlphaGo обучается посредством обучения с подкреплением. Сначала он использует большое количество шахматных записей людей для контролируемого обучения, а затем играет в шахматы сам с собой. В каждой игре он вознаграждается или наказывается в зависимости от победы или поражения, постоянно совершенствуя свои шахматные навыки. и даже овладение методами, о которых шахматисты-люди не могут и подумать.

o1 и AlphaGo похожи, но AlphaGo может играть только в го, а o1 — это модель большого языка общего назначения.

Материалами, которые изучает o1, могут быть банки математических вопросов, высококачественные коды и т. д. Затем o1 обучается генерировать цепочку мышления для решения проблем, а в рамках механизма вознаграждения или наказания он создает и оптимизирует свою собственную цепочку мышления, чтобы постоянно улучшать свои навыки. способность рассуждать.

Это фактически объясняет, почему OpenAI подчеркивает сильные математические способности и возможности кодирования o1, потому что в нем легче проверить правильность и неправильность, а механизм обучения с подкреплением может обеспечить четкую обратную связь, тем самым улучшая производительность модели.

Конечно, более важно то, как распространить эту способность рассуждения на более широкий спектр областей.

Поэтому мы увидим, как многие зарубежные пользователи сети будут болеть за Грока-3, чтобы доказать гипотезу Римана: «Если это так, то мы действительно являемся свидетелями огромного прорыва».

Маск неоднократно публично преувеличивал мощь Grok-3. Он утверждал, что Grok-3, как ожидается, будет выпущен до конца года и станет «самым мощным ИИ в мире».

Фактически, Grok-3 — это третье поколение крупномасштабных языковых моделей, разработанное упомянутым выше AI-стартапом xAI, и, как ожидается, оно превзойдет по производительности все существующие крупные модели искусственного интеллекта.

Причина в том, что обучение Grok-3 опирается на Colossus, крупнейший в мире кластер обучения искусственному интеллекту.

Кластер состоит из 100 000 графических процессоров NVIDIA H100 с жидкостным охлаждением, использующих единую сетевую архитектуру RDMA. Масштаб этого кластера превысил масштаб любого другого суперкомпьютера в мире, и количество графических процессоров будет продолжать расти в будущем.

Согласно сообщению The Information, появление Колосса даже привлекло пристальное внимание Альтмана, который отправил самолет пролететь над тренировочной базой Колосса в попытке шпионить за ходом его разработки и энергоснабжением.

Поэтому, когда три элемента «самого мощного ИИ», «тысячелетней математической проблемы» и вечной «теории угрозы ИИ» накладываются друг на друга, образуется идеальный «шторм слухов».

Можно даже подумать, что слух о том, что Грок-3 доказал гипотезу Римана, — это не столько фарс, сколько зеркало для всей ИИ-индустрии:

Во-первых, это отражает глубоко укоренившееся отношение людей к ИИ. Многие технологические оптимисты твердо верят, что ИИ в конечном итоге станет всемогущим. Они обеспокоены тем, что он выйдет из-под контроля, если будет развиваться слишком быстро, и они также боятся этого. он не будет развиваться достаточно быстро, чтобы добиться прорыва.

Во-вторых, с момента появления GPT-4, хотя новые продукты в области ИИ продолжали появляться, реальных прорывов произошло немного.

Люди — не только создатели ИИ, но и его самая заинтересованная аудитория.

За каждым слухом об искусственном интеллекте скрываются тревога и ожидания всей отрасли.

В сочетании с недавним шумом по поводу того, что разработка закона масштабирования зашла в тупик по сравнению с прошлогодним периодом срыва, «усталость от инноваций» в этом году заставила людей потерять терпение к небольшим улучшениям модели.

В этом смысле слух о том, что Грок-3 доказал гипотезу Римана, также стал коллективным воображением людей на будущее. Даже будучи обычными пользователями, мы все больше с нетерпением ждем следующего момента качественных изменений с GPT-3.5 на GPT-4.

Конечно, настоящие прорывы в области ИИ часто происходят тогда, когда никто не испытывает к ним оптимизма.

Но мы все надеемся, что тайна будет раскрыта до конца года.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo