Инсайдерское разоблачение команды Apple Siri: борьба, борьба, реорганизация
Microsoft инвестировала в OpenAI и запустила новый Bing, Google запустила Bard, Adobe запустила FireFly, Amazon запустила Amazon Titan, а с ростом популярности ChatGPT инструменты или помощники AI от крупных компаний Силиконовой долины мгновенно вырвались наружу.
▲ Функция второго пилота Github
Только Apple, расположенная в уголке Калифорнии, кажется внешнему миру миром, не потревоженным ИИ.
тишина
Пережив сумасшедший марш ИИ, крупные и малые компании одна за другой выходят на поле AIGC, все они помечают бета-тестовую версию и должны пройти этап листа ожидания.
Они могут оказаться неправы, могут не ответить на вопрос и даже вызвать пик общественного мнения, но Силиконовой долине и нам все равно нравится в этом участвовать.
Условно говоря, Apple всегда хранила молчание об AIGC, и ни руководители, ни сотрудники не выражали истинного мнения Apple по этому поводу.
Apple всегда уделяла большое внимание поддержанию собственного имиджа и бренда компании, и они редко анонсируют незрелые продукты или технологии внешнему миру.
Следовательно, это также объясняет, почему Apple всегда медленнее других компаний в отношении новых технологий.
Apple изо всех сил старается избегать неприемлемых явлений при применении новых технологий к продуктам.
В настоящее время большинство продуктов в индустрии AIGC по-прежнему вращаются вокруг диалоговых окон веб-страниц, а приложение-убийца все еще находится в стадии разработки.
Apple, ориентированной на продукты, имеет смысл не комментировать.
Однако, согласно информации, полученной из информации, инженеры Apple планируют объединить модель большого языка LLM с Siri, чтобы запустить более умную Siri, которая, естественно, будет применена к iOS следующего года.
Как и в 2011 году, Apple впервые анонсировала умного помощника Siri, и он вышел на рынок вместе с iPhone 4s, став крупным функциональным обновлением iPhone того года.
Высокий профиль
Если судить с текущей точки зрения, Apple добавила в чип нейронный движок, назвав чип SoC «бионическим», и применив различные модели и алгоритмы искусственного интеллекта к фотографии, биометрии, письму и т. д.
Людям часто трудно заметить большую оптимизацию и улучшение пользовательского опыта, Apple использует ИИ довольно сдержанно.
Но в 2011 году Siri была представлена как самая громкая технология искусственного интеллекта Apple.
▲ Скотт Форстолл
До сих пор я помню, что, когда Скотт Форстолл представлял Siri, он сказал, что Siri может понимать естественный язык, не требует от пользователей запоминания определенных форматов и грамматик, а также может быть настроена в соответствии с привычками пользователя.
В последующем рекламном ролике Siri действительно превратилась в встроенного в мобильный телефон помощника, который всегда правильно реагирует, достаточно умный и человечный.
Просто техническая итерация Siri, похоже, застопорилась после 2011 года. Спустя более десяти лет он все еще следует «наивному» ответу 2011 года.
Когда люди постоянно освежаются более продвинутыми голосовыми помощниками других компаний, Siri кажется немного неуклюжей и слишком милой.
В частности, Siri теперь охватывает почти все устройства Apple, включая iPhone, iPad, Mac и даже AirPods, а немного старомодные методы обработки и ответа Siri делают его еще более устаревшим.
Даже Apple разочарована Siri внутри компании: команда разработчиков Apple XR не хочет использовать Siri для управления устройствами и функциями на XR-устройствах, потому что она недостаточно умна.
С этой целью Майк Роквелл, ответственный за оборудование XR, также рассматривал возможность поиска альтернативы голосовому управлению Siri, но в конечном итоге потерпел неудачу.
По слухам, гарнитура Apple XR по-прежнему будет похожа на другие устройства Apple, с простым управлением с помощью Siri и, конечно же, простым разговором с ней, если хотите.
карабкаться
Выпуск Siri считается поворотным моментом в истории смартфонов. После Siri практически все производители смартфонов запустят аналогичный умный помощник для своих продуктов, чтобы не отставать.
Что касается Apple, то в 2010 году она потратила 200 миллионов долларов на приобретение Siri Inc., а год спустя интегрировала Siri в iPhone.
После этого Apple также сформировала команду умных помощников Siri.Однако с 2011 по 2018 год команда Siri пришла в замешательство, и возникли некоторые споры о внутреннем управлении и общем направлении.
▲ Джон Джаннандреа
Решение Apple состоит в том, чтобы «пригласить эксперта».
До этого он отвечал за поисковый бизнес и искусственный интеллект в Google, и его можно считать старшим экспертом в области искусственного интеллекта Google.
С приходом Джона Джаннандреа Apple хочет положиться на его опыт, чтобы постепенно улучшить статус-кво Siri и помочь Siri догнать конкурентов.
Джон Джаннандреа также привнес в команду Siri рабочую атмосферу, похожую на Google, и когда руководителям Apple требовались немедленные изменения в Siri, он использовал процесс «взбирания на гору», чтобы объяснить, как решить проблемы, с которыми сталкивается область искусственного ИИ. интеллект.
Для Siri, или стратегии искусственного интеллекта Apple, должна быть долгосрочная цель, в ходе которой каждая маленькая оптимизация и изменение будут постепенно накапливаться с течением времени, и она не должна быть неаккуратной.
Другими словами, Джон Джаннандреа считает, что фундамент Apple в области искусственного интеллекта слишком слаб, чтобы спешить.
Более того, он также убедил высшее руководство Apple в том, что на данный момент им следует сосредоточиться на построении команды, сохранении соответствующих талантов и предоставлении им большей свободы для исследований и развития собственных интересных направлений.
Самое главное, Джон Джаннандреа значительно повысил уровень заработной платы команды искусственного интеллекта до отраслевых стандартов.
После трех уловок команда Apple по искусственному интеллекту была усилена, многие бывшие эксперты Google по искусственному интеллекту были представлены, а стартап по машинному обучению Laserlike был приобретен за 150 миллионов долларов.
Три его основателя, Шринивасан Венкатачари, Стивен Бейкер и Ананд Шукла, позже стали командой Siri, экспертами Apple в области LLM и области поиска.
Цель внедрения Laserlike на самом деле состоит в том, чтобы улучшить поисковые возможности Siri, и Венкатачари, естественно, стал главой поисковой группы Apple.
В 2019 году Apple добавила в Siri возможность отвечать на вопросы пользователей через сетевую информацию. Функционал Siri постепенно дополняется и расширяется.
Однако эти изменения больше похожи на «вспышку на сковородке».
В команде искусственного интеллекта Apple есть несколько проектов, в том числе проект BlackBird, который может портировать Siri на iPhone, и SiriX, проект, посвященный десятой годовщине Siri.
Однако, помимо внутренней конкуренции, топ-менеджеры Apple слишком медленно принимают решения об общем направлении развития искусственного интеллекта и слишком консервативны в использовании новых технологий, таких как LLM.
▲ От А к другому А Изображение от: информация
Осенью 2022 года Шринивасан Венкатачари, Стивен Бейкер и Ананд Шукла также ушли из Apple в Google.
Интересно, что генеральный директор Google Сундар Пичаи лично набрал команду из трех человек, и Тим Кук также сохранил ее.
Но они думают, что Google — компания, подходящая для исследования LLM, и ее быстро приложат к продуктам.
Сейчас в Google изучают, как снизить стоимость обучения больших языковых моделей и как повысить точность.
Apple покинула не только команда Laserlike, но и большинство других экспертов и команд, нанятых Джаннандреа, по причине того, что Apple, похоже, не уделяет особого внимания исследованиям искусственного интеллекта.
После прихода Джона Джаннандреа в процессе восхождения на гору в области искусственного интеллекта, возможно, это отличалось от общего стратегического направления компании, из-за чего искусственному интеллекту Apple пришлось бороться.
борьба
Защита конфиденциальности — это стратегия на уровне компании, которой недавно следовала Apple.
Перед лицом этого все должно быть скомпрометировано и никогда не скомпрометировано.
Джон Джаннандреа присоединился к Apple с четкой целью сделать Siri умнее за счет оптимизации использования Apple пользовательских данных и алгоритмов обучения.
Потому что в таких компаниях, как Google и Amazon, сбор и анализ пользовательских данных для улучшения моделей алгоритмов продукта — обычное дело.
Также благодаря этому процессу алгоритм станет умнее, а ИИ станет умнее.
Ранее Apple собирала данные разговоров между Siri и пользователями, не запоминая идентификатор, но делала это непрофессионально и не использовала эти данные для улучшения Siri.
С приходом Джона Джаннандреа Apple нашла множество аутсорсинговых компаний для сбора соответствующих данных и, наконец, оптимизировала Siri с помощью процесса.
Но в 2019 году The Guardian сообщила, что аутсорсинговая команда Apple прослушивала разговоры между пользователями и Siri без согласия, что вызвало бурю негодования, особенно для Apple, которая всегда уделяла особое внимание конфиденциальности.
С этой целью Apple в конечном итоге заменила аутсорсеров штатными сотрудниками и изменила внутренние процессы и политики, чтобы обычные сотрудники почти не могли слышать записи разговоров Siri.
Такие правила также затрудняют для команды искусственного интеллекта оптимизацию в реальном времени и своевременную итерацию, и это также является одной из причин, почему Siri в настоящее время выглядит очень классически.
«Недостатки того, что они делают, будут становиться все более и более очевидными», — сказал Педро Домингос, профессор компьютерных наук Вашингтонского университета и автор книги по машинному обучению «Главный алгоритм (The Master Algorithm)». данные, чтобы быть более конкурентоспособными с другими».
▲ Тим Кук Фото из: Bloomberg
А на некоторые странные ответы Сири, которые часто бросаются в горячие поиски, это еще и привлечет внимание Тима Кука. Часто пропускает процесс и напрямую просит команду Siri изменить «неудобные» ответы.
Чтобы уменьшить сбор данных из-за защиты конфиденциальности, избежать неловких ответов и вносить исправления вручную, Apple придает большое значение своему корпоративному имиджу.
Поэтому, несмотря на то, что у Apple сейчас огромные средства и ресурсы, многие бывшие члены команды искусственного интеллекта Apple считают, что Apple будет сложно развернуть Siri на основе LLM в ближайшее время.
Кроме того, Apple также установила множество правил в Siri, например, спрашивая о цене iPhone, она будет отдавать приоритет перенаправлению на официальный сайт Apple вместо того, чтобы давать прямой ответ.
Apple не технологическая компания, все их услуги и технологии служат продуктам, то есть они могут продавать больше iPhone, iPad и Mac.
Поэтому уже долгое время команда дизайнеров имеет большое право голоса, и они считают, что продукт должен быть на 100% идеальным.
Это стремление также продолжилось командой искусственного интеллекта Siri, но как алгоритм невозможно быть точным на 100%, и ошибки неизбежны.Только совершая ошибки, мы можем лучше оптимизировать связанные модели.
Различные занятия между ними также делают работу команды искусственного интеллекта очень напряженной. По настоянию Джаннандреа команда разработчиков программного обеспечения должна была добавить к Siri кнопку, позволяющую пользователям сообщать, был ли ответ точным.
Будь то необходимость настаивать на конфиденциальности, проблемах рабочего процесса или создании на 100 % идеального продукта, команда Siri, занимающаяся искусственным интеллектом, сталкивается с целым рядом трудностей, как если бы она была связана по рукам с крупными компаниями, такими как Google и Amazon. искусственного интеллекта.
неизвестный
Это «неизвестное» может относиться ко многим вещам.
Команда искусственного интеллекта Apple представила множество улучшений для Siri, таких как Siri X, BlackBird, Pegasus и другие проекты.
Хотя некоторые участники проекта ушли, эти проекты, наконец, близки к завершению и могут быть заменены или оптимизированы под текущую Siri в любое время.
Однако, как утверждает Джон Джаннандреа, модель искусственного интеллекта на самом деле является довольно сложным проектом, который затрагивает все тело.
Слепая модификация и замена могут вызвать непредсказуемые проблемы.
Кроме того, по сравнению с другими голосовыми помощниками, такими как Alexa от Amazon или Google Assistant, ответы Siri в значительной степени зависят от участия человека.
Другими словами, база данных Siri имеет множество ограничений и вмешательств со стороны человека.После более чем десяти лет модификации и настройки база данных стала сложной и длинной.
Кроме того, он также отличается от метода работы с базой данных в текущей модели большого языка LLM: он не может просто добавить интерфейс API для плавного запуска ChatGPT и иметь аналогичные функции.
Что Apple должна решить сейчас, так это то, хочет ли она Smart Siri, свергнуть ли ее и начать все сначала или оптимизировать ее слой за слоем.
Кроме того, никто не отрицает рентабельность Apple, денежные потоки и огромные возможности мобилизации ресурсов. Кроме того, существуют также аппаратные ресурсы и резервы знаний, такие как микросхемы и терминалы.
Когда Apple полна решимости посвятить себя области AIGC, она может обучать сложные большие языковые модели и создавать собственный генеративный ИИ.
Но Apple должна решить, нужно ли ей «изобретать велосипед» или инвестировать свое видение и ресурсы в то, как применить AIGC к терминалу и внедрить его в экологию.
В конце концов, те LLM, которые поддерживают сложные сервисы, такие как ChatGPT, все еще работают в облаке, и их по-прежнему нельзя применить к экосистеме терминалов.
С точки зрения перевода персонала Apple в настоящее время больше фокусируется на специалистах по визуальному распознаванию, а также на области, подходящей для виртуальной реальности XR.
Для Apple технологический взрыв в отрасли AIGC произошел меньше года назад, и то, как применить его к продуктам Apple, все еще является очень предварительной попыткой.
И Apple готовилась много лет, намереваясь заменить iPhone в качестве следующего большого тренда оборудования виртуальной реальности XR, возможно, это тот продукт, о котором Apple должна заботиться больше всего и сосредоточиться на разработке.
Что касается превращения Siri в Smart Siri или Siri Copilot, то пусть команда ИИ во главе с Джоном Джаннандреа пока взбирается на гору.
#Добро пожаловать, обратите внимание на официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), более интересный контент будет представлен вам как можно скорее.
Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo