Почему это самое большое обновление iOS в этом году?
Хотя восприятие потребителями мобильных телефонов с искусственным интеллектом и AIPC в основном находится на концептуальной стадии, когда Apple сделает громкое заявление о своем присоединении к ним, вся отрасль и потребители также возлагают большие надежды.
Как и Vision Pro, представленный на WWDC в прошлом году, индустрия головных дисплеев с нетерпением ждет, когда Apple завершит обучение рынку и откроет новую ситуацию. Для оборудования искусственного интеллекта, которое до сих пор вызывает споры, положительное значение гигантского объединения может значительно перевесить угрозу конкуренции.
Репортер Bloomberg Марк Гурман ранее сообщил, что Apple интенсивно разрабатывает ряд функций искусственного интеллекта и планирует интегрировать их в операционную систему iOS 18.
Судя по тому, насколько молчаливой была Apple в прошлом, даже если и ходят слухи из внешнего мира, конкретные идеи Apple по решению проблем ИИ часто не дорабатываются до последнего момента пресс-конференции. Однако это не мешает нам получить некоторые подсказки из недавних разработок Apple.
Недавно компания Apple выпустила большую модельную статью, продемонстрировавшую внешнему миру последние достижения Apple в области искусственного интеллекта.
Благодаря применению технологии ReALM Siri теперь может понимать и идентифицировать контент на экране пользователя в режиме реального времени, не полагаясь на конфиденциальные снимки экрана или данные изображений.Повышая интеллектуальность, она также полностью защищает конфиденциальность и безопасность пользователя.
Представьте себе сценарий, в котором, когда вы даете команду «Открыть первое приложение на моем экране», Siri может использовать технологию ReALM для преобразования элементов и макета на экране в текстовую информацию и соответствующим образом выполнить команду пользователя.
Короче говоря, Siri на вашем телефоне станет умнее и лучше вас поймет.
13-летний путь Siri к «умности»
Siri уже тринадцать лет находится на пути к тому, чтобы стать «умной».
Тринадцать лет назад вы были бы поражены новизной Siri, используя ее для установки будильников и проверки погоды на день, как будто вам приближается новая эра взаимодействия человека и компьютера.
Тринадцать лет спустя вы все еще пользуетесь им, чтобы поставить будильник и узнать погоду на день, но на смену оригинальной новинке пришло разочарование, как и родители, которые надеются, что их дети добьются успеха, но ненавидят, что железа недостаточно.
2024: ИИ заменяет программистов/художников и т. д.
Сири в 2024 году: Извините, я вас не поняла
Даже самый преданный поклонник Siri, сам Стив Джобс, никогда не ожидал, что Siri отсутствует половину своей жизни и вернется подростком. Многие люди могут не знать, что, как и iTunes, Siri на самом деле была куплена Apple за реальные деньги.
В начале 2010 года Джобс позвонил Дагу Киттлаусу, «отцу Siri». После трехчасовой встречи, благодаря усилиям Джобса, в апреле того же года Siri была принята на работу в Apple. С тех пор Siri проникла в тысячи домов через «Семейное ведро» Apple и стала неизгладимым и знаковым символом в истории бренда Apple.
Подобно тому, как популярный «Фруктовый ниндзя» постепенно познакомил людей с сенсорным экраном, популярность Siri привела не только к новому способу взаимодействия, но и к изменению жизненных привычек. Люди привыкают использовать естественный язык для общения с машинами и использовать голосовые команды для упрощения повседневных задач.
Голосовое управление — это всего лишь изменение формы взаимодействия.В 2011 году у Apple были огромные амбиции и ожидания по поводу запуска Siri.
Apple рассматривает Siri не просто как простого голосового помощника, но и как умного партнера, который может понимать потребности пользователей и решать проблемы с помощью. Как описал это директор по маркетингу Apple Фил Шиллер, когда была запущена Siri:
Умный помощник, который поможет вам добиться цели с помощью голосовых команд.
Это уже было отражено в оригинальной версии Siri до того, как она была приобретена Apple.
По замыслу Дага Киттлауса и других, Siri должна быть помощником, способным быстро и точно получать информацию, и умным помощником, способным умело решать различные сложные задачи.
Ранняя версия Siri могла подключаться к 42 сетевым службам, охватывающим самые разные области: от обзоров ресторанов на Yelp до обзоров фильмов на Rotten Tomatoes и математических расчетов на Wolfram Alpha.
Интегрируя информацию с этих веб-сайтов, Siri может предоставить пользователям единый сервис в виде текста.
Соучредитель Siri Норман Винарски однажды подчеркнул, что первоначальная цель Siri заключалась в том, чтобы понять намерения пользователя, дать точные ответы и выполнить эти задачи от имени пользователя. Во время выполнения Siri собирает данные для предоставления более точных услуг в будущем.
Нам нужен не поисковик, а do-движок. Это наш творческий прорыв.
Этот продукт может взаимодействовать с вами как с реальным человеком.Мы называем это «антропоморфизмом», как с дружелюбным и заботливым помощником.
После прихода к власти Apple Siri действительно уверенно продвигалась вперед по траектории развития умных помощников. Он может не только беспрепятственно отвечать на запросы пользователей, но и выполнять ряд повседневных задач посредством голосового взаимодействия, таких как установка будильников, отправка сообщений, проверка погоды и т. д.
В пятом сезоне «Теории большого взрыва» Радж, учёный индийского происхождения, с первого взгляда влюбился в Siri на iPhone 4S. Эта односторонняя «любовь» также основана на базовой способности понимать язык, продемонстрированной Сири и Раджем в простом общении.
Поэтому, когда Siri вышла, зарубежные технологические СМИ также в подавляющем большинстве хвалили ее.
The Verge однажды подчеркнула, что самое лучшее в Siri — это то, как она работает — по крайней мере, во многих сценариях ее уровень превосходит ожидания пользователей. CNN ярко сравнил Siri с «умным помощником нашей мечты», который всегда доступен, когда вы к нему обращаетесь. Газета New York Times также высоко оценила это, отметив, что Siri глубоко изменила представление о мобильных телефонах, сэкономив время и сократив количество избыточных операций.
Темп истории не всегда движется в соответствии с заранее заданным ритмом. Иногда мы не можем найти ритм прогресса, даже если мы ходим по кругу.
Точно так же, как вы просите Siri пойти на восток, но она иногда идет на запад, новинка представляет собой «радость с первого взгляда» для Siri, но застой также создает пользователю «скуку через долгое время».
На следующий день после дебюта Siri от Apple Стив Джобс, к сожалению, скончался от рака, бросив тень на развитие Siri, которую было трудно развеять. Бывший сотрудник Apple не мог не вздохнуть в интервью The Information:
Джобс умер на следующий день после запуска Siri, и Apple заблудилась.
Кроме того, на плавное развитие Siri также оказали значительное влияние частые смены в составе исполнительной команды Apple и внутренние фракционные бои внутри компании.В предыдущих статьях APPSO также анализировала причины, по которым Siri стала «тупой». (https://mp.weixin.qq.com/s/7oDXkASTZgGIjKJaFWPLkQ)
Под воздействием внутренних и внешних факторов темпы разработки Siri, которые были на пике в момент дебюта, постепенно замедлились, и она постепенно превратилась в «тупого ученика» из «академического мастера» в прошлом.
Конечная точка «умности» Siri также является отправной точкой.
Я слышал, что Siri от Apple «регрессировала»? И такая хорошая вещь!
Мгновенная популярность ChatGPT продемонстрировала миру выдающуюся производительность больших языковых моделей (LLM) в области понимания языка, генерации, взаимодействия и рассуждения. Это также дало Siri возможность вернуться к исходной точке — стать интеллектом, который может по-настоящему понимать и реагировать на естественный язык.
Не так давно Киттаус, «отец Siri», также поделился своим видением ИИ Siri на X и перечислил ряд сценариев применения.
Сири, можешь ли ты предупредить меня, когда Крис Малинчак выпустит новую песню, и попросить Spotify добавить ее в мою папку Chill Beats?
Сири, пожалуйста, буди меня в 7 утра по вторникам и четвергам и в 8 утра в остальные будние дни. Не беспокойте меня по выходным, если только вы не увидите утреннюю встречу в моем календаре; если у вас назначена утренняя встреча, пожалуйста, разбудите меня как можно скорее.
В 2024 году Apple будет тренировать мускулы в области генеративного искусственного интеллекта, и Siri может стать наиболее важным носителем взаимодействия.
На предыдущем заседании по финансовому отчету генеральный директор Apple Кук неожиданно сообщил внешнему миру, что компания «совершит прорыв» в области генеративного ИИ в 2024 году, и даже неоднократно подчеркивал, что Apple объявит о планах по созданию генеративного ИИ позднее в этом году. . Важная новость.
По сравнению с новостью о том, что мечта Apple о создании автомобиля рухнула через десять лет, еще более примечательно то, что некоторые сотрудники Apple, которые изначально отвечали за проект по производству автомобилей, будут переведены на исследования и разработки генеративных технологий. ИИ-проекты.
Apple также вкладывает значительные средства в генеративный искусственный интеллект. Являясь самой дорогой компанией в мире, Apple с ее глубокими карманами фокусируется на покупке и продаже, а также ускоряет накопление технологий и темпы инноваций посредством приобретений.
Согласно последнему отчету, опубликованному исследовательской фирмой Stocklytics, в 2023 году Apple приобрела 32 компании, занимающиеся искусственным интеллектом, заняв первое место в списке приобретений крупных технологических компаний.
В то же время, глядя на исследовательские работы команды машинного обучения Apple за последний год, мы ясно видим, что Apple придает большое значение возможности запуска больших моделей на конечных устройствах.
В январе этого года команда Apple по машинному обучению подробно обсудила метод решения проблемы «запуска больших моделей в памяти мобильного телефона» в недавно опубликованной статье, в которой представлены новые технические идеи для решения узких мест вычислений на мобильных устройствах.
В статье, упомянутой в начале, исследователи Apple также заявили, что хотя ReALM и имеет меньший размер параметров, по некоторым ключевым показателям он даже превосходит GPT-4.
Так в каком же виде нам будет представлен AI Siri? До выхода WWDC 2024 мы, возможно, сможем почерпнуть вдохновение из лагеря Android.
На конференции HarmonyOS 4 в августе прошлого года Юй Чэндун объявил о способности умного помощника Xiaoyi получать доступ к большим моделям искусственного интеллекта. Сразу после этого Лэй Цзюнь сообщил, что Xiaomi прогнала на своем мобильном телефоне большую модель с параметрами 1,3B, и эффекты некоторых сцен сравнимы с эффектами в облаке.
Ни один из отечественных мобильных телефонов Yuwujia не остался позади. OPPO Xiaobu Assistant на базе AndersGPT, Honor Magic 6, оснащенный большой моделью AI на стороне терминала 7B, и vivo, оснащенный большой модельной матрицей Blue Heart, также были официально анонсированы один за другим.
Благодаря большим моделям эти голосовые помощники впечатляют в копирайтинге, рисовании картинок и т. д., но по сравнению с предыдущими голосовыми помощниками сценарии их применения ничем не отличаются.
Если AI Siri хочет заново изобрести свое первоначальное намерение и стать настоящим интеллектуальным помощником, он должен, по крайней мере, соответствовать следующим основным условиям:
Во-первых, стать умнее, то есть улучшить возможности обработки естественного языка с помощью технологии больших моделей; во-вторых, внедрить голосовой интерфейс для оптимизации интерактивного взаимодействия пользователя; в-третьих, открыть статус острова для всех приложений и добиться плавной интеграции данных. и функций, что делает Siri по-настоящему полнофункциональным интеллектуальным помощником.
Хотя выделить какое-либо из трех вышеперечисленных условий непросто, существует также некоторый опыт пионеров отрасли, который можно использовать в качестве справочного материала.
На пути к генеративному ИИ иногда проще всего идти рука об руку.Не так давно появилась новость о том, что Apple, которая «отстает», ведет переговоры с Google, OpenAI и другими компаниями об интеграции сервисов генеративного ИИ в iOS. 18.
По сравнению с «ясно слышать свою речь», «понимание того, что вы имеете в виду» является основным препятствием для голосового взаимодействия. Даже Стив Джобс при жизни считал, что это трудный вопрос:
Распознавание речи станет очень интересной темой в ближайшие 10 лет. Проблема, с которой он сталкивается, на самом деле заключается не только в том, как распознавать речь. Когда вы разговариваете с кем-то, понять его язык гораздо сложнее, чем просто распознавать речь.
…Это дело довольно сложное. Так что пока мы не решим ее, вам остается только надеяться на это прекрасное будущее.
Как точно реагировать на потребности пользователя в пробуждении в различных шумных и сложных средах и как перейти от семантического понимания к пониманию памяти, чтобы Siri могла запоминать и анализировать контекст и контекст пользователя, а также предоставлять более интеллектуальные услуги и предложения. ключевой шаг, сделанный Siri на пути к интеллекту.
Это именно то, в чем хорошо нынешнее оборудование искусственного интеллекта.
Что касается разрушения барьеров между приложениями, то интеграция программного и аппаратного обеспечения является второстепенной.
Тринадцать лет назад люди могли купить iPhone, чтобы испытать Siri.В то время Siri была не просто функцией, но и представляла собой новый способ взаимодействия, средство для изучения будущего жизни.
Тринадцать лет спустя Siri, потерявшая прежнюю ауру, постепенно превратилась из фокуса инноваций в обычную дополнительную функцию и даже стала ненужной в жизни некоторых пользователей.
Благодаря поддержке технологий крупных моделей, от холодных щелчков и касаний до теплого голосового общения, мы ожидаем, что Siri станет не просто интеллектуальной системой, а комплексным партнером, способным понимать наш язык, эмоции и потребности.
Такой Siri предоставит нам более персонализированные и внимательные услуги, а также сделает использование технологий более гуманным и теплым.
# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo