Влияние GPT на интерфейсы продуктов

1. Справочная информация

1.1 Почему важны большие модели?

В качестве типа модели большого языка (LLM) модель OpenAI GPT (Генераторный предварительно обученный трансформатор) демонстрирует машинный интеллект, наиболее близкий к человеческому сегодня. Наиболее важной особенностью GPT является то, что он использует триллионы параметров и текстовые данные Весь Интернет позволяет компьютерным моделям производить интеллектуальное возникновение (Эмерджентность). Эмерджентность в физике обычно относится к повторяющемуся появлению определенных устойчивых закономерностей в хаотических явлениях.Эмерджентность является самой сложной категорией в понимании сложных природных явлений. Из недавнего интервью с главой OpenAI Сэмом Альтманом и главным научным сотрудником Ильей мы можем понять, как приручить большую языковую модель, возникающую с помощью интеллекта, и как заставить ее служить людям стабильно и безопасно (Выравнивание, выравнивание). эффективный метод отладки, GPT по-прежнему в некоторой степени является черным ящиком.

Нам нужно задаться вопросом, почему языковая модель изменит мир. ChatGPT действительно более послушен и лучше говорит, но что такого хорошего в интеллектуальном инструменте взаимодействия с текстом? Есть две причины: 1. Искусственный интеллект имеет несколько режимов (модальный). Исследования между различными режимами проникают друг в друга и конкурируют друг с другом. Режим с лучшей производительностью первым определит траекторию будущих приложений ИИ. ChatGPT показывает текстовый модальный режим. интеллект будет доминировать в недавнем развитии ИИ. 2. Текст очень важен как вход в человеческое общество.

Пункт 1, мультимодальность. Искусственный интеллект, использующий изображения в качестве модальности, разрабатывался в течение многих лет. Компьютерное зрение, которое неоднократно добилось больших успехов в распознавании изображений и автономном вождении, является еще одним входом в искусственный интеллект. За последние десять лет на трех конференциях CVPR/ICCV/ECCV произошел взрывной рост количества статей. Появление OpenAI изменило выдающуюся позицию графического интеллекта в приложениях ИИ и даже траекторию его развития – когда Meta выпустила Segment-Anything (графический алгоритм сегментации различных объектов на изображениях), модель продемонстрировала силу, аналогичную GPT в тексте. Учитывая возможности бесплатной миграции, некоторые люди также восклицали, что традиционное резюме мертво (преувеличение).

Влияние ChatGPT на текстовую модальность не нуждается в подробностях. Оно выходит за рамки простой научно-исследовательской ценности и переопределяет интеллектуальный и бизнес-потенциал текстовой модальности. Продукт OpenAI DALL·E также обеспечивает интеллектуальную обработку изображений за пределами текстовой модальности. Stable Diffusion с открытым исходным кодом и Midjourney с закрытым исходным кодом, как повелители в области графики Vincent, также способствовали бесчисленным предупреждениям о «смерти» в творческой индустрии. В общем, ИИ проникает друг в друга в двух модальностях текста и изображения и расширяет границы интеллекта во взаимной конкуренции.

– Модальность OpenAI «текст + изображение»: ChatGPT + DALL·E.

– Веб-интерфейс Stable Diffusion (модальное изображение): стабильная диффузия

– Midjourney (графическое модальное окно): Midjourney

Пункт 2: Текстовая модальность – это вход в человеческое общество. Вы можете сослаться на мнение Юваля Харари (автора «Краткой истории человечества») в эксклюзивном интервью The Economist: Он считает, что язык — это операционная система человеческого общества, и искусственный интеллект взломал эту систему, и ИИ изменит его с помощью языка, сама операционная система полностью изменила историю человечества. Планирование человеческого поведения и социальной обратной связи с помощью больших моделей будет иметь огромное влияние из-за вторжения языковой системы.

Для получения дополнительной информации, пожалуйста, обратитесь к: юваль-ной-харари-утверждает, что-ай-взломал-операционную-систему-человеческой-цивилизации.

1.2 Стоимость LLM

Сколько стоит обучение действительно большой модели?

Прежде всего, независимо от изображений и видео, крупным моделям требуются как минимум текстовые данные всего Интернета; для запуска потребуются десятки тысяч А100; вычислительное энергопотребление необходимой электроэнергии станет затратой, которую нельзя игнорировать; стоимость проб и ошибок неконтролируема: ее можно измерить несколькими месяцами Время обучения и трудозатраты Метод обучения модели и точной настройки неизвестен или не является общедоступным, а большая модель по-прежнему остается черным ящиком. Совокупность этих причин привела к тому, что на планете осталось всего несколько компаний, которые могут владеть крупными моделями, поскольку это требует чрезвычайно сильных финансовых ресурсов и чрезвычайно высокой толерантности к риску. крупные компании, которым не хватает духа авантюризма, недостойны владеть им.

Илон Маск в недавнем интервью подсчитал, что для обучения модели уровня GPT-5 можно использовать 30 000–50 000 чипов H100, использовать новейшую техническую архитектуру и ведущих исследователей искусственного интеллекта (см. OpenAI, около 200+ человек). Наконец, Маск назвал стартовую стоимость большой модели. По сравнению с недавней оценкой крупномасштабной модели Startup, эта цифра имеет большое значение: 250 миллионов долларов США.

1.3 Возможности

На собрании акционеров Tencent в 2023 году генеральный директор Tencent Ма Хуатэн ответил на вопросы о ChatGPT и искусственном интеллекте, сказав: «Изначально мы думали, что (искусственный интеллект) — это возможность, которая появляется раз в десятилетие для Интернета, но чем больше мы думали об этом , тем больше мы чувствовали, что это была подобная возможность, которая выпадает раз в столетие. Такие возможности, как промышленная революция, которая изобрела электричество». погружена в исследования и разработки, но не торопится заканчивать их раньше времени и демонстрировать полуфабрикаты. «Для промышленной революции выключение лампочек на месяц раньше не так уж важно в долгосрочной перспективе. Ключевым моментом является качественная работа над базовыми алгоритмами, вычислительными мощностями и данными, и, что более важно, это реализация сценария. , и в настоящее время (мы) все еще размышляем. Я чувствую, что многие компании сейчас слишком торопятся, и создается впечатление, что это делается для повышения цены акций, что не в нашем стиле».

Подводя итог, можно сказать, что нет необходимости торопиться с повышением курса акций, и нет необходимости спешить с инновациями, поскольку путь впереди долгий.

У меня тоже есть некоторые мнения. Разница между тем, чтобы вынуть лампочку на месяц позже и вынуть ее на месяц раньше, заключается в том, окажетесь ли вы Эдисоном или каким-то неизвестным вторым человеком, который изобретет лампочку. Однако, несмотря на удивительные возможности больших моделей, задача их приручения и улучшения по-прежнему остается трудной. Мы переживаем трудный период, когда впервые строим самолет. Если мы хотим летать безопасно и стабильно, нам все еще нужно много с трудом заработанных уроков из неудач, чтобы понять, где находится красная линия. OpenAI запустила плагин Plugin, который является потенциальным продуктом. Однако текущая коммерческая эффективность плагина не ясна. Ожидается, что App Store будет запускаться плагином. Как включить GPT в продукт, имеющая коммерческую ценность, пока неизвестно. На протяжении многих лет Goose Factory является законодателем моды в области преимущества второго хода и обладает козырной картой в виде микроинноваций.

2. GPT вызывает изменения на уровне взаимодействия человека и компьютера (HCI/UI).

Пользовательский интерфейс, интерфейс взаимодействия с пользователем, называемый UI. Сегодня каждый живет в океане UI.Многие интернет-пользователи считают, что UI ≈ веб-дизайн+приложение.Это понимание сильно ограничивает смысл UI. Более профессиональное определение пользовательского интерфейса следует называть HCI, Human-Computer Interface, интерфейс взаимодействия человека с компьютером. За почти столетие разработки люди разработали несколько поколений уникальных пользовательских интерфейсов, основанных на вычислительной мощности и уровне интеллекта машин того времени. Мы находимся на этапе перехода от графического пользовательского интерфейса к NLI.

  • PCI: интерфейс перфокарты, интерактивный интерфейс перфокарты.
  • CLI: интерфейс командной строки, интерактивный интерфейс командной строки.
  • Графический интерфейс пользователя: графический интерфейс пользователя, графический интерактивный интерфейс.
  • NLI: интерфейс естественного языка, интерактивный интерфейс естественного языка.
  • BCI: Brain Computer Interface, интерфейс взаимодействия мозга и компьютера.

2.1 PCI, интерфейс перфокарты Интерфейс перфокарты


Вверху: стопка перфокарт с программой.
Внизу: американские служащие в 1950 году изготавливают перфокарты, содержащие раздел данных переписи населения США.

2.2 CLI, интерфейс командной строки.

Языки программирования дополнительно инкапсулируются, появляются устройства отображения, а инструменты командной строки стали важнейшим интерактивным интерфейсом для компьютеров. Работа CLI эффективна и мощна.

2.3 Графический интерфейс пользователя, графический интерфейс пользователя Графический интерфейс пользователя

GUI, графический интерфейс пользователя, который Джобс «украл» у Xerox, положил начало революции персональных компьютеров.

Этот уровень интерфейса оказал огромное влияние, и первое в мире потрясающее приложение было создано на базе графического пользовательского интерфейса — электронная таблица Macintosh VisiCalc, которая также была предшественником Excel.

По сей день красивый и удобный пользовательский интерфейс Mac по-прежнему остается одной из самых привлекательных функций продукта для пользователей.

2.4 NLI, интерфейс естественного языка. Интерфейс естественного языка.

1. Текст в текст https://openai.com/chatgpt

2. Текст в изображение https://openai.com/dall-e-2

3. Текст в видео.
Подиум: Развитие творчества с помощью искусственного интеллекта.

Скажите хоть слово: «Красивый концепт-рендер гостиной», «Создайте красивый концепт-рендер гостиной».

4. Текст к действию и поведение

Адепт:

Цель Adept — создать универсального интеллектуального помощника посредством автоматизации программного обеспечения. Естественный язык будет единственным интерактивным контентом, который пользователи Adept должны будут использовать в будущем.

2.5 BCI, мозговой компьютерный интерфейс

Мысль к действию, от человеческого мышления к поведению машины. NeuroLink, получившая широкую огласку в прошлом году, позволяет обезьянам играть в игру «Понг» силой мысли, а люди также могут использовать интерфейсы «мозг-компьютер» для управления простыми играми и механическими протезами. На данном этапе более значимые продукты «мозг-компьютер» в основном помогают людям с ограниченными возможностями контролировать протезирование и восстанавливать свою способность к жизни. Сегодняшним технологиям «мозг-компьютер» еще рано говорить о революционных интерфейсах взаимодействия человека и компьютера.

2.6 Резюме

– Необходимо расширить смысл пользовательского интерфейса.

Для общения между машинами и людьми требуется слой интерактивных носителей, который контролирует границы ввода и вывода при взаимодействии человека с компьютером. Интерактивная среда будет фильтровать и преобразовывать вводимые человеком данные, делая эти странные вводимые человеком данные безопасными и идентифицируемыми для машины; в то же время результаты, возвращаемые машиной, будут фильтроваться и преобразовываться интерактивной средой, что делает их безопасными, полезными и ценными. людям.

Этот уровень интерактивных средств массовой информации, соединяющий людей и машины, является определением пользовательского интерфейса.

В ходе интернет-революции последних двух десятилетий графический интерфейс стандартизировал все методы ввода, которые люди хотят использовать на машине, посредством ограниченных форм операций, таких как кнопки, перетаскивание, шкивы, масштабирование пальцами, операции несколькими пальцами, встряхивание, переворачивание, аппаратное обеспечение. кнопки и т. д. Этот стандартизированный ввод воспринимается машиной и возвращается как стандартизированный вывод. Революция ПК и мобильного Интернета приравняла пользовательский интерфейс и графический интерфейс, но на самом деле пользовательский интерфейс намного богаче, чем существующие методы взаимодействия с графическим интерфейсом.

Появление GPT напрямую разрушило этот баланс. Наиболее важным воздействием умных машин на продукты является то, что отказоустойчивость компьютера к естественному языку значительно улучшилась. Ему больше не нужен фильтр, который может получать лишь очень ограниченные входные данные для понимания людей. Естественный язык, на котором говорят каждый день, даже перемешан со всевозможной логикой, намеками, сарказмом и ошибками. Улучшение отказоустойчивости искусственного интеллекта для естественного языка определенно разрушит текущий уровень взаимодействия графического интерфейса как пользовательского интерфейса:

1. Большая трансформация пользовательского опыта (UX). В прошлом пользователи перешли от основного метода взаимодействия, состоящего из «щелкания, скольжения, перетаскивания» пальцами и мышью, к взаимодействию с использованием естественного языка в качестве интерфейса.

2. Исчезнет ли текущий графический интерфейс? Нет, по двум причинам. Во-первых, когда модель недостаточно точна или разработка искусственного интеллекта незрела, элегантный внешний вид и удобство графического интерфейса по-прежнему привлекательны для пользователей, а стоимость взаимодействия с помощью пальцев и мыши намного ниже, чем при использовании естественного языка. Во-вторых, если говорить о различных этапах разработки пользовательского интерфейса, не устарела ли черная командная строка? Нет, графический интерфейс не исчезнет сразу. Если более эффективно использовать интерактивный интерфейс предыдущей эпохи, этот вид взаимодействия все равно будет существовать, даже если порог использования высок.

3. Инструмент командной строки (CLI) по-прежнему остается наиболее эффективным способом выполнения сложных операций на компьютере. В разумном будущем, если вам понадобится более глубоко управлять приложением, кто-то может сказать: откройте свой графический интерфейс, точно так же, как сегодняшние программисты говорят: откройте свой терминал.

4. Интерфейс взаимодействия человека с компьютером будет развиваться в направлении уменьшения глубины компьютерных операций и снижения порога использования. То же самое касается изменений, которые вот-вот вызовут большие модели. Вы можете увидеть эту тенденцию: командная строка CLI – графический интерфейс GUI – естественный язык NLI – интерфейс мозг-компьютер BCI.Эта тенденция становится все ниже и ниже в способности компьютеров работать в глубину, а также снижает порог для пользователей. и ниже.

5. Лучших компьютерных инженеров невозможно заменить благодаря их глубокому пониманию машин и глубоким эксплуатационным возможностям, но только лучшие инженеры могут выжить.

На рисунке ниже мы можем более ясно увидеть, почему GPT приведет к огромным изменениям в пользовательском интерфейсе продукта? Потому что машинные языки в прошлом были очень жёсткими и имели крайне низкую отказоустойчивость. Единственная пунктуационная ошибка в языке программирования может сделать всю программу неработоспособной. Самым важным волшебством, которое приносят большие модели, является значительное улучшение отказоустойчивости машины для естественного человеческого языка (Natural Language, NL). Подводя итог, можно сказать, что будущий интерактивный интерфейс на естественном языке будет использовать поле ввода текста в качестве отправной точки и нацелен на мультимодальное и высокодинамичное взаимодействие.

Порог использования: чем ближе он к людям, тем ниже порог использования. Командная строка CLI > Графический интерфейс GUI > Естественный язык NLI > Интерфейс мозг-компьютер BCI

Эффективность работы: чем дальше от машины, тем ниже эффективность управления. Командная строка CLI > Графический интерфейс GUI > Естественный язык NLI > Интерфейс мозг-компьютер BCI

-Эволюция НЛИ

·Старт: поле ввода текста
·Разработка: мультимодальное поле ввода, голос, изображение, видео · Цель : ввод – мультимодальный текст, звук, изображение, видео => возврат – полезный текст, голос, изображение, видео + полезное поведение программного обеспечения.

Какие режимы может обеспечить Vision pro: трехмерное взаимодействие, жесты, гравитация, вращение, голосовой текст, статические изображения и видео в реальном времени.

·Будущее : общение с людьми — это лишь отправная точка для понимания мира с помощью больших моделей. Использование LLM в качестве мозга, камер в качестве глаз и роботизированных рук в качестве конечностей — это новый интерфейс для взаимодействия ИИ с физическим миром.

-Timberter — приложение для «подсчета древесины», основанное на визуальных алгоритмах, существующее уже много лет . Что произойдет, если мы добавим к этому мыслительные способности большой модели и роботизированную руку, способную выполнять манипуляции?


-Робот, управляемый голосом? Голосовой интерфейс OpenAI GPT-4 Whisper

3. Экосистема искусственного интеллекта

3.1 Форбс АИ 50

Forbes выбрал 50 самых многообещающих ИИ-компаний года за последние годы. В отличие от предыдущих лет, в список компаний, занимающихся искусственным интеллектом, в этом году вошли не только представители Северной Америки, но и 50 наиболее перспективных и ценных компаний из более чем 800 компаний со всего мира, из США, Канады, Израиля, Великобритании и Японии.

Ниже приведен полный список, который я составил, включая OpenAI, Jasper, Hugging Face, Adept… все стартапы в области искусственного интеллекта, с которыми вы знакомы. Заинтересованные студенты могут зайти на сайт Forbes и прочитать ее самостоятельно, и я не буду начинать обсуждение. Форб АИ 50

3.2 Больше стартапов в области искусственного интеллекта

Сценарии использования в основном сосредоточены на стороне C: генеративный текст, аудио, изображение, видео + поиск + автоматический копилт. Приложения B-стороны в основном основаны на интеграции и могут относиться к конкретным отраслевым категориям: право, медицина и здравоохранение, академические исследования (биология, физика, математика) и интеллектуальный анализ. Кроме того, существует инфраструктура искусственного интеллекта: база данных векторов, модель искусственного интеллекта для больших моделей, безопасность искусственного интеллекта, разработка и эксплуатация DevOps и автоматизированный Copilt.

На рисунке ниже представлен список других компаний, созданных с помощью ИИ (март 2023 г., с точки зрения американских венчурных капиталистов). Заинтересованные студенты могут испытать это на себе.

4. Интеграция крупных моделей и продуктов

4.1 Затраты на интеграцию

Стоимость интеграции здесь — это не просто обсуждение стоимости разработки интеграции ИИ в продукты, но также стоимость обучения и время, необходимое пользователям для выполнения работы того же качества, что и в прошлом, с использованием интеллектуальных приложений ИИ. Приложения ИИ будут иметь ценность только в том случае, если стоимость интеграции будет значительно меньше первоначальной стоимости (затраты на разработку и эксплуатацию + затраты на пользователя).

Стоимость интеграции = стоимость разработки продукта ИИ + затраты пользователя на использование приложения ИИ для выполнения работы того же качества в прошлом.

Приведите два примера, иллюстрирующие значение интеграционных издержек.

Спереди: AIGC создает наполнители/материалы для игрового дизайна.

Идет трудоемкая работа по геймдизайну и разработке, включающая подготовку материалов наполнения, диалоги персонажей NPC, переключение стилей, краевые сцены… К этому виду работ не предъявляются высокие требования к оригинальности, но существенно сократить временные затраты невозможно.

Если вы используете инструменты искусственного интеллекта для создания таких неважных материалов и, наконец, корректируете их опытными дизайнерами, вполне реально добиться того же качества результатов, что и в прошлом.

Стоимость интеграции некритических материалов, созданных ИИ < < < Стоимость подготовки традиционных материалов

AIGC заслуживает продвижения в контексте игровых материалов.

С другой стороны: решение для создания расширенной рекламы с использованием универсального искусственного интеллекта.

Хотя рекламные решения на основе искусственного интеллекта, по-видимому, снизили стоимость создания текста, изображений и видео в прошлом процессе создания рекламы, по-настоящему привлекательная и продвинутая реклама часто требует чрезвычайно большого количества индивидуального создания и вторичных модификаций.

Поэтому, когда реальные пользователи (поставщики рекламных услуг, использующие создание ИИ, или те, кто требует рекламы, которые хотят устранить рекламодателей) вносят вторичные корректировки в рекламный контент, созданный ИИ, для достижения того же уровня качества, что и в прошлой рекламе, потребуется немало усилий. Стоимость настройки намного выше, чем у традиционных методов, а в большинстве случаев даже невозможно добиться такого же качества.

Стоимость интеграции искусственного интеллекта в элитной рекламе > > > Исходная стоимость традиционной рекламы.

Комплексный сервис искусственного интеллекта решает задачу создания сложной индивидуальной рекламы, что сегодня нереально.

Конечно, по мере улучшения эффективности модели меняются даже рыночные средства и рыночные предпочтения (точный маркетинг, индивидуальные предпочтения). Текущий отрицательный случай станет положительным, а положительный случай также может стать отрицательным.

4.2 Методы интеграции

Большие модели будут продавать два типа продуктов. Совершенно новый продукт, созданный на основе возможностей искусственного интеллекта, можно назвать AI Naive/AI Native. Другой — добавить функции искусственного интеллекта к традиционному программному обеспечению и провести интеллектуальную трансформацию, которую можно назвать обновлением искусственного интеллекта/обновлением искусственного интеллекта. Эти два метода формируют разные пользовательские интерфейсы продукта.

Наиболее важные факторы интеграции продуктов искусственного интеллекта:

1. Производительность модели ИИ
2. Стоимость разработки и эксплуатации ИИ-продуктов + стоимость пользователей, использующих ИИ-приложения (затраты на интеграцию).

5. Информация об инструментах искусственного интеллекта

Состав приложений ИИ: Инфраструктура + промежуточное ПО Промежуточное ПО + приложение (эти определения могут пересекаться)

5.1 Применение ИИ | Применение

-Поисковые системы: New Bing, Google Bard.

-Чат вопросов и ответов: ChatGPT, Jasper, различные приложения для умного чата.

– Vincent Pictures: Середина путешествия, стабильная диффузия

– Винсент Видео: Взлетно-посадочная полоса

-Автоматизация: Адепт

Дополнительные ссылки на инструменты (внутренние): набор инструментов AI | Коллекция инструментов AI | Навигация по веб-сайту AI.

5.2 Промежуточное ПО |

Большая модель — это базовая модель, которая обладает наиболее обширными знаниями и демонстрирует сильные возможности обобщения, но ее точность в точных сценариях недостаточна. Это также основная проблема применения больших моделей. Значение промежуточного программного обеспечения состоит в том, чтобы организовать знания о профессиональных сценариях, расширить базу знаний моделей, повысить точность ИИ и, наконец, предоставить удобные и удобные интерфейсы для подключения приложений верхнего уровня. Поскольку стоимость интерфейсов на естественном языке очень низка, многие промежуточные программы напрямую предоставляют интерфейсы приложений и окно чата, например первый AgentGPT.

-АгентGPT
https://github.com/reworkd/AgentGPT
https://agentgpt.reworkd.ai/

Дополнительные инструменты промежуточного программного обеспечения:
-Langchain: https://github.com/hwchase17/langchain

-AutoGPT: https://github.com/Significant-Gravitas/Auto-GPT

-BabyAGI: https://github.com/yoheinakajima/babyagi

-HuggingGPT: https://github.com/huggingface/transformers

Подобных промежуточных программ много, поэтому я не буду их все перечислять.

5.3 Инфраструктура | Инфраструктура

-Модель

Большие модели: OpenAI GPT, Google Bard, Anthropic, Wenyan Yixin, Baichuan Intelligence…

Модель с открытым исходным кодом:

Ллама: https://github.com/facebookresearch/llama

Альпака: https://github.com/tatsu-lab/stanford_alpaca

Викунья: https://lmsys.org/blog/2023-03-30-vicuna/

GPT4ALL: https://github.com/nomic-ai/gpt4all

ЧатGLM: https://github.com/THUDM/ChatGLM-6B

Байчуань-7Б: https://github.com/baichuan-inc/baichuan-7B

Стабильная диффузия (режим изображения): https://github.com/AUTOMATIC1111/stable-diffusion-webui

-База данныхБаза данных

Обратитесь к базе данных векторов, рекомендованной OpenAI: https://platform.openai.com/docs/guides/embeddings/how-can-i-retrieve-k-nearest-embedding-vectors-quickly.

У Zilliz есть продукт Milvus с открытым исходным кодом: https://github.com/milvus-io/milvus.

-Скомпилируйте и запустите компиляцию и DevOps.

То, как запускать большие модели на локальных устройствах и устройствах младшего класса, является препятствием для распространения возможностей ИИ.

MLC-LLM (Machine Learning Compilation-LLM) — это инструмент компиляции для ML. Это позволяет локально запускать большие модели. https://mlc.ai/mlc-llm/

Опыт использования следующий. Установите инструмент mlc-chat-cli-nightly через conda в локальной среде, загрузите модель из Hugging Face и запустите большую модель на локальном Mac для вопросов и ответов:

Запускайте большие модели локально на мобильных устройствах:

6. Заключение

Большая модель. Для больших моделей с закрытым исходным кодом, таких как GPT, проблемы заключаются в сценарии модели, безопасности данных, точности, эффективности отладки, оперативном проектировании и стыковке инженерных интерфейсов. Модели с открытым исходным кодом для самостоятельного развертывания не являются строго большими моделями. Проблемы заключаются в скорости, производительности и производительности тестов.

Промежуточное программное обеспечение: соединяет уровень модели и уровень приложения, предоставляет подключаемые модули знаний в конкретных областях; расширяет сценарии приложений и быстро предоставляет интерфейсы приложений; снижает затраты на разработку, эксплуатацию и обслуживание.

Уровень приложения: допуск производительности модели в сценариях использования, выгода = ценность использования – стоимость интеграции; реакция на опасность: иллюзия ИИ, безопасность ИИ.

Пользовательский интерфейс — это прочный клей, соединяющий людей и компьютеры. Именно с помощью этого интерфейса происходит проектирование продукта. Революция, вызванная GPT, окажет огромное влияние на пользовательский интерфейс продукта.Содержание этой статьи — это мои исследования и подборка информации, связанной с ИИ, за последние несколько месяцев. Этот эволюционный путь должен учитывать, что производительность модели несовершенна, начиная с текстового взаимодействия, расширяясь до богатых и разнообразных мультимодальностей и использования нового интерактивного опыта для удовлетворения древних и совершенно новых потребностей.

Основным бизнес-вопросом революции искусственного интеллекта всегда будет: «Что это за интерфейс?»

Позвольте мне закончить словами Леннона: «В конце концов, все будет хорошо. Если что-то не так, то это еще не конец».

# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo