Приложение AI, которое он сделал для своей дочери, выиграло премию Apple Design Award. Я также нашел эти английские приложения с уникальными идеями.

С появлением ИИ языковой барьер, похоже, «сломался». Перевод больше не проблема, полировка становится автоматической, а имитировать, переписывать и копировать различные стили стало еще проще.

Эти удобства действительно значительно облегчили бремя — нам больше не нужно пережевывать каждое слово, и нам больше не нужно столько моментов «зазубривания». Но из-за этого мы вынуждены переосмыслить: после всех этих «экономий усилий» что остается между нами и языком?

Становится ли изучение языка «применением на основе инструментов»? Является ли язык по-прежнему способом восприятия мира, средством для нас, чтобы рассказать о себе, и путем, которым люди исследуют мир и вещи?

Может быть, ответ не придет так скоро. Но, по крайней мере, мы можем сначала увидеть некоторые новые инструменты: в этой специальной теме APPSO пообщался с разработчиками Capwords, Read Easy и Para Translation, которые являются инструментами, связанными с английским языком. Все они расцвели при поддержке ИИ — некоторые вернулись к жизненным сценам, чтобы найти якоря памяти, некоторые создали тонкие дизайны в процессе чтения, а некоторые просто реконструировали процесс чтения.

Что еще важнее, все они указывают в одном направлении: после того, как сложность языка снизилась благодаря технологиям, на самом деле необходимо перестроить отношения между нами и самим языком.

Capwords: Словарный запас — это «трение» с жизнью

Называть этот продукт, который только что получил премию Apple Design Award, «инструментом для изучения английского языка» явно слишком ограниченно. Capwords больше похож на устройство о языке, памяти и жизненных ситуациях: он распознает слова, делая фотографию, а его дизайн в виде наклейки в сочетании с живым и легким визуальным стилем не позволяет людям не взглянуть еще раз и не выучить еще несколько слов.

За почти интуитивным дизайном Capwords стоит простая, но глубокая концепция: изучение языка должно вернуться в повседневную жизнь. Оно может начаться с одного указания, прогулки или любопытства по поводу «как это сказать?»

APPSO: Все началось с того, что у ребенка возникла очень простая потребность: указать на что-то и спросить: «Как это сказать по-английски?» Это и стало источником вдохновения и началом проекта, верно?

DTD: Да, моей дочери около трех лет, даже нет. Летом я часто беру ее поиграть. Мы ходим в парки или на площади перед офисными зданиями. Во время спектакля она задавала мне вопросы, например: «Как называется это растение?» «Как прочитать этот дорожный знак?» Я объяснял ей во время игры, а иногда использовал какие-то идентификационные материалы, чтобы помочь ей проверить. Может быть, это потому, что она была на той стадии, когда ее любопытство взрывалось, и таких сцен было на самом деле много.

Одним из самых запоминающихся моментов был момент, когда в трещинах напольной плитки офисного здания выросло растение под названием «корень собачьей почки». Она указала и сказала: «Папа, вот корень собачьей почки!» Такие сцены глубоко меня тронули. В сочетании с тем фактом, что она задала мне несколько вопросов вроде «Как это сказать по-английски?», я подумал: эта комбинация «сцена + изображение + информация» может помочь ей лучше запомнить. Я также дизайнер, поэтому я более чувствителен к изображениям или информации.

▲Фото: Xiaohongshu@DTD.STUDIOS

Так что во многих из этих сцен взаимодействия с моей дочерью я чувствовала, что сам язык должен существовать в жизни, и мы должны спросить себя, какие методы мы можем использовать, чтобы помочь этому вопросу. Вероятно, это процесс.

APPSO: Осознавали ли вы в то время, что схожие потребности существуют не только среди детей, но и среди более широкой группы пользователей?

DTD: Нет, поскольку я не очень хорош в английском, я не очень хорош в запоминании или вбивании знаний в голову. Я не специалист по образованию, поэтому мое понимание изучения языка заключается в том, что это происходит в жизни. Если есть среда, например, когда вы видите или говорите о чем-то во время чата, когда вы видите объект или изображение, будут ассоциированные воспоминания. Я сам резюмирую некоторые принципы, например, почему меня привлекает определенное изображение, или красочное здание, или отличительное здание в нашем городе, то, что привлекает мое внимание, может быть ассоциацией с графикой в ​​моем сознании, что очень важно. Это может быть моим личным резюме как дизайнера, и оно может быть не полностью научным.

▲ Изображение от: Xiaohongshu@DTD.STUDIOS

APPSO: Большинство программ для поиска слов на рынке раздуты, но Capwords делает путь очень простым и может быть завершен одним щелчком мыши. Но вы когда-нибудь беспокоились о влиянии на результаты обучения?

DTD: Почему бы вам не рассказать нам об этом CLU?

CLU: На самом деле, когда мы запустили проект продукта, нашей отправной точкой было не изучение языка. Возвращаясь к тому, что я только что сказал, мы просто хотели ответить на вопросы моей крестницы — это семя всего. Постепенно мы поймем, что образы будут образовывать своего рода «трение» с нашей жизнью . Другими словами, создавая трение с объектами в реальном мире, мы можем усилить точки памяти. Когда эти точки памяти объединяются со сценой в то время, и новые слова или вещи попадают в мозг, наша память об этой информации будет более глубокой.

Мы наблюдаем в нашей повседневной жизни, что люди имеют естественное любопытство с самого детства и естественным образом запоминают все новое . Например, когда мы едем в Японию, хотя мы можем не говорить ни слова по-японски, мы будем говорить простые слова, такие как «спасибо» и некоторые слова. Или, описывая милые вещи, мы будем использовать такие слова, как «каваий», потому что эти вещи для нас новые .

Поэтому, когда мы начинали проект, мы не позиционировали его как продукт, который просто обучает английскому или лексике. И основываясь на наших наблюдениях, отзывах пользователей и фактической реализации, одно из того, что мы делаем, — это снижаем порог изучения нового языка , чтобы люди были более заинтересованы. По мере того, как люди становятся более заинтересованными в языке, они постепенно найдут более систематический способ его изучения.

APPSO: Получили ли вы какие-либо особенно впечатляющие отзывы пользователей?

@61: Я могу рассказать об этом. У одного из моих бывших наставников есть дочь в начальной школе. Во время тестирования я дал ему код погашения, и он играл в Capwords со своей дочерью на iPad, сканируя все в доме, даже лысую голову своего отца (смеется).

На следующий день ее отец пришел ко мне и сказал, что его дочь записала все слова, которые она вчера отсканировала, в свой дневник и начала просматривать их самостоятельно. В течение следующих нескольких дней первое, что сделала его дочь, вернувшись из школы, — это не поиграла в Egg Party, а осмотрела дом с помощью своего iPad, чтобы найти «что еще она еще не отсканировала».

DTD: Я был действительно впечатлен отзывами некоторых пользователей. Я видел, как один пользователь сказал, что это был наименее похожий на ИИ продукт ИИ, который он когда-либо использовал, а другой сказал , что это был самый теплый продукт ИИ, который он использовал в этом году . Это именно то, чего мы хотим достичь.

APPSO: Действительно, модель полностью интегрирована в процесс использования, а присутствие ИИ не сильное. Возникли ли у вас какие-либо трудности в ходе разработки?

CLU: На самом деле, я думаю, что у ИИ все еще есть некоторые границы и условия, но суждение самого ИИ похоже на некий здравый смысл людей. Например, мы уже проверяли, что ИИ распознает чашку коричневой жидкости как кофе, но если я сам приготовлю этот напиток, я знаю, что это на самом деле травяной чай, поэтому результат распознавания не соответствует моему познанию.

Но это не проблема ИИ, просто ошибочная идентификация случается. Поэтому мы добавили элемент корректировки при проектировании, чтобы в случае, если результат распознавания системы не соответствует познанию, пользователь мог ввести правильный элемент.

DTD: Что касается скорости распознавания, даже большие модели требуют времени. Весь процесс отправки изображения и отправки данных обратно занимает около пяти или шести секунд. Когда мы выпустили первую версию в прошлом году, мы поиграли с ней, и она, казалось, была в порядке. Все считали ее потрясающей. Моя жена и дочь особенно считали ее потрясающей. Но когда я сам ее использовал, я все еще чувствовал, что эти шесть секунд были очень мучительными.

Позже мы оптимизировали некоторые подсказки, скорректировали размер картинок и использовали различные интерактивные конструкции, чтобы уменьшить восприятие времени пользователем, скрывая это время за различными формами взаимодействия. Поэтому я понимаю, что мы можем решить некоторые проблемы, которые сама текущая модель не может решить на уровне опыта.

CLU: Другое дело, что когда объект идентифицирован, вы увидите эффект отрыва наклейки. В то время мы хотели сделать эффект отклеивания объектов в реальном мире от наклеек. В процессе отклеивания фактически выполняется полная загрузка, но пользователь не осознает этого, и в итоге это может иметь очень плавный опыт.

▲ Изображение от: Xiaohongshu@DTD.STUDIOS

Я считаю, что в конечном итоге ИИ обязательно будет интегрирован или станет инфраструктурой. Нет необходимости отражать конкретные технические реализации. Пользователям нужно сосредоточиться только на эффектах, которые приносит ИИ, и этот результат должен быть тем, чего ожидают пользователи, или даже превосходить ожидания.

Читать легко: чтение — это не бегство от оригинального текста, а приближение к нему.

Перевод и оригинальный текст — как сок и мякоть: первый тает во рту, а второй сохраняет всю свою волокнистую текстуру. Конечно, легче усваивать информацию на родном языке, но всегда бывают моменты, когда нам хочется приблизиться к исходному тексту и ощутить ритм и текстуру самого языка.

Read Easy предлагает "третий путь": сочетание китайского и английского. Это делает извлечение информации простым, сохраняя связь между нами и исходным текстом – вы можете переключиться в любое время или отметить ключевые слова в исходном тексте. Это не "перевести и уйти", а как бы мост между переводом и исходным текстом, который можно повернуть обратно в любое время.

APPSO: Сейчас многие инструменты соревнуются, кто может «перевести быстрее и больше», но RE сохраняет много английского. Почему вы хотите придерживаться идеи «оставаться в исходном тексте»?

Чжицзе: Из-за разного позиционирования изначально мы позиционировали себя как продукт для изучения английского языка. Во-первых, мы думали, что люди более охотно платят за образовательные продукты, а во-вторых, изучение языка является основным сценарием для ИИ, хотя мы не знали, что конкретно делать в то время. Как мы все знаем, сфера изучения английского языка очень конкурентная, поэтому мы думали, с чего начать. Затем мы обнаружили, что нет продуктов, которые бы особенно хорошо справлялись с чтением на английском языке, поэтому мы думали, есть ли какие-то новые решения. Это привело к последующему дизайну, и, естественно, мы стремились оставаться в исходном тексте.

В процессе позиционирование немного изменилось, потому что я все еще хочу сделать продукт, который я могу использовать сам. В настоящее время это скорее средняя позиция в спектре «получение информации — изучение английского». Мне не нужно сдавать экзамен самому, и изучение английского языка не является жесткой необходимостью, но я все еще надеюсь, что смогу читать больше английского контента. Я думаю, что разница между чтением перевода и чтением оригинального текста похожа на разницу между просмотром фотографии и посещением места происшествия. Посещение места происшествия не обязательно, но это даст вам другие ощущения.

APPSO: Чаще всего люди застревают при чтении из-за незнакомых слов. При разработке функции «Аннотации в тексте» как вы решаете, какие слова следует отметить, а какие следует пропустить?

Чжицзе: В идеале мы можем выделить слова, которые пользователи могут не понимать на основе своего уровня английского языка, чтобы пользователям не приходилось постоянно искать слова, что будет мешать беглости чтения. В других случаях, хотя пользователи могут понимать, если их выделить, это поможет быстро оценить общее содержание предложения визуально, например, отметив имена людей и мест разными цветами.

Что касается функциональной реализации, то в настоящее время она полностью генерируется ИИ, поэтому невозможно полностью контролировать, какие слова аннотируются. В значительной степени ИИ учится, какие слова аннотировать, основываясь на данных для обучения, которые я ему даю.

APPSO: Отмеченные части имеют разные цвета, жирный и нежирный. Эти отметки не все открыты для пользователей, но генерируются автоматически. Какое соображение стоит за этим?

Чжицзе: На самом деле, в начале разработки я хотел позволить пользователям настраивать визуальный стиль. Для этой цели я разработал «язык разметки», похожий на Markdown. Сам Markdown не заботится о визуальном стиле. Визуальное представление реализуется самим программным обеспечением. Однако из-за ограниченных возможностей запись для настройки стиля не была добавлена ​​в продукт.

Текущий визуальный стиль по умолчанию определяется после ограниченных попыток. Он недостаточно хорош, но в принципе может использовать цвета для различения разных визуальных уровней.

APPSO: Не нарушит ли форма аннотаций ритм чтения? Как вы балансируете весь процесс чтения?

Чжицзе: Если английский пользователя очень хорош, аннотации действительно могут мешать чтению, как и когда мы читаем по-китайски, нам не нужны эти пометки. Но для людей вроде меня, которые немного владеют английским, но все еще испытывают трудности с чтением на иностранных языках, аннотации полезны. Люди с нормальным зрением будут чувствовать головокружение, когда наденут близорукие очки, но очки могут заставить близоруких людей видеть более четко.

APPSO: «Смешанный китайский и английский» — очень смелый дизайн. Первая реакция многих людей: «Это все еще приемлемо?» — Как вы вообще пришли к этой идее? Есть ли какая-то конкретная сцена или читательский опыт, которые послужили толчком к вдохновению?

Чжицзе: Когда я создаю продукт, мне нравится перечислять различные возможности. Это осознанное мышление. Например, могу ли я переписать оригинальное английское предложение, изменить сложное предложение на простое или могу ли я добавить некоторые взаимодействия или даже сгенерировать картинку. Смешение китайского и английского — одна из возможностей. Поскольку это просто разработать, я сделал это первым.

APPSO: Каковы преимущества этого дизайна? Он проще или может лучше сохранять семантический уровень? Беспокоитесь ли вы, что он заставит людей полагаться на свой родной язык и не захотят понимать исходное предложение?

Чжицзе: Я думаю, преимущество в том, что это позволяет пользователям быстро понять параграф на родном языке и немного выучить английский из разбросанных слов. В вышеупомянутом спектре позиционирования «получение информации — изучение английского» функция смешивания китайского и английского будет ближе к конечной точке получения информации.

То, что пользователь хочет сделать и готов ли он понимать исходное предложение, не определяется продуктом. У пользователя всегда есть право выбора. Даже если продукт не предоставляет перевод, он может использовать другие продукты, если он хочет увидеть перевод. RE предоставляет возможность сделать чтение на английском языке более легким для тех, кто готов читать исходный текст. Было бы лучше, если бы больше людей могли присоединиться, но если нет, то это нельзя заставить. Даже если человек готов читать исходный текст, он не хочет читать исходный текст все время. Когда вы не хотите пить американо, пить латте тоже хорошо.

APPSO: Как это достигается технически?

Чжицзе: Сложности никакой нет. Реализовано это с помощью набора подсказок: «Вы эксперт по языку. Ваша текущая задача — преобразовать абзац текста в смешанный текст с китайским и английским, но при этом сохранить исходный текст неизменным. Цель — позволить пользователям понять смысл абзаца и одновременно выучить английский язык, поэтому, пожалуйста, будьте внимательны, это очень важно…»

APPSO: Действительно ли «сделаем ИИ более серьезным» что-то изменит? (Смеется)

Чжицзе: Я не тестировал это строго, но, основываясь на опыте, это может улучшить стабильность. Без этих трюков один из десяти элементов обработки может пойти не так. С этими трюками будет лучше. Раньше я бы написал что-нибудь, чтобы позволить ИИ сделать все возможное.

Para Translation: Появляться только тогда, когда это необходимо

Мгновенный перевод на мобильных устройствах всегда был сложным сценарием: исходная задача не может быть прервана, и в то же время вы хотите получить максимально точный перевод. Многие производители пытаются решить эту глобальную проблему, и решение Para Translation оказалось неожиданно «умным».

Благодаря форме «картинка в картинке» перевод добавляется ко всему процессу чтения. Нужно только плавающее окно, чтобы быстро вызвать перевод, не выпрыгивая с текущей страницы. Никаких прерываний, не нужно переключаться, но он всегда появляется «именно тогда, когда вам это нужно».


APPSO: Как вам впервые пришла в голову идея создания такого инструмента? Связано ли это с вашими собственными привычками?

Daxin: Это правда. Я часто читаю некоторые иностранные социальные сети и форумы, но они все на английском. Каждый раз я либо делаю скриншот, либо копирую текст и перевожу его в инструменте перевода, что очень хлопотно.

В прошлом году мой друг создал глобальный буфер обмена, который использует возможность функции «картинка в картинке» для чтения содержимого буфера обмена без чтения содержимого, выбранного пользователем. Я подумал, что если он может читать содержимое буфера обмена, он также должен иметь возможность отображать текст в буфере обмена. После изучения осуществимости я работал со своей командой разработчиков над созданием удобного инструмента перевода.

APPSO: Какое наибольшее влияние оказало первоначальное переключение? Повлияло ли это на понимание контента? Каковы текущие отзывы пользователей об этом новом инструменте?

Daxin: Это в основном влияет на мой опыт чтения. Для меня, ценящего эффективность, крайне неудобно переключаться туда-сюда каждый раз. Чтение поста занимает больше времени. Я надеюсь добиться того, что когда я вижу пост, я могу закончить его, а затем перейти к следующему.

После создания этого инструмента я обнаружил, что база пользователей охватывает различные отрасли. Есть две особые группы: иностранные студенты и специалисты по внешней торговле. Иностранные студенты часто общаются со своими коллегами, однокурсниками и друзьями, когда они находятся за границей. Пользователям внешней торговли и за рубежом нужно общаться онлайн, но эти инструменты чата обычно не имеют функций перевода или требуют оплаты. Para Translation как раз удовлетворяет этот спрос, и цена относительно дружелюбна.

APPSO: Как выбирается базовая модель? В чем разница между различными моделями?

Daxin: DeepSeek является основным в настоящее время, но основные модели в стране и за рубежом также подключены. После тестирования многих моделей, главным преимуществом DeepSeek является то, что он точнее других. Главным недостатком является то, что он медленный, и я добавлю немного своего собственного понимания после перевода и внесу дополнительную полировку во весь абзац, но это также может быть вызвано тем, что я не полностью отладил его.

Doubao быстрый, но менее точный. Я пробовал его на некоторых англоязычных форумах. Есть некоторые разговорные и локализованные выражения, и он переводит их только дословно. Даже если я использую подсказки для настройки, он не идеален. В настоящее время DeepSeek является основным, но он также поддерживает ручное переключение и выбор пользователями.

APPSO: Дизайн «картинка в картинке» очень интересен. Как вы нашли эту точку входа?

Daxin: Мой друг сделал продукт в прошлом году. Фактически, у самой Apple нет возможности открыть глобальное плавающее окно. Мы преобразуем результаты перевода в видео, отображаем его в режиме «картинка в картинке» и адаптируем его к потоковому выводу, что улучшит общее впечатление.

APPSO: Это очень умный путь.

Daxin: Некоторые из моих друзей-технарей спрашивали, как вы могли придумать такую ​​идею? Но на самом деле, у «картинки в картинке» все еще есть много функциональных ограничений, поэтому мы также сделали много оптимизаций. Например, если переведенный текст слишком длинный, вы можете прокрутить его, нажав кнопку воспроизведения, нажать кнопку «Назад» или «Вперед», чтобы прокрутить вверх и вниз, и записать результаты перевода в буфер обмена, что может помочь пользователям переписать текст одним щелчком.

Я думаю, что взаимодействие Apple стоит изучить каждому дизайнеру. Друзья, которые привыкли к Apple, знают, что можно искать, потянув вниз на рабочем столе. Я также добавил эту привычку к работе в приложение. Вы также можете сразу же войти в совокупный поиск, потянув вниз на домашней странице. Относительно говоря, пользователи начнут быстрее.

На двух страницах добавления больших моделей и настройки стилей, например, когда пользователи выполняют настройку, им нужно заполнить некоторые переменные в поле ввода. Я сослался на инструкции по сочетанию клавиш и разместил их над методом ввода, чтобы пользователи могли добавлять их немедленно, нажав на них.

APPSO: Вы уже упоминали, что ваш английский ограничен, но теперь вы разработали англоязычный инструмент. Исходя из вашего личного опыта, стали ли вы более охотно работать с англоязычным контентом из-за разработки этого продукта?

Daxin: Действительно, я обнаруживаю, что просматриваю иностранные посты на своем телефоне чаще, чем раньше. Раньше я в основном читал на своем компьютере и установил плагин для перевода. Однако приложения на телефоне относительно закрыты, и я не могу использовать инструменты перевода, как компьютеры, но с тех пор, как я разработал этот инструмент, я обнаруживаю, что открываю эти программы, чтобы проверить их перед сном, поэтому я провожу больше времени, просматривая посты на своем телефоне.

APPSO: Вы бы предпочли, чтобы он оставался инструментом, а не брал на себя функцию обучения.

Daxin: Да, это эффективный инструмент. Я надеюсь, что пользователи смогут быстро открывать и использовать его, когда им понадобится перевод. Я надеюсь, что пользователи смогут запускать Para, не замечая этого, в любое время, в любом месте, в любое время.

#Добро пожаловать на официальный публичный аккаунт WeChat iFanr: iFanr (WeChat ID: ifanr), где вам будет представлен еще более интересный контент как можно скорее.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo