У LALAL.AI есть новый алгоритм Кассиопеи, который поразит вас
Разделить разные части песни без фактического стема сложно, но есть инструмент под названием LALAL.AI, который вполне способен справиться с этим процессом. Он разделяет песни между вокалом и инструментальными партиями с минимальными усилиями и без каких-либо навыков звукорежиссера.
И хотя LALAL.AI уже был достаточно солидным, недавно он сделал огромный шаг вперед благодаря внедрению своей новой архитектуры нейронной сети под названием Cassiopeia. Он использует Rocknet, нейронную сеть предыдущего поколения, и делает ее лучше практически во всех отношениях.
Что предлагает Кассиопея LALAL.AI?
Проще говоря: Cassiopeia обеспечивает улучшенные результаты разделения со значительно меньшим количеством звуковых артефактов. Вся цель LALAL.AI состоит в том, чтобы извлекать и отделить вокал и инструменты от трека, поэтому наличие функции, которая может улучшить возможности, – это потрясающе.
![](https://static1.makeuseofimages.com/wordpress/wp-content/uploads/2021/03/lalalai-output.png)
С новой нейронной сетью LALAL.AI потребуется немного больше времени для создания разделенных треков, но это небольшой компромисс для значительного улучшения качества.
Так что по-другому? По сути, Rocknet, который все еще можно использовать на LALAL.AI, учитывает только амплитудную составляющую, игнорируя фазовую составляющую. Более новая нейронная сеть Кассиопеи учитывает фазовую составляющую входного сигнала и генерирует фазу для выходного сигнала. Благодаря этому процессу разделенные дорожки будут содержать меньше звуковых артефактов.
Проще говоря, новый алгоритм углубляется в анализ песни, чтобы создать лучший сплит.
Чтобы доказать, что его сервис работает более эффективно, LALAL.AI протестировал его на Spleeter, OpenUnmix и Extended Unmix. Он также сравнил результаты с собственной нейронной сетью Rocknet. Вы можете просмотреть полные результаты теста в блоге LALAL.AI , но в основном Кассиопея превзошла все остальные в большинстве категорий в различных случайно выбранных жанрах, таких как джаз, софт-рок, поп и так далее.
Интересно, что Rocknet по-прежнему лучше работает на вокальном канале. Кассиопея имеет немного больше проникновения инструментальных средств в вокал. Однако LALAL.AI отметил, что цифры не всегда отражают всю историю, и иногда качество звука может отличаться от того, что показывают тесты.
![](https://static1.makeuseofimages.com/wordpress/wp-content/uploads/2021/03/tZdwTZOfpZ-6hFJZkHfruNPEHu6F081YSSvJy2vP-hZ6i43uXv8D-w-_HapK4VfWrs_KDnx2jcbY8Iqr28EFxiEFZy3xfEAF6dF4KvaSxfqwP1FgeZl6gpjnoUW-Ej1qATiuThPF.png)
Вот что компания заявила по этому поводу:
Хотя Cassiopeia отстает от Rocknet с точки зрения формальных показателей вокала, как инструментальная часть, так и особенно вокальный стержень, разделенный Cassiopeia, звучат намного естественнее и мягче, чем Rocknet, без артефактов металлического звучания, столь характерных для других решений.
Я проверил результаты на себе и обнаружил, что нейронная сеть Кассиопеи действительно привела к более чистому разделению звука. Вокальная дорожка почти не имела заметного проникновения со стороны инструменталов, что именно то, что вы хотите от такого инструмента, как LALAL.AI
С учетом сказанного, результаты Rocknet по-прежнему были довольно хорошими, и их можно было использовать для отделения вокальной дорожки от инструментальной.
Как вы попробуете новую функцию Кассиопеи LALAL.AI?
Если вы хотите испытать новую нейронную сеть, вы можете перейти на LALAL.AI и убедиться, что при загрузке песни установлен флажок « Использовать новый алгоритм» в нижней части экрана.
Вы также можете выбрать уровень агрессии, используемый алгоритмом для разделения треков. Нормальный подходит для большинства треков, но вы можете поэкспериментировать с мягким и агрессивным, чтобы увидеть, что лучше для вас.