Для чего еще используют акустические отпечатки

Моя цель - предложение широкого ассортимента товаров и услуг на постоянно высоком качестве обслуживания по самым выгодным ценам.

Смотрим на use-кейсы помимо распознавания музыки. Это — персонализированные плейлисты и возможность повторно пережить концерт любимой группы.

Фотография: Immo Wegmann. Источник: Unsplash.com
Фотография: Immo Wegmann. Источник: Unsplash.com

Что такое акустический отпечаток

Это — способ представления аудиозаписи в компактном виде. По сути, отпечаток содержит набор значений, описывающих физические параметры звука.

Есть разные подходы к формированию таких отпечатков. В большинстве случаев они подразумевают поиск частот с максимальной амплитудой на спектрограмме, но алгоритм определяют разработчики приложений. Существуют и open source решения — например, библиотека для .NET soundfingerprinting, автор которой использовал метод locality-sensitive hashing (LSH) для определения «похожести» отпечатков. Другой пример — фреймворк dejavu, реализующий алгоритм на Python.

С помощью акустических отпечатков можно определить не только музыку, если она играет по радио или в торговом центре, но и насвистанные мелодии. Для этого существует целый класс систем, которые называют query by humming (QbH). В 2020 году такую функциональность своего голосового помощника представили в Google. Аналогичную возможность предлагает сервис распознавания музыки SoundHound (который, кстати, вошел в число музыкальных проектов, вышедших на IPO в прошлом году — подробнее мы рассказывали в прошлом материале).

Распознавание треков — один из самых распространённых кейсов с акустическими отпечатками, но есть и другие.

Персонализация

Акустические отпечатки можно использовать для распознавания эмоций. В прошлом году Spotify запатентовали технологию, которая с помощью микрофонов анализирует интонации в речи, уровень стресса слушателя, определяет пол и примерный возраст. Также она оценивает окружающую обстановку — например, сколько человек находится в помещении, где играет музыка. Технология призвана улучшить рекомендательную систему и работу персонализированных плейлистов.

В целом разработку шведской компании встретили прохладно. Несколько организаций по защите прав потребителей и почти двести исполнителей составили открытое письмо, в котором призвали Spotify отказаться от ее внедрения. В список активистов вошел гитарист Том Морелло из Rise Against the Machine, американский рэпер Талиб Квели, а также солистка панк-рок группы Against Me! Лора Джейн Грейс.

По словам музыкантов, технология определения эмоций создает угрозу приватности слушателей. Аналогичную точку зрения высказал один из резидентов Hacker News в тематическом треде. Другой участник дискуссии отметил, что в таких условиях выходом могут стать курируемые плейлисты и собственные подборки — возможно, даже на физических носителях. В пространство музыкальной культуры как раз возвращаются аудиокассеты и компакт-диски.

В любом случае наличие патента не означает, что компания действительно использует технологию. Многие фирмы патентуют наиболее интересные идеи просто с целью защитить себя в потенциальных судебных разбирательствах.

Работа с видео

Инженеры из Дрексельского университета, кажется, верят в скорое возвращение к привычной жизни и во всю разрабатывают систему, которая позволяет «склеить» десятки видеозаписей, сделанных на концерте. Чтобы синхронизировать ролики, снятые на смартфоны с разных ракурсов, авторы проекта используют акустические отпечатки — они помогают найти «пересекающиеся» моменты.

Фотография: Fábio Alves. Источник: Unsplash.com
Фотография: Fábio Alves. Источник: Unsplash.com

За построение отпечатков отвечает уже упомянутый открытый алгоритм dejavu. Он ищет частотные пики на спектрограмме и вычисляет расстояние между ними, создавая уникальный рисунок. Может, в перспективе подобные технологии, объединенные с возможностями AR и VR, позволят снова и снова погружаться в атмосферу прошлых выступлений.


Дополнительное чтение — в нашем мире «Hi-Fi»:

  • Что может быть общего у поп-музыки и пения птиц

  • Humming-эффект: иногда достаточно напевать, пока занимаешься делом

  • «Плейлистификация»: нужна ли она слушателям?


Больше материалов в нашем блоге на Хабре:

  • Парочка простых онлайн-секвенсоров для начинающих композиторов

  • Четыре пары примечательных и достаточно доступных наушников

  • Сможет ли технология data-over-audio заменить QR-коды


Источник: https://habr.com/ru/company/audiomania/blog/652465/


Интересные статьи

Интересные статьи

В 2020 году специалист по квантовой физике Алессандро Бруно и выпускник технологического университета TU Delft Маттейс Райлаарсдам основали компанию QuantWare. Их партнерство не было с...
Мы отрендерили 1 миллион самых популярных страниц веба, фиксируя все мыслимые метрики производительности, записывая все ошибки и замечая все запрошенные URL. Похоже, таким образом мы созд...
В 2019 году люди знакомятся с брендом, выбирают и, что самое главное, ПОКУПАЮТ через интернет. Сегодня практически у любого бизнеса есть свой сайт — от личных блогов, зарабатывающих на рекламе, до инт...
Бизнес-смыслы появились в Битриксе в начале 2016 года, но мало кто понимает, как их правильно использовать для удобной настройки интернет-магазинов.
Общаясь с людьми на конференциях и в комментариях к статьям, мы сталкиваемся со следующим возражением: статический анализ сокращает время на нахождение ошибок, но отнимает время у программистов, ...