Как работает программа шазам?

Принцип работы Shazam — статья №4.

Как работает программа шазам?

Как работает Shazam: принцип работы алгоритма по идентификации песен


В первых трех частях (ссылки на них будут под статьей) мы говорили о теоретическом введении в акустику и оцифровку звука, и теперь, наконец, можно поговорить о самом алгоритме идентификации песен. Сразу предупрежу — в этой статье будут использоваться теоретические термины из предыдущих статей без объяснений, дабы не увеличивать и без того объемный материал. Если вам что-то не понятно — прочитайте теорию.

Глобальный обзор

Аудио слепок (автор использует слово fingerprint, что на русский язык переводится как отпечаток пальца, что как-то не звучит и не особо подходит по смыслу, поэтому я заменил его на слепок) представляет собой цифровой «конспект» песни, который может быть использован для идентификации аудио образца или быстрого поиска похожих образцов в базе данных. Например, когда вы напеваете песню, вы создаете ее аудио слепок, потому что вы извлекаете из музыки то, что считаете необходимым (и, если вы хороший певец, другие люди узнают песню).

Прежде чем идти глубже, вот упрощенная схема того, как идентифицирует песню Shazam. Я не работаю в Shazam, так что это всего лишь предположение (из документа 2003 года от соучредителя Shazam):

На стороне сервера:

  • Shazam предварительно вычисляет аудио слепки песен из очень большой базы данных музыкальных треков.
  • Все эти слепки помещаются в базу данных слепков, которая обновляется всякий раз, когда в нее попадает новый слепок песни.

На стороне клиента:

  • Когда пользователь использует Shazam, приложение сначала записывает текущую музыку с помощью микрофона телефона.
  • Телефон применяет тот же алгоритм снятия слепка с песни, что и Shazam при добавлении слепка в свою базу данных.
  • Телефон отправляет аудио слепок в Shazam.
  • Shazam проверяет, совпадает ли этот слепок хотя бы с одним из базы данных:
    • Если нет, он сообщает пользователю, что трек не найден;
    • Если да, то он ищет метаданные, связанные с этим слепком (название песни, URL песни в iTunes, Amazon и т.д.) и возвращает его пользователю.

Ключевыми особенностями алгоритма по снятию слепков в Shazam являются:

  • Устойчивость к шуму/ошибкам:
    • Музыка, записанная телефоном в баре/на открытом воздухе, имеет плохое качество.
    • Из-за неидеальности оконных функций.
    • Из-за дешевого микрофона внутри телефона, который создает шум/искажения.
  • Слепки должны быть неизменными во времени: слепок полной песни должен соответствовать ее 10-секундной записи.
  • Сопоставление слепков должно быть быстрым: кто будет ждать минуты/часы, чтобы получить ответ от Shazam?
  • Отсекать ложные срабатывания: кто хочет получить ответ, который не соответствует правильной песне?

Фильтрация спектров

Звуковые слепки отличаются от стандартных компьютерных контрольных сумм, таких как SSHA или MD5, потому что два разных файла (с точки зрения битов), которые содержат одну и ту же музыку, должны иметь один и тот же аудио слепок. Например, песня в формате ACC 256 Кбит (iTunes) должна давать тот же слепок, что и та же песня в формате 256 Кбит (Amazon), или в формате WMA 128 Кбит (Microsoft). Чтобы решить эту проблему, алгоритмы автоматического снятия слепков используют спектрограмму аудиосигналов для получения слепков.

Я уже говорил вам, для того, чтобы получить спектрограмму цифрового звука, нужно применить БПФ. Для алгоритма снятия аудио слепка нам нужно хорошее частотное разрешение (например, 10.7 Гц), чтобы уменьшить спектральную утечку и иметь хорошее представление о самых важных нотах, играемых внутри песни. В то же время, нам необходимо максимально сократить время вычислений и, следовательно, использовать минимально возможный размер окна. В исследовательской работе Shazam они не объясняют, как они получают спектрограмму, но вот возможное решение:

На стороне сервера (Shazam) звук с частотой дискретизации 44.1 кГц (с CD, MP3 и любых других носителей и форматов) должен переводиться от стерео к моно. Мы можем сделать это, взяв среднее значение левого и правого звукового канала. Перед понижающей дискретизацией нам необходимо отфильтровать частоты выше 5 кГц, чтобы избежать сглаживания звука, и после этого частоту дискретизации можно понизить до 11.025 кГц.

На стороне клиента (телефон) частота дискретизации микрофона, записывающего звук, должна составлять 11.025 кГц.

Затем, в обоих случаях нам нужно применить функцию окна к сигналу (например, окно с 1024 выборками) и провести БПФ для каждых 1024 выборок. Таким образом, каждый БПФ анализирует 0.1 секунду музыки. Это дает нам спектрограмму:

  • От 0 Гц до 5000 Гц;
  • С частотным разрешением 10.7 Гц;
  • 512 возможных частот;
  • Единицу времени в 0.1 секунду.

На этом этапе у нас есть спектрограмма песни. Поскольку Shazam должен работать в условиях шума, сохраняются только самые громкие ноты. Но вы не можете просто брать Х самых громких частот каждые 0.1 секунды. Вот несколько причин этого:

  • В первой части статьи я рассказывал о психоакустических моделях. Человеческим ушам труднее слышать низкий звук ( 2000 Гц). В результате громкость низких частот многих «сырых» песен искусственно увеличивают перед выпуском. Если вы возьмете только самые громкие частоты, вы получите только низкие, и если в двух песнях будет одинаковый барабанный ритм, они могут иметь очень близкую фильтрованную спектрограмму, тогда как в первой песне, к примеру, есть еще и флейты, а во второй — гитары.
  • Мы видели в главе о функциях окна, что, если у вас есть очень мощная частота, другие частоты, близкие к ней, появятся в спектре, тогда как в реальности они не существуют (это происходит из-за спектральной утечки). Нам же нужно уметь брать только настоящую частоту.

Вот простой способ сохранить только самые мощные частоты при одновременном снижении влияния других проблем:

Шаг 1: для каждого результата БПФ вы помещаете 512 бинов в 6 логарифмических диапазонов:

  • Очень низкий звуковой диапазон (от 0 до 10 бина);
  • Низкий звуковой диапазон (от 10 до 20 бина);
  • Средне-низкий звуковой диапазон (от 20 до 40 бина);
  • Средний звуковой диапазон (от 40 до 80 бина);
  • Средне-высокий звуковой диапазон (от 80 до 160 бина);
  • Высокий звуковой диапазон (от 160 до 511 бина).

Шаг 2: для каждой группы вы сохраняете самый сильный бин частот.

Шаг 3: вы вычисляете среднее значение этих 6 мощных бинов.

Шаг 4: вы сохраняете те бины (из этих шести), которые выше этого среднего значения.

Шаг 4 очень важен, потому что у вас может быть:

  • А капелла, где поют только сопрано со средними или средне-высокими частотами.
  • Джаз или рэп, где преобладают только низкие частоты.
  • Другие жанры, где есть только определенные частоты.

И нам явно ненужно поддерживать слабую частоту (относительно других диапазонов) только потому, что она самая громкая в свое диапазоне.

Но этот алгоритм имеет ограничение: в большинстве песен некоторые части очень тихие (например, начало или конец песни). Если вы проанализируете эти части, то вы получите ложные сильные частоты, потому что среднее значение (вычисленное на шаге 3) этих частей очень низкое. Чтобы избежать этого, вместо того, чтобы брать среднее значение из шести диапазонов текущего БПФ (который представляет только 0.1 секунду песни), можно взять среднее значение для самых мощных бинов полной песни.

Резюмируя: применяя этот алгоритм, мы фильтруем спектрограмму песни, чтобы сохранить пики в спектре, которые представляют самые громкие ноты. Чтобы дать вам визуальное представление о том, что такое фильтрация, вот настоящая спектрограмма 14-секундной песни:

Эта картинка взята из исследовательской статьи о Shazam. В этой спектрограмме вы можете видеть, что некоторые частоты более мощные, чем другие. Если вы примените предыдущий алгоритм на этой спектрограмме, то вы получите следующую картину:

Эта картинка представляет собой фильтрованную спектрограмму, где сохраняются только самые сильные частоты предыдущего рисунка. Некоторые части песни тут вообще не имеют частот (например, их нет в промежутке от 4 до 4.5 секунд).

Число частот в отфильтрованной спектрограмме зависит от среднего значения, полученного на шаге 3. Оно так же зависит от количества используемых вами диапазонов (мы использовали шесть, но тут может быть любое другое число).

На этом этапе интенсивность частот бесполезна, поэтому эта спектрограмма может быть смоделирована в виде таблицы с двумя осями, где:

  • Ось Y представляет частоту внутри спектрограммы;
  • Ось X представляет собой время, когда частота возникала в песне.

Эта отфильтрованная спектрограмма не является окончательным слепком песни, но это огромная его часть. В следующей статье мы поговорим о том, как сохраняются аудио слепки, и как происходит сравнение слепка, полученного на телефоне, с аналогичным слепком в базе данных Shazam.

Как пользоваться Shazam на Android

Шазам – это приложение для телефона, которое позволяет узнать любую звучащую песню. Нужен Shazam в случае, когда вы не знаете кто исполнят песню, или название музыкального трека. Узнав исполнителя и название, можно легко найти и скачать понравившееся музыкальное произведение. В нашей публикации вы узнаете как пользоваться шазамом или шазамить на телефоне Android.

Как шазамить музыку со своего телефона

  1. Как работает Shazam?
  2. Как шазамить на Android
  3. Как посмотреть текст песни в Shazam
  4. Как настроить автошазам на Android

Как работает Shazam?

Пользователь Android запускает Shazam, приложение использует микрофон телефона для записи фрагмента музыки, которая играет где-либо. Далее приложение сравнивает полученный фрагмент с облачной базой данных сравнивая и предоставляя информацию о музыке: исполнитель/группа и название песни или трека.

Как шазамить на Android

Shzam для Android — это стороннее приложение которое можно скачать в Google Play.

Одноименная компания была основана в 1999 году, а 6 сентября 2018 года её купила компания Apple.

Как пользоваться Шазамом:

  1. Скачать и установить приложение Shazam (оригинальное приложение от Apple).
  2. Войдите в приложение и нажмите на «Мой Shazam» для создания аккаунта
  3. Далее можно создать аккаунт с помощью Facebook аккаунта или создать через почту (наша рекомендация — введите свою почту gmail)
  4. Завершающим шагом для создания аккаунта в Шазам будет подтверждение — зайдите на почту, и перейдите по ссылке, для подтверждения.
  5. Создав аккаунт вы можете теперь сохранять распознанных музыкальных треков.
  6. Для того, чтобы начать распознвание музыкальной компазиции нажмите на центральную кнопку «Шазамить».
  7. Далее приложение вас попросит разрешить записывать аудио.
  8. После активации кнопки приложение начнет «слушать» играемую музыку благодаря микрофону вашего Android телефона. Общие рекомендации: нужно поднести ближе к источнику музыки или добавить громкость.
  9. В течении нескольких секунд музыка будет распознана, на экране приложение Шазам покажет имя исполнителя и название данного музыкального трека. Также будет указано сколько кроме вас еще шазамили данный трек.
  10. Чтобы прослушать песню полностью вам будет предложено перейти в Google Play Music или Apple Мusic (если данное приложение установлено на вашем Android девайсе.
Читайте также  Какой программой открыть exe файл?

Выполнив идентификацию музыкального трека вы можете узнать сведения об исполнителе, альбоме, тексте песни, клип и похожие исполнители. Если вы любите музыку, то это «mast have» приложение для вашего Android.

Shazam можно назвать музыкальной википедией.

Как посмотреть текст песни в Shazam

  1. После того как приложение распознало музыкальное произведение и артиста.
  2. Нажмите вверху на кнопку «Слова».
  3. Чтобы увидеть полностью текс песни, под первой строкой нажмите «Полный текст».

Также вы можете ознакомиться и с остальными вкладками по подробнее узнать об авторе, видеоклипах, и хитах исполнителя.

Как настроить автошазам на Android

Для удобного и быстрого доступа к Шазам можно настроить автораспознавание музыки сразу после запуска приложения, без необходимости нажимать кнопку «Шазамить», а возможность быстрого доступа заключается в добавление значка автошазам в панель уведомлений на Android.

  1. Откройте приложение Shazam на Android.
  2. Нажмите на «Мой Shazam».
  3. На странице своего профиля нажмите «Настройки» — значок шестеренки.
  4. Далее в настройках активируйте ползунок «Шазамить при запуске».
  5. Чтобы добавить значок в шторку быстрого доступа, сделайте свайп сверху — вниз.
  6. Нажмите на значок карандаша для редактирования шторки быстрых настроек.
  7. В режиме редактирования элементов шторки быстрых настроек добавьте значок «Автозашаза» перетащив его вверх.

Теперь вы сможете быстро управлять включать Шазам, просто делая свайп сверху — вниз и по нажатию на значок «Автошазама» включить или выключить распознавание музыки. Также включать можно на Android даже с экрана блокировки.

Как вы уже поняли Shazam незаменим для меломанов и просто полезен в телефонном «хозяйстве». Так что скачивайте, пользуйтесь и слушайте больше хорошей музыки!

История сервиса Shazam

От распознавания музыки по телефону до интеграции со Snapchat, миллиардной оценки и сделки с Apple.

История приложения Shazam началась в 1999 году, когда два студента Калифорнийского университета в Беркли Крис Бартон и Филипп Ингелбрехт решили создать программу, которая могла бы распознавать музыку. С ними в команде оказались друг Криса Дираж Мукерджи и инженер Эйвери Ванг.

Крис Бартон увлёкся высокими технологиями, когда ему было всего 11 лет. Его мама, преподававшая информатику в университете, принесла домой один из первых персональных компьютеров Sinclair. На нём подросток научился писать простые программы.

Отец Криса — профессор в области ядерной физики — всегда говорил сыну, что главная мечта его детства — изобретать. Бартону понравилась идея создавать что-то новое и он решил, что тоже займётся изобретательством.

Будучи студентом колледжа, Бартон много изучал компьютерные технологии. Молодой человек любил бизнес и всегда хотел соединить два своих увлечения — науку и предпринимательство. Осознание того, что он действительно готов создать свой проект, пришло на первом году обучения по программе MBA в Беркли.

Один из студентов, Скотт Кусирек, который был старше Бартона всего на год, рассказал о старте своего интернет-бизнеса в сфере недвижимости. За несколько лет до этого он оставил карьеру пилота ВВС. Тогда Бартон подумал: если кто-то запустил бизнес после карьеры лётчика, то что мешает ему работать над своим делом?

Бартон решил, что его проект будет связан с мобильными устройствами. В 1998 году у него появился первый телефон. Держа его в руках, молодой человек задумался над изобретениями для устройства, которое люди постоянно носят с собой.

Лето между первым и вторым курсом MBA Бартон провёл в Лондоне на стажировке в Microsoft, там же находился его друг детства Дираж Мукерджи.

Вместе они и проводили мозговые штурмы в местных кафе. Друзья решили, что им нужен ещё один партнёр, и взяли в команду однокурсника Бартона по колледжу — Филиппа Ингелбрехта.

В это время сразу несколько компаний работали над распознаванием музыки, но они делали акцент только на мелодиях, которые играли на радио. Неохваченными оставались песни, которые играли в клубах, кафе, магазинах.

Изначально и Бартон думал только о радиостанциях. Он даже работал над программой звукозаписи для диджеев. Это и были первые шаги по созданию Shazam. Бартон уже остановился на идее создать программу по распознаванию музыки, играющей на радио, когда профессор из бизнес-школы рассказал студентам, что для изобретения действительно инновационного продукта нужно выйти за привычные рамки.

Молодой человек попытался представить: если его приложением будут пользоваться все радиостанции страны, что могут сделать конкуренты, чтобы обойти его? Если кто-то предложит систему по распознаванию звука из любого источника, то программа Бартона окажется не нужна.

Команде Бартона оставалось опередить вымышленных конкурентов и разработать такую программу. Многие профессора в области звуковых технологий говорили им, что это просто невозможно, но Бартону и его партнёрам удалось создать инновационный продукт.

Первое, с чем столкнулись разработчики — это то, что музыка тонет в потоке посторонних шумов и голосов, свойственных любому общественному месту. Предстояло создать кодировщик, который смог бы выделять одни звуки и блокировать другие. На этом этапе к команде присоединился инженер Эйвери Ванг.

Самым продвинутым телефоном в 1999 году был маленький Nokia 8210 с чёрно-белым экраном. Самой сложной операцией, которую совершали тогда мобильные устройства, была установка ринтгтона.

Разработчики поняли, что их алгоритм — это не только технология распознавания музыки, с её помощью можно идентифицировать любой звук: телевизионное шоу, рекламу, фильм. Реализовать это на мобильных устройствах того времени было нереально: уже тогда возможности Shazam были гораздо шире.

Изобретение студенты представили инвесторам. Проект опережал своё время — реализация многих функций была возможна только после появления смартфонов. Тогда, в 2000 году, оставалось ещё три года до выхода iTunes, семь лет до iPhone, восемь — до App Store. В августе 2000 года с помощью инвесторов компании удалось собрать $1 млн. Во втором раунде к этой сумме добавилось ещё $7,5 млн.

Во время запуска Shazam рынок мобильных устройств был развит в Европе и Японии. Там пользователям компания предложила услугу «Премиум SMS», с помощью которой можно было заплатить, например, за рингтон. На этом и рассчитывали зарабатывать разработчики.

В США такая услуга была ещё не доступна. Площадкой для тестирования новой программы стала Великобритания, страна с самым большим количеством музыки на душу населения.

Shazam была запущена в 2002 году. На первом этапе 95% владельцев мобильных телефонов в Великобритании (все, кроме клиентов Virgin Mobile), могли распознать мелодию, позвонив по номеру 2580. Пользователь в течение 30 секунд держал телефон у источника звука, после чего ему приходило сообщение с именем исполнителя и песни.

Если идентификация была невозможна, плата не взималась, если распознание проходило успешно, то со счёта списывалось 50 пенсов. Вскоре появилась новая услуга — покупка рингтонов, связанных с идентифицированными песнями.

Через несколько лет появилась функция неограниченного распознавания звуков для подписчиков за три доллара в месяц. Только появление App Store помогло приложению Shazam стать популярным на весь мир.

Постепенно основатели Shazam покинули компанию, только Эйвори Вонг позже опять присоединился к делу. Крис Бартон в 2003 году ушёл работать в Google, позже — в Dropbox. В том же году Дираж Мукерджи покинул компанию, следующим его местом работы стала организация Save the children.

После он работал в таких компаниях, как Bauer Media, Virgin Money и другие. Филипп Ингелбрехт остался в компании чуть дольше, построил b2b-бизнес и в 2004 году также перешёл в Google, а после занялся новыми стартапами.

В 2004 году система Shazam была запущена в США в сети AT&T. Через три года у компании изменился логотип и дизайн, практически в этом виде он существует до сих пор.

В качестве основного цвета был выбран голубой, который, как отмечают маркетологи, вызывает лояльность и доверие потребителей. Поэтому этот цвет и его оттенки используют многие крупные бренды: Facebook, Skype, Twitter. В 2007 году на сайте Shazam появился список треков, которые мог оценить пользователь.

Основная услуга (набор четырёхзначного номера 2580) оставалась до 2008 года — тогда появилось приложение для iPhone. Программа стала одной из первых в App Store. Это упростило сервис, позволяя запускать iTunes и покупать песню напрямую, если пользователь подключен к Wi-Fi.

Теперь все функции были в приложении, распознать песню стало намного легче. Все теги сохранялись в телефоне — их можно было просмотреть в любой момент. Услуга стала бесплатной, в ней появилась реклама.

Вскоре приложение было запущено на Android. Shazam начал сотрудничать и с другими брендами, расширяя список своих услуг. Например, покупка треков — ежедневно продавалось в среднем около 400 тысяч музыкальных произведений. Артисты могли публиковать для фанатов песни, которые им нравятся, чтобы быть ближе к поклонникам. Также появились опции — тексты песен и ссылки на видео.

К декабрю 2009 года приложение Shazam было установлено десять миллионов раз в 150 странах по всему миру. Около восьми процентов пользователей покупали песню после того, как она была идентифицирована. В январе 2011 года компания Apple объявила, что Shazam находится на четвёртом месте по количеству загрузок среди бесплатных приложений в App Store за всё время существования.

В 2012 году в дополнение к музыке появилось распознавание телевизионных шоу и рекламы. На идентификацию звуков требовались секунды. Программой уже пользовались более 250 млн человек с двумя миллионами активных пользователей в неделю.

Сейчас у приложения есть опция Auto Shazam, которая позволяет обнаруживать музыку непрерывно, даже когда телефон заблокирован.

В качестве одного из бизнес-решений было предложено новое направление, названное «Shazam для брендов». Оно позволяет заинтересованным компаниям рекламировать контент в стиле Shazam, получать доступ к артистам, которые соответствуют их ценностям. Пользователи приобретают скидки, бренды — рекламные возможности, а Shazam зарабатывает.

Shazam интегрировала функции в Snapchat, аудитория которого в среднем достигает 166 млн пользователей в день. Теперь они имеют доступ к контенту Shazam и могут делиться песнями со своими друзьями.

Читайте также  Что означает слово программа?

Пользователи приложения делятся на две категории: одни используют Shazam только по основному назначению — распознать понравившуюся песню. Других больше интересует социальный аспект — смотреть, чем делятся артисты, пользоваться сотрудничеством с брендами.

Семь из десяти пользователей младше 35 лет, 36% — молодёжь от 16 до 24 лет. Более 70% пользователей Shazam говорят, что постоянно подключены к приложению, открыты для тестирования новых продуктов и рекомендуют услуги друзьям и семье. 35% пользователей заявили, что заплатили за скачивание музыки в прошлом месяце.

В 2016 году приложение было загружено один миллиард раз, в среднем насчитывается 120 миллионов активных пользователей в месяц. Каждый день миллионы новых пользователей загружают приложение Shazam.

В ходе последнего раунда финансирования в 2015 году компанию оценили в $1 млрд. Приложение используется в 190 странах мира. В 2016 году доход Shazam составил $54 млн.

12 декабря 2017 года Apple подтвердила покупку компании Shazam за $400 млн.

Как распознать музыку на телефоне, на котором она играет

Наверное, все знают Shazam. Этот супер-сервис для распознавания музыки помог миллионам пользователей определить понравившийся трек, который вдруг заиграл по радио или из стоящей на светофоре машины. Помню, как сам пытался безуспешно найти весёлую песенку из рекламы по трём словам из первого куплета, которые мне на силу удалось расслышать, а потом воспользовался Shazam и наконец успокоился. Такие истории наверняка есть у каждого из нас, а название сервиса уже давно стало именем нарицательным и образовало глагол «шазамить», который вполне прижился в русской речи. Но раньше Shazam не был идеальным сервисом. А теперь, кажется, стал.

Shazam в iOS 14 стал намного удобнее

Моей основной претензией к Shazam всегда была неспособность распознавать трек, звучащий на том же устройстве, на котором установлено приложение. То ли сервис просто не мог одновременно и воспроизводить музыку, и записывать её, то ли разработчики были уверены в том, что если уж пользователь запустил какой-то трек у себя на смартфоне или планшете, значит, он знает и исполнителя, и название композиции, а потому необходимости в распознавании в таком случае попросту нет. Но необходимость, как показывала практика, была, и Apple наконец прислушалась к просьбам пользователей.

Как включить автошазам

С выходом iOS 14 обновление получил и Shazam. В версии 13.25 он научился распознавать треки, звучащие на устройстве с приложением. Во многом эта стало возможно благодаря поддержке функции «картинка-в-картинке». Вот как это работает:

  • Скачайте Shazam себе на iPhone и запустите его;
  • Зажмите кнопку запуска и удерживайте её для включения режима автораспознавания;

Автошазам позволяет распознавать треки в фоновом режиме

  • Покиньте Shazam и запустите на устройстве трек или видео с треком, который хотите распознать (подойдёт любое приложение и даже диктофонная запись);
  • Дождитесь окончания распознавания и найдите трек по предложенной сервисом ссылке на сторонних площадках.

Возможность шазамить треки прямо на устройстве – это очень классное нововведение, которого многим пользователям не хватало очень и очень давно. А тот факт, что Apple прислушалась к их мнению и реализовала соответствующий механизм, заслуживает уважения и самой искренней похвалы. Но, оказывается, автоматическое распознавание можно сделать ещё удобнее, включая его прикосновением к задней крышке вашего iPhone.

Как быстро запускать Шазам

  • Запустите приложение «Быстрые команды» и найдите в поиске команду Shazam;
  • Добавьте её к списку своих быстрых команд;

Быстрая команда Shazam реально ну очень быстрая

  • Перейдите в «Настройки» — «Универсальный доступ» — «Касание»;
  • Включите параметр «Коснуться сзади» и назначьте на этот жест быструю команду Shazam.

iOS 14 устанавливают быстрее iOS 12 и iOS 13. Откуда такой интерес и стоит ли обновляться?

С этого момента, когда вы будете слушать какую-то композицию или смотреть видеоролик, в котором заиграет интересующая вас песня, просто коснитесь дважды задней крышки вашего iPhone. В этот же момент начнётся распознавание трека. Правда, учитывайте, что пока управление прикосновениями к тыльной панели работает не самым лучшим образом, а также поддерживает не все модели iPhone. Поэтому, если вы всё-таки хотите протестировать это нововведение, рекомендую для начала проверить его работоспособность и оценить, подходит реализация именно вам или нет.

Новости, статьи и анонсы публикаций

Свободное общение и обсуждение материалов

Лонгриды для вас

iPad идеально подходит для просмотра телевидения, но есть несколько способов, как это сделать. Нашли приложение, которое лучше всего подходит для просмотра ТВ на iPad и даже iPhone.

Функция Live Text, которая появилась в iOS 15, отвечает за сканирование текста на фотографиях. Однако пользоваться ей можно не только в приложении Фото, но и во многих других. Разбираемся, как именно работает это нововведение

Если ваш Айфон завис на логотипе яблока и не загружается дальше, не спешите бежать в сервисный центр. Мы предлагаем вам несколько рабочих инструкций, которые помогут вернуть смартфон к жизни в домашних условиях

Как работает Shazam

Как работает шазам? Вопрос, интересующий многих пользователей. Действительно, каков принцип работы данного сервиса?

Это программа позволяющая распознавать музыкальные композиции. Для того чтобы запустить его, необходимо нажать на кнопку в появившемся окне приложения. Она запустит сканер, который отправит данные на сервер для распознавания.

То есть принцип работы шазам сервиса таков:

  • изначально была создана база данных с отпечатками музыки;
  • любой пользователь может «отметить» интересующую его композицию, посредством нажатия на кнопку в программе. Искомый отрывок должен длиться не менее 10 секунд;

Логотип Shazam

  • приложение направляет его в сервис, где происходит процесс поиска;
  • если мелодия была найдена, на дисплее мгновенно отображается информация – название, исполнитель, жанр, если же совпадений найдено не было, то приходит уведомление об ошибке.

Это и есть основные принципы работы сервиса.

Для того чтобы шазам работал более эффективно, можно поднести устройство ближе к источнику музыки.

  1. Основа основ
  2. Более подробно об «отпечатках»
  3. Интерфейс сервиса
  4. Что делать если Shazam не работает

Основа основ

Для того чтобы лучше понять, как работает Shazam, необходимо обратиться к самой природе звука. Что происходит, когда человек слышит что-либо? И как вообще выглядит звук? У человека в ухе есть барабанные перепонки, а также слуховые косточки, которые помогают слышать. Звук перемещается волнами по воздуху, и именно когда этот воздух ударяется в перепонки, заставляя и вибрировать, человек слышит. «Удары» воздуха о перепонку возможны только благодаря миллиардам молекул, находящимся постоянно в нем. Звуковая волна, раздающаяся из динамиков (от музыкальных инструментов или иных источников звука) заставляет двигаться эти молекулы в определенном направлении.

Звуковые колебания можно изобразить синусоидной волной, но это будет не совсем верно – на самом деле звуковая волна одной ноты больше похожа на горные пики, а если речь идет о целой музыкальной дорожке или ее отрывка, то это, скорее, дремучий лес с отражением в водной глади. При воспроизведении звука динамик (или любой другой источник звука) движется именно так: быстрыми толчкообразными движениями вперед-назад, что и позволяет человеку услышать звучание.

При чем здесь Shazam? А при том, что вся его работа строится на обладании огромной базы музыкальных фрагментов – «отпечатков». Это короткие сгенерированные образцы звучания того или иного трека, по которым и определяется вся композиция. Но каким образом это связано со звуковыми волнами? Самым прямым: ведь именно на основании этих волн и создается образец.

Более подробно об «отпечатках»

Что такое «отпечатки»? Когда пользователь «отметил» заинтересовавшую его песню, программа генерирует для нее десятисекундный «отпечаток» — образец звука.

Вначале стоит определиться, как вообще выглядит «отпечаток» всей песни. Для этого должны быть определены частоты и их громкость, звучащие в конкретный момент времени, то есть, то самое отражение леса в водной глади должно стать горными пиками. Это возможно благодаря преобразованию Фурье – математическому методу, который буквально раскладывает звуковую волну на набор всех используемых частот и помогает определить громкость каждой из них. К слову, именно громкость выражается теми самыми пиками с различной амплитудой. Shazam работает именно по этому принципу – определяя в какой момент проявляются те или иные частоты и насколько велика их сила (громкость).

Но это лишь первый этап. Как правило, Shazam используется не в студии звукозаписи, а в повседневной жизни, где помимо интересующей мелодии есть еще масса различных звуков. Плюс, не стоит забывать и о расстоянии до источника звука – чем оно больше, тем труднее распознавать многие звуковые волны. Поэтому второй этап – переведение стерео в моно и удаление всех частот свыше 4000-5000 Гц. Эти цифры не случайны – человеческий слух распознает частоты в диапазоне 20 Гц- 20000 Гц, но основная слышимая мелодия, как правило, располагается в диапазоне 100-2000 Гц. Примечательно, что данные цифры применимы к устройству пользователя, однако в самой базе «отпечатков» Shazam все звуковые дорожки обладают частотой дискретизации звука в 44100 Гц на 16 бит.

Что происходит дальше? Если говорить о мелодии целиком, то следующим шагом является построение карты звука – то есть, какие частоты преобладают в конкретный момент времени трека. Но ведь музыкальная композиция может длиться до получаса (если речь идет о классической музыке)! Специально для этого в Shazam используется следующий принцип: привязка конкретных условных точек, отмечающих частоты не ко времени с начала воспроизведения трека, а друг к другу, где определяющим фактором выступает разница во времени между звучанием этих точек. Именно благодаря этому принципу Shazam способен распознавать мелодию всего за 10 секунд.

В эти 10 секунд приложение анализирует звук, выявляет ключевые точки и отправляет их на общий сервер Shazam, где происходит поиск соответствий. Если они найдены – пользователю выдается результат с названием песни и ее исполнителем, текстом, а также возможностью прослушать на удобном ресурсе (или приобрести). Или же, если совпадений не найдено – выдается соответствующее оповещение. Можно подвести краткий итог, как работает Шазам.

Множество композиций хранится в базе данных Shazam, информация регулярно пополняется. Во всех образцах выделяют три основных показателя – частота, время интенсивность. Когда человек начинает искать какую-либо мелодию, сканер генерирует ее в «отпечаток», который складывается из частоты, времени, интенсивности.

Читайте также  Как найти программу в Linux?

Таким образом, песня превращается в частотно-временной график, так называемую спектрограмму, точки которой должны соотнестись с одним из образцов в базе данных. Вот как работает шазам!

Интерфейс сервиса

Программа оформлена в синем тоне. Интерфейс сервиса очень прост. Запустив приложение, на экране мобильного телефона появится окно программы, с единственной большой кнопкой. Нажав на нее, запустится процесс сканирования композиции, на экране при этом появится анимация напоминающая загрузку.

После того, как мелодия отсканирована, информация о ней появится в отдельном окне, внизу которого есть дополнительная информация о трэке.

В приложении есть функция позволяющая поделиться трэком в социальных сетях – «рассказать друзьям».

В меню сохраняется история поиска, который можно просмотреть в любое время.

На официальном сайте разработчика можно зарегистрироваться и войти в личный кабинет, что позволяет просматривать историю поисков, делиться с друзьями понравившимися треками через социальные сети, просматривать хит-парады и рейтинги песен, созданные по поисковым запросам пользователей. Использовать зарегистрированную версию можно и на мобильном устройстве.

Shazam можно использовать и для составления собственного плейлиста благодаря большому выбору различных чартов. Они составляются исходя из данных, полученных от пользователей со всего мира, с конкретных стран или даже городов, могут быть составлены из популярных песен и исполнителей в целом или только в определенном жанре. Это отличная возможность расширить музыкальные горизонты и совершить приятные открытия.

Интересна также возможность установить приложение на ПК, используя создание образа мобильного устройства. Однако стоит сразу отметить, что официально у компании Shazam нет версии для компьютеров, поэтому подобные установки пользователь совершает под свою ответственность.

Как работает шазам мы уже разобрались, но у этой программы есть и другие преимущества:

  • программа способна работать вне сети,
  • интерфейс сервиса удобен и легок в использовании,
  • сервис выдает помимо подробной информации о трэке, еще и текст песни,
  • можно просматривать клипы песен на сервисе YouTube,
  • есть возможность поделиться композицией в социальных сетях.

Особая фишка Shazam – возможность использования функции «автошазам». С ее помощью можно определить все треки, играющие в течение поездки в автомобиле или даже в течение дня. При этом не обязательно держать приложение открытым – функция работает и после сворачивания окна. Результатом станет подборка треков, услышанных за день. Таким образом, выгодные отличия Shazam от конкурентных программ очевидны.

Стоит отметить, что, как и у любой другой программы, у Шазама есть некоторые недостатки. К ним относится:

  • периодические сбои в работе с выдачей результатов, далеких от изначального запроса;
  • случающиеся нарушения работоспособности по неизвестным причинам;
  • на некоторые устройства Шазам просто невозможно установить ввиду отсутствия соответствующей оптимизации;
  • если к устройству подключены наушники, то распознавание проводиться не будет;
  • падение громкости воспроизведения через гарнитуру Bluetooth.

Впрочем, на подавляющем большинстве устройств приложение работает корректно, чего не сказать о других приложениях «как Shazam». Указанные недостатки не сильно влияют на общее впечатление от Шазама, да и его преимущества перевешивают. В любом случае постоянные обновления, оптимизация и расширение возможностей дают надежду на то, что эти минусы в скором времени пропадут безвозвратно.

Что делать если Shazam не работает

В случае некорректной работы шазам, исправить положение можно несколькими способами. Итак, если, при необходимости распознать песню на экране мобильного телефона появляется сообщение – «К сожалению, мы не смогли распознать песню! Убедитесь, что вы держите телефон близко к источнику звука.

Музыка должна быть достаточно громкой, чтобы вы хорошо слышали ее» значит, shazam не работает. Чтобы исправить ситуацию попробуйте перезапустить мобильное устройство. Если это не помогло, попробуйте переустановить приложение. В случае если работоспособность к приложению не вернулась необходимо обратиться в службу поддержки и сообщить о том, что shazam не работает.

Примечательный факт заключается в том, что приложение работает как постоянно развивающаяся нейросеть: если в определенный момент Shazam не смог определить какую-то мелодию, то велика вероятность того, что через определенный промежуток времени мелодия появится в базе, особенно, если на нее поступает много запросов.

Не всегда негативный результат поиска свидетельствует о проблемах приложения или его неработоспособности. Иногда причина кроется лишь в качестве звука: большое количество помех или посторонних шумов (голос, смех, грохот) не дают верно выстроить ключевые точки «отпечатка». Схожая ситуация может возникнуть и в случае со слишком громкой музыкой.

Еще одна причина неработоспособности Shazam кроется не в приложении – если у устройства, записывающего мелодию, есть проблемы с динамиком, то результат будет негативным, по причине невозможности создать верный «отпечаток» проигрываемого трека.

Существуют и другие приложения, имеющие схожий функционал – «как Шазам», но зачастую у них нет настолько обширной библиотеки звуковых «отпечатков». За достаточно продолжительное существование Шазама (официально существует с 1999 года) его библиотека значительно расширилась и постоянно пополняется, а добавление дополнительных возможностей позволяет сохранять популярность.

Согласитесь, действительно полезное приложение для любителей музыки. Теперь, есть возможность быстро найти понравившуюся песню и узнать подробную информацию о ней.

Что такое Shazam? Основные функции и использование программы

С каждым годом всё больше выпускается музыки, но совсем не так много из неё нравится отдельно взятому человеку. Уследить за тенденциями очень сложно, если не заниматься этим сутками, а довольно часто мы слышим в самых разных местах интересные композиции, но как узнать, какая музыка играет?

Ранее ситуация была такова, что спустя месяцы или года попадалась понравившаяся и уже забытая песня, или удавалось узнать из источника автора композиции. В любом случае, процесс наполнения аудиотеки был весьма долгим и иногда мучительным, сегодня же есть Shazam.

Shazam — что за программа?

Shazam помогает найти понравившийся трек на основании его части, более точно 10-и секундного отрывка. Благодаря специальным алгоритмам перед вами покажется название исполнителя и его композиция. Благодаря нехитрой манипуляции вы можете получить всю необходимую информацию здесь и сейчас.

Работает программа для распознавания музыки для Андроид, iPhone и в общем любых других платформах, где существует встроенный динамик и доступ в сеть. Вы абсолютно не ограничены в среде применения приложения, за многие годы работы, оно стало не только кроссплатформенным, но и прибавило множество дополнительных функций.

Изначально Shazam работал по схеме: вы звоните по номеру и включаете отрывок песни, затем вам приходит смс с названием композиции, такая услуга была платная. С того момента утекло много воды и на данный момент программа для распознавания музыки Shazam стала известна во всем мире и даже приобрела собственное выражение «шазамить» — так пользователи называют процесс поиска аудио.

Сейчас приложение умеет не только находить музыку, но и в дополнение к ней показывает вам: ссылку на официальный магазин платформы для загрузки аудио, если доступно изображение, которое содержит официальную обложку альбома. Также, если записан клип, то вы получите ссылку на него. Дополнительно внедрены функции социальной сети, где вы можете общаться с друзьями, видеть ленту их поиска, просматривать рейтинг самых популярных композиций в мире. Конечно, в программе существует история поиска и вы можете её просмотреть, если забыли название мелодии.

Также Shazam умеет синхронизироваться с другими сервисами вроде Spotify или Rdio. Умеет производить поиск по тексту песни.

Shazam, как пользоваться?

Приблизительно принцип работы состоит в следующем: программа записывает 10 сек. трека. Затем загружает его на общий, центральный сервер, где по определённым точкам, используя мощного робота, происходит поиск. Вероятность найти композицию очень высокая, хоть и не 100%. В базе сервиса содержится уже свыше 40 млн песен.

Для успешного применения приложения необходимо иметь доступ к сети интернет, иначе процедура тоже будет выполнена, но по другому принципу. Отрезок запишется, но процесс распознания будет доступен, когда вы получите выход в сеть и просто нажмёте соответствующую кнопку.

Сервис Shazam бесплатен для использования в странах СНГ и нет платной версии. В общем-то существует и коммерческий вариант и единственное его преимущество – это отсутствие рекламы. Увы, но как и у многих бесплатных приложений, у Шазам заработок происходит за счет рекламы.

Использование программы крайне простое и доступно даже самому незадачливому пользователю, от вас требуется:

  • Загрузите само приложение, найти его можно в оф магазине и является бесплатным, для Android https://play.google.com/store/apps/details?id=com.shazam.android&hl=ru;
  • Запустите программу;
  • Нажмите на символ Shazam, круглую кнопку по центру;

  • Поднесите смартфон, планшет или ноутбук к источнику музыки;

  • После 10-и секундной записи вы получите искомую информацию.

Стоит учитывать, что программа довольно умная и может отфильтровать шумы и помехи, если они в небольших количествах. Тем не менее, при большом уровне стороннего шума, найти мелодию не получится, вам потребуется по возможности удалить его или сменить позицию.

Лучше всего сервис работает с широко известными композициями, с англоязычными исполнителями, но вполне неплохо определяет и русские песни.

После удовлетворительного результата вы получите максимальное количество информации об исполнителе и самом произведении, не забыли разработчики и о тексте песни. Также будут представлены ссылки на дополнительные источники, вроде Wikipedia, где описывается история жизни/творчества музыканта, а иногда интересные обстоятельства написания песни.

Существуют и другие сервисы с подобным функционалом, но сравниться с Shazam очень сложно, на сегодня компания имеет капитал в более чем 1 млрд. долларов. Благодаря масштабности корпорации, очевидно, что вероятность успеха поиска становится значительно выше.

Все представленные характеристики и возможности программы делают из неё неоценимого помощника, который облегчит процесс пополнения аудиотеки многократно. Слушайте только лучшие песни вместе с Shazam!

Рейтинг статьи 4.4 / 5. Голосов: 14

Пока нет голосов! Будьте первым, кто оценит этот пост.

Борис Аладышкин/ автор статьи

Приветствую! Я являюсь руководителем данного проекта и занимаюсь его наполнением. Здесь я стараюсь собирать и публиковать максимально полный и интересный контент на темы связанные с современными технологиями и программным обеспечением. Уверен вы найдете для себя немало полезной информации. С уважением, Борис Аладышкин.

Понравилась статья? Поделиться с друзьями:
Itsovet61.ru
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: