Это настоящая проблема: головокружительное число песен появляется в музыкальных онлайн-магазинах ежедневно, а ведь помимо них ещё есть всевозможные потоковые сервисы или архивы. Их их сотни, если не тысячи во всем мире, и как же следить за обновлениями каждый день, ведь те песни должны быть как-то категоризированы. Вот как? Проиграйте ту же самую песню 10 разным людям, и они все могли бы поместить ее в категорию с разным жанром или поджанром. Автоматизированная идентификационная система подборки жанра, разработанная исследователями в Индии, как они сами заявляют, является лучшим ответом на этот вопрос, который только можно дать.
Система, созданная группой во главе с Арджитом Госалем из Института технологий и науки Неотии, зиждется на идее, что музыкальные жанры характеризуются ритмом музыки, степень изменения амплитуды частот, перепадами между громким и более тихим звучанием, а также периодичностью (как или в какой степени в музыке повторяются некоторые фразы). Большинство главных жанров может быть определено анализом всех этих факторов, а потому записи могут быть более легко распределены «по полочкам».
Чтобы проанализировать музыку в плане получения общих характеристик, система разбивает звуковой поток на 88 участков, каждый из которых разделен ещё на меньшие компоненты, для которых затем вычисляется некий параметр, названный «кратковременная среднеквадратическая мощность» (своего рода мера, связанная с напряжением и длиной звуковой волны). При этом в ходе анализа учитываются показатели как отдельно взятого участка, так и среднее число для всей записи.
Вся эта информация учитывается системой для классификации. Исследователи проверили свой метод с тремя классификаторами – многослойным восприятием (MLP), который является искусственной нейронной сетью, состоящей из многократных слоев подобных нейрону компонентов, названных перцептроны; векторными машинами поддержки (SVMs), которые используют электронное изучение и ряд данных; и случайные выборки (RANSAC).