Команда исследовательского института Honda во главе с Казухиро Некедаи в Японии (HRI-JP) работают над улучшением обработки и понимания роботами звуков. Робот, точно названный HEARBO (слущающий робот), может разобрать четыре звука (включая голоса) сразу и сказать, откуда они доносятся. Система, названная HARK, может позволить будущим служащим роботам лучше понимать словесные команды на расстоянии нескольких метров.
Система HARK (HRI-JP проверяет роботы с университетом Киото) обрабатывает слышимый шум восемью микрофонами в верхней части робота. Сначала программное обеспечение выбирает звуки, произведенные его 17 двигателями, которые отменены в режиме реального времени в процессе, известном как «подавление собственного шума». После этого обрабатывается оставшееся аудио, применяя звуковой исходный алгоритм локализации, чтобы точно определить происхождение звука в пределах одной степени точности.
«При помощи HARK мы можем сделать запись и визуализировать в режиме реального времени, распознать, кто говорил и из какой комнаты», — объясняет Нэкэдай на веб-сайте HRI-JP. «Мы сейчас в состоянии распознать голос определенного человека в переполненной области или потратить пару минут, чтобы получить информацию о том, кто и что сказал, и, учитывая как мы развиваем технологию — это еще не предел».
В одном эксперименте робот взял продовольственные заказы от четырех человек, говорящих одновременно – и знал, кто что заказал. В другом эксперименте робот играл в игру «камень-ножницы-бумага» с тремя людьми. Каждый человек одновременно сказал или «камень», или «ножницы», или «бумага», и робот смог определить, кто победил. Другие задали роботу распознать различные музыкальные инструменты, которые были использованы в музыке.
HARK представляет всего одну область искусственного интеллекта, известную как прослушивание робота, которая потребуется любому роботу-помощнику в повседневной жизни. По сообщениям, Honda инвестировала больше чем 60 миллионов долларов в свой гуманоидный робот — ASIMO, планируется, что это будет коммерческая версия. Более ранняя работа той же самой команды была применена к последней версии ASIMO, который может понять различные слова, произнесенные тремя людьми одновременно.
В первой видео демонстрации ниже, HEARBO загружен сигналящим будильником, музыкой и человеком, говорящим с ним. Мало того, что он может различить типы звуков — он еще и поворачивает свою голову в направлении звука, который ищет.
Во второй демонстрации робот слушает словесные команды, в то время как играет музыка. Он оценивает темп песни и танцы к ритму, и выполняет «подавление собственного шума».