Поиск:
Партнеры, реклама: |
Универсальный аудио API - попытки и немного теорииАудио сигнал - это такие же данные, как, скажем, текст. Только их нужно уметь прочесть и распознать. Скажем, с текстами всё просто, потому что текст - это и есть символьное представление данных, с которым компьютер (алгоритмы) и работает. А, вот, чтобы компьютер мог работать с аудио сигналами (не в смысле их преобразования, а в смысле их категоризации), аудио данные нужно сначала преобразовать в символьную форму. Символьная форма представления аудио данных - это нечто произвольное. Скажем, элементарное отображение формы волны - это тоже один из типов символьного представления звука. Только этот способ наиболее простой и малоинформативный. Есть и другие, гораздо более информативные способы. Например, спектр (спектрограмма). Какие ещё типы есть? Ну, скажем, из наиболее "понятных" это питч (высота тона), количество ударов в секунду, огибающая энергии спектра, есть и посложнее - коэффициенты косинусного преобразования, zero-crossing rate (частота пересечения нулевой отметки), оценочные характеристики тембра и проч. Эти и многие другие характеристики звуковой волны (сигнала) дополняют друг друга и помогают составить наиболее подробное "описание" звуковой волны. По этому описанию нельзя восстановить звуковую волну, но можно довольно точно её классифицировать. На этом и основаны машинные аудио алгоритмы, сравнивающие, классифицирующие, разыскивающие и проч. К чему я это всё написал? Ну, всё дело в том, что на сегодняшний день поиск и вообще работа с аудио сигналами, как с неким символьным объектом, находится в совершенно зачаточном состоянии. Ну, скажем, на сегодня просто нет ни одного поискового механизма, умеющего сколько-нибудь нормально производить поиск аудио сигналов. Отрасль эта новая, но работы в этом направлении ведутся... Компания Если вам интересно узнать о наработках компании с их API, Я буду рад поделиться с вами своими мыслями более подробно, если эта тема найдёт отклик. Вашими мыслями вы можете делиться в комментариях к заметке.
Читать весь 177-й номер |
№167: Чтиво
№157: Демосцена, трекерная музыка №194: Аудио дизайн №139: Трекерная музыка и не только №198: Чипофон №187: Prosoniq больше не для Windows №143: Аудио-причуды: музыкальные подушки, настенный MP3-плеер; клавиатура для ног и еще кое-что... №199: Демосцена, трекерная музыка - веб-трекер №181: Тактильный ультразвук |
Ниже располагаются комментарии к этой заметке
Пожалуйста, обратите внимание! Если вы хотите что-то сообщить автору WebSound.Ru, лучше сделать это не здесь, а направить ваше сообщение по e-mail. Пожалуйста, составляйте свои комментарии в вежливой форме. Не засоряйте сайт бессодержательными и невежливыми сообщениями.