Поиск:
Партнеры, реклама: |
Универсальный аудио API - попытки и немного теорииАудио сигнал - это такие же данные, как, скажем, текст. Только их нужно уметь прочесть и распознать. Скажем, с текстами всё просто, потому что текст - это и есть символьное представление данных, с которым компьютер (алгоритмы) и работает. А, вот, чтобы компьютер мог работать с аудио сигналами (не в смысле их преобразования, а в смысле их категоризации), аудио данные нужно сначала преобразовать в символьную форму. Символьная форма представления аудио данных - это нечто произвольное. Скажем, элементарное отображение формы волны - это тоже один из типов символьного представления звука. Только этот способ наиболее простой и малоинформативный. Есть и другие, гораздо более информативные способы. Например, спектр (спектрограмма). Какие ещё типы есть? Ну, скажем, из наиболее "понятных" это питч (высота тона), количество ударов в секунду, огибающая энергии спектра, есть и посложнее - коэффициенты косинусного преобразования, zero-crossing rate (частота пересечения нулевой отметки), оценочные характеристики тембра и проч. Эти и многие другие характеристики звуковой волны (сигнала) дополняют друг друга и помогают составить наиболее подробное "описание" звуковой волны. По этому описанию нельзя восстановить звуковую волну, но можно довольно точно её классифицировать. На этом и основаны машинные аудио алгоритмы, сравнивающие, классифицирующие, разыскивающие и проч. К чему я это всё написал? Ну, всё дело в том, что на сегодняшний день поиск и вообще работа с аудио сигналами, как с неким символьным объектом, находится в совершенно зачаточном состоянии. Ну, скажем, на сегодня просто нет ни одного поискового механизма, умеющего сколько-нибудь нормально производить поиск аудио сигналов. Отрасль эта новая, но работы в этом направлении ведутся... Компания Если вам интересно узнать о наработках компании с их API, Я буду рад поделиться с вами своими мыслями более подробно, если эта тема найдёт отклик. Вашими мыслями вы можете делиться в комментариях к заметке.
Читать весь 177-й номер |
№166: Apollo - хорошее всегда когда-нибудь заканчивается
№216: Голоса прошлого №187: Новый аудио формат MP3 HD - небольшое расследование №218: 12 канальный вокодер своими руками №180: Настоящие ручки на вашем экране №220: Аудио всячина №200: Обновления ПО №151: Интересные и полезные ссылки №195: Обилие софт-студий для создания музыки |
Ниже располагаются комментарии к этой заметке
Пожалуйста, обратите внимание! Если вы хотите что-то сообщить автору WebSound.Ru, лучше сделать это не здесь, а направить ваше сообщение по e-mail. Пожалуйста, составляйте свои комментарии в вежливой форме. Не засоряйте сайт бессодержательными и невежливыми сообщениями.