реклама
Наскоро работех върху история с участието на човек, който направи телефонен разговор, който беше записан. По-късно този човек отказа да признае, че изобщо е осъществил обаждането.
Със записания глас от телефонното обаждане и клип на лицето, отричащо обвинението, аз започнах да работя, опитвайки се да намеря начин да докажа, че гласовете са едно и също.
Признавам, че съм малко обсебен от гласовите технологии. Ето защо чаках Google Voice Как да използвате Google Voice за блог през телефона Прочетете още да станем по-напреднали с технологията си за разпознаване на глас и затова обичам приложенията за гласово управление на компютър като Тазти Активирайте контрол на речта към текст и глас чрез настройка на разпознаването на реч в WindowsРазпознаването на реч остава по-мощно от Кортана. Той задвижва речта за контрол на текст и глас. Тази статия ще ви покаже какво може да направи разпознаването на реч, как да го настроите, обучите и да го използвате. Прочетете още . Когато обаче става дума за цифрово сравняване на гласове, аз бях на загуба. Вероятно сте виждали онези шпионски филми, при които компютърът може автоматично да идентифицира гласа на известен престъпник само с гласовия печат.
За да бъда честен, след като открих Sonogram Visible Speech, разбрах, че всъщност технологията за гласова спектрограма е понастоящем жизнеспособен начин за твърдо идентифициране на човек само по техния глас.
Разбиране на спектрограма
Ако знаете за химическите изотопи, тогава знаете, че с изотопите химиците могат да идентифицират химическия състав на съединения чрез изолиране на основните елементи и използване на разбивка за идентифициране на отделните компоненти на който и да е смес. По същия начин една аудиоспектрограма разгражда аудио звука до основни честоти. Интересното за човешкия глас е, че никой не говори с една честота. Вашата уста, носните канали и структурата на гласовата ви кутия определят сместа от честоти, които съставят вашия някакъв уникален глас.
Sonogram Visible Speech е безплатно софтуерно приложение за спектрограма, което ще взема видео или аудио файлове и ще се счупи надолу аудио запис в целия спектър - всичките му честоти през целия период от време на следите. Завършена спектрограма изглежда като изображението по-долу.
Както можете да видите, долната песен изглежда като основната звукова вълна, която бихте могли да видите в програма дързост 3 съвета за дързост, за да подобрите записаните си интервютаЯсното аудио е жизненоважно за всеки подкаст или запис, който искате да публикувате. Повишете аудио качеството си с Audacity в три лесни стъпки. Прочетете още , но централният панел показва всеки сегмент от звуковия файл в цялата му честотна подредба. Удивителното при този софтуер е, че има много други форми на вълни, които можете да използвате, за да разгледате вашия звуков файл. Те са специално за напреднали потребители.
Можете да конфигурирате как се показва всяка от тези форми на вълна, като влезете в менюто „Опции“ и изберете „Общи“ Приспособяване. " Тук можете да определите как логаритмичните графики изчисляват продукцията и общата настройка на дисплея на всички налични диаграми.
Ако звукът е доста тих или гласът, който анализирате, е шепот, можете да помислите да използвате логаритмичния дисплей на честотата. Можете да го активирате от менюто „Опции“ и да изберете „Логаритмична честота“. Това донякъде ще „увеличи“ значителните честотни области в спектрограмата.
Това наистина може да помогне да се идентифицират ясни честотни модели, които идентифицират някого по звука на гласа им. Ако сте напълно изгубени и не знаете откъде да започнете, щракнете върху „Помощ“ и отидете на „Онлайн помощ“ ще отвори много добре написаното ръководство за онлайн помощ на Sonogram. Това е чудесно място да започнете, ако сте нов за аудио анализ на спектрограма.
Експеримент със спектрограми, използващи лов на призраци
Красотата на този софтуер е, че той е добър за много различни приложения. Един от артефактите, който се среща често при лов на призраци, е мой личен интерес „Електронен гласов феномен“ - където гласът на привидение или призрак се твърди, че се появява на аудио записи. Тези записи са разпръснати из мрежата, затова реших да извадя няколко от уебсайтовете на ловците на призраци и да направя анализ на спектрограма.
Спектрограмата показва, че честотите на гласа обикновено са ниски, но за да получите по-добра картина на гласовете в записа, трябва да отворите допълнителните вълнови форми. Автокорелационният изглед изчислява „стъпка“ във времевата рамка, в която задръжте мишката.
„Призракът“ е със средна честота на тона от около 129,0 hz. Превъртане до края на записа, където чувате гласа на следователя, изчислената височина честотата е около 208.0 hz (което има смисъл, защото това е женски глас и звуците, които записват призраци мъжки пол.)
Отварянето на дисплея за бърз Фурие разкрива още повече подробности за гласовете. Тази диаграма бързо разбива основните честоти и ги показва в цветен код.
В този случай разбивката на честотите се разпределя отделно, с някои високи, но и добър брой ниски честоти. Въпреки това, следователят в стаята ясно говори с глас, който се групира по честота повече към високия край на обхвата, както е показано тук.
Този бърз анализ доказа, че двата гласа са доста различни, но това е само основен пример за възможностите на този мощен софтуер. По принцип всяка ситуация, при която разбиването на честотите на звукова вълна може да помогне - това е софтуерът за вас. Той е лесен за научаване, бърз за настройка и конфигуриране и работи по-добре или по-добре от всеки софтуер за платена спектрограма на пазара.
Имате ли проекти, които биха могли да използват спектрограма? Опитвали ли сте някога Sonogram Visible Speech? Споделете мнението си в секцията за коментари по-долу.
Райън има бакалавърска степен по електротехника. Работил е 13 години в автоматизацията, 5 години е в ИТ, а сега е инженер на приложения. Бивш управляващ редактор на MakeUseOf, той говори на национални конференции за визуализация на данни и е участвал в националната телевизия и радио.