Вероятно сте виждали приложения, които твърдят, че превеждат това, което казва вашата котка. Но могат ли наистина да преведат мяукането на вашата котка на английски? Краткият отговор е да, нещо като. Трудно е поради това колко уникален е „езикът“ на всяка котка, но те могат да се сближат доста с модерните технологии.

Приложенията за превод на котки като MeowTalk използват форма за разпознаване на реч, която набляга на машинното обучение. Нека погледнем по-отблизо.

Разпознаване на реч и машинно обучение

Мери Тереза ​​Маклин /Pixabay

Разпознаването на реч работи, като записва реч и превръща аудиото в цифров файл с данни. Той кодира данни като височина и обем като точки от данни, които приложението може да анализира и да съчетае със значения. DPA микрофони обяснява, че тези точки от данни могат да изглеждат много различни в зависимост от фоновите звуци и начина на произнасяне на дадена дума.

Понякога приемаме разпознаването на глас за даденост, но това е невероятен подвиг на технологията. Особено като се има предвид колко сложна е човешката реч. Като

instagram viewer
Ученият обяснява, всяка дума включва широк спектър от звуци или "фонеми", смесени една в друга. Получаването на компютър за разбиране на речта е много трудно. Новата граница на котешките звуци ще бъде още по-трудна.

Приложенията, които използват разпознаване на реч, са програмирани с „речник“ от думи, наречен набор от данни. След това приложението съпоставя речта ви с най-близката опция в своя речник с данни.

Когато направи грешка, вие я поправяте и тя запазва тези данни за следващия път. Това е част от машинното обучение. По този начин една програма се научава да разпознава речта, дори когато тя не е идентична с набора от данни, с който е започнала.

Свързани: Какво представляват алгоритмите за машинно обучение? Ето как работят

Гласовото разпознаване все още има проблеми, особено с речеви затруднения и акценти. Някои компании са подобряване на машинното обучение за преодоляване на тези проблеми, все пак. С течение на времето машинното обучение може да превърне разпознаването на реч в мощен инструмент.

Така разпознаването на речта работи за хората. Но дали работи за котките?

Разпознаване на реч срещу Разпознаване на мяу

Ариана Суарес /Разпръскване

Първо, трябва да разберем защо превеждането на определен вид мяукане като „гладен съм“ е различно от анализа на човешката реч. Проблемът е най-вече в това, че комуникацията с котки разчита по-силно на невербални сигнали като поза. Друг проблем е липсата на универсален „котешки език“.

Според ASPCA, възрастните диви котки никога не мяукат един на друг, а само на хората. Други изследвания от хуманното общество добавя, че тези звуци "не се появяват във вакуум". Трябва да ги интерпретираме заедно с езика на тялото и други контексти. В много случаи тези тихи сигнали са единствената разлика между мяукането, което означава „гладен съм“, и този, който означава „искам да играя“.

Като добавим към този проблем, няма две котки с един и същ език. Котките разработват персонализирани „езици“ за своите собственици. Те се основават отчасти на имитация на гласа на собственика и отчасти на личността на котката. Две котки не звучат еднакво, дори когато предават едно и също желание или нужда. И така, как речният речник на едно приложение може да се преведе за всички тях?

Гъвкаво машинно обучение за котки

Безплатно за използване звуци /Разпръскване

Въпреки че няколко виртуални асистенти харесват Ото опит да се разбере тон и емоция, разпознаването на речта все още е ужасно при невербални сигнали. Но това не означава, че е невъзможно да се тълкуват.

MeowTalk използва по-гъвкав вид машинно обучение, за да преодолее тези проблеми.

Изтегли: MeowTalk за Android | iOS (Безплатно)

Meowtalk е създаден от Хавиер Санчес, който също е работил в екипа на Alexa. Той си представи приложението като стъпка към интелигентните яки. Тези нашийници биха превърнали котешките звуци в човешка реч, опирайки се на сложни стратегии за машинно обучение, за да помогнат на хората по-добре да разберат и да се грижат за своите котки.

Екипът на MeowTalk компенсира проблемите с уникалността, като създава по-специфични профили за всяка котка. В приложението регистрирате всяка котка поотделно. Наука Норвегия съобщава, че котенцата мяукат по различен начин от възрастните котки, така че приложението също иска рождения ден на котката. Всеки профил генерира уникална мрежа за данни за котката, включваща малко дълбоко обучение в машинното обучение.

Свързани: Дълбоко обучение срещу Машинно обучение срещу AI: Как вървят заедно?

За лексика MeowTalk започва с 10 звукови профила в набора от данни. Всеки от тях има различно значение, като „щастлив“ или „лов“. Когато приложението чуе звук и го обърка, можете или да го коригирате, или да създадете нова интерпретация.

CATSOUNDS данни, събрани от Аквелон

Коригирането казва на приложението да замени основния речник с новия звук.

Например можете да кажете на приложението да съвпада с „Лов“ на къси чуруликания, вместо дълъг ридание. Този вид корекция е по-полезен от добавянето на множество звуци, които да съвпадат с едно, което означава начинът за разпознаване на речта, което би било като да кажете на приложението, че дълго гърмене и кратко цвърче и двете означава "Обаждане на майката".

Машинното обучение в приложенията за разпознаване на реч обикновено се противопоставя на този тип презаписване. Би било като да се опиташ да научиш Siri, че когато казваш „технологичен блог“, наистина имаш предвид „круша“. Но по-гъвкавата форма на машинно обучение, която MeowTalk използва, може да се справи повече с тази корекция лесно.

Създаването на нова интерпретация добавя значение, което преди това не е било кодирано. Например, ако котката ви има конкретно обаждане, когато иска любимата си играчка, можете да добавите „Искам мишката си“ като опция. Това е подобно на добавянето на дума към вашия речник за автоматично коригиране.

Свързани: Как да дефинирате собствените си думи за автоматично коригиране на Android

С течение на времето можете да разработите силно персонализиран речев профил за вашата котка. В крайна сметка може дори да е достатъчно усъвършенстван, за да бъде полезен за домашни любимци или за решаване на поведенчески проблеми. Ако не друго, това помага на собствениците на котки да станат по-внимателни към своите домашни любимци.

Присъдата: Работят ли приложенията за превод на котки?

В крайна сметка „преводът на котки“ все още разчита много на това, че потребителят преподава на приложението как котката им говори. Това вероятно винаги ще бъде така, защото колко уникална е комуникацията на всяка котка.

Но фактът, че машинното обучение стигна толкова далеч, че разработчиците могат дори частично да успеят в това, е невероятен. Машинното обучение и AI напредват с невероятни скорости и нямаме търпение да видим къде отиват по-нататък.

електронна поща
Свързани теми
  • Обяснена технология
  • Учене на език
  • Машинно обучение
За автора
Натали Стюарт (16 статии публикувани)

Натали Стюарт е писател на MakeUseOf. За първи път се интересува от технологиите в колежа и развива страст към писането в медиите в университета. Фокусът на Натали е върху технологиите, които са достъпни и лесни за използване, и тя обича приложенията и устройствата, които улесняват живота на обикновените хора.

Още от Натали Стюарт

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и ексклузивни оферти!

Още една стъпка…!

Моля, потвърдете имейл адреса си в имейла, който току-що ви изпратихме.

.