Социальная сеть «ВКонтакте» вводит расшифровку голосовых сообщений. Нейросеть справится не только с устной речью, но и с шумом на фоне, а в текстовой версии обещаются даже запятые. Это единственный способ не сойти с ума для тех, кому приходится постоянно слушать аудио-послания друзей. Правда, новая технология не спасёт от самых болтливых товарищей.
О новой функции с распознаванием речи 9 июня сообщила пресс-служба «ВКонтакте». Всего несколько недель назад соцсеть замахнулась на ставшие популярными этой весной видеозвонки — без них на самоизоляции было не обойтись. Но сейчас люди постепенно возвращаются к обычной жизни, и слушать голосовые сообщения вновь неудобно.
Для того, чтобы с этим справиться, в ВК появилась расшифровка аудио-сообщений. Достаточно одной кнопки, чтобы преобразовать голос в текст. Воспользоваться новой функцией можно в мобильном приложении, до конца недели она станет доступна всем пользователям. А их много — «ВКонтакте» сообщает, что голосовые посылает больше 30 миллионов человек.
Причём технология справится даже с нечёткой речью и фоновым шумом.
С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания.
Технические специалисты заверили, что для тестов записывали специальные сообщения и в чужую переписку не заглядывали. Что не сильно успокаивает, учитывая, какие талантливые взломщики орудуют в ВК.
Правда, сжульничать и заставить друзей слушать ваш голос проще простого легко. Пока нейросеть сможет обработать только сообщения до 30 секунд. Хотя пользователи и так знают, как обойти любое нововведение — даже если ради лайфхака придётся попилить мем.
Голосовые сообщения не эксклюзивны для ВК, их можно записывать практически во всех мессенджерах. И хотя для многих это раздражающая привычка, иногда текст, наоборот, тянет «оживить» голосом. На фоне тревожных новостей редакция Medialeaks эпично рассказала о своих рабочих буднях -всё с помощью специального бота в Telegram.