Amazon выпустили новый плагин Amazon Polly, который позволяет озвучить ваши записи. Финальный аудио-файл может быть воспроизведен напрямую из записи блога или через подкаст с помощью функционала Amazon Pollycast.
Плагин разработан командой AWS и управляется WordPress провайдером WP Engine, опираясь на возможности сервиса перевода текста в речь Polly.
Впервые представленный на мероприятии re:Invent от Amazon еще в ноябре 2016 года, Polly использует технологии машинного обучения для обеспечения более живой речи. К примеру, Polly понимает, что слово «live» может произноситься по-разному в зависимости от его использования. Во фразах «I live in Seattle» и «Live from New York» слово пишется одинаково, однако произносится по-разному. Это означает, что голоса звучат более естественно, чем в случае с другими сервисами перевода текста в речь.
Сервис Polly был запущен с поддержкой 47 мужских и женских голосов и включает в себя 24 языка. С того момента Amazon добавили поддержку корейского языка и еще 5 других языков, сделав Polly доступным во всех регионах AWS.
Возможности технологии также эволюционировали: была добавлена поддержка таких вещей, как шепот, речевое цитирование, эффект тембра, а также сжатие динамического диапазона. Подобные улучшения повлияли и на качество звучания Alexa. По аналогии с Polly, Alexa научилась шептать и менять тональность своего голоса в начале этого года.
Разумеется, запуск WordPress плагина – это далеко не первый раз, когда Polly использовалась для перевода цифрового текста в речь. Сервис всегда позволял превращать любой текст – новостные статьи, записи блога, RSS каналы, PDF-документы и т.д. – в аудио. Однако доступность этой функциональности в виде WordPress плагина значительно расширяет возможности использования этого решения.
Тем не менее, плагин доступен только тем, кто работает с автономными установками WordPress в собственной инфраструктуре или в AWS и требует некоторой конфигурации. Это может усложнить его использование для менее подготовленных типов пользователей. Инструкции приведены в блоге разработчиков Amazon, а также на странице плагина.
После установки плагин делает запросы к Amazon Polly всякий раз, когда пост сохраняется или обновляется.
Наряду с простым чтением постов, Polly позволяет настраивать разные голоса для разных авторов или задавать разные голоса для цитируемого текста – если вы технически продвинуты, т.к. эти опции недоступны в плагине. Пользователи могут выбирать из полного списка голосов Amazon Polly, чтобы озвучивать разных авторов с помощью плагина. Однако выбрать разные голоса при чтении одного материала невозможно.
Для подкастеров плагин включает функцию Pollycast, которая позволяет управлять параметрами iTunes для созданного RSS-канала: категория iTunes, изображение, контактный email, контентный флаг.
Плагин Amazon Polly бесплатный, но сам сервис Polly – нет.
Прайс основан на количестве символов в речевых запросах. Также стоит отметить, что бесплатный тариф AWS позволяет озвучивать до 5 млн символов в месяц в течение первого года с момента начала использования Polly.
Источник: https://techcrunch.com