НА ГЛАВНУЮ НАЗАД
КОМПЬЮТЕРЫ
ПЕРИФЕРИЯ
НОВЫЕ ТЕХНОЛОГИИ
САМОДЕЛ
ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ
ИНТЕРНЕТ
HOMO COMPUTERUS
КОМПЛИТ
КОМПЬЮТЕРНАЯ ГАЗЕТА
     
1 . 2 . 3 . 4 . 5 . 6

SAPI. Речь из буфера обмена

Сергей Бадло (г. Запорожье)

Cегодня хочу вас познакомить с практическим и нестандартным вариантом использования стандартного буфера обмена - в качестве несущей среды для голосового синтеза. И как обычно, для любителей активных действий, создадим и научим говорить системный сервис.

В нынешнюю компьютерную эпоху все чаще люди читают на ходу, выкраивая свободную минутку, находясь в транспорте или у компьютера и мало кого уже можно удивить аудиокнигами. Их преимущества перед традиционным чтением текста с бумаги очевидно: вы не напрягаете свое зрение, экономите время и деньги, которые ушли-бы на посещение библиотеки и свободны в движении, если скинуть их на плеер (флэшку) или в мобильник. В большинстве своем аудиокниги озвучиваются живыми людьми и с восприятием проблем, как правило, не возникает. Но вот незадача: текстов очень много и аудиокниги начитать по всем физически нереально. Альтернативой в подобных ситуациях, скажет "опытный читатель", является использование речевых синтезаторов текста. Все верно. Эти синтезаторы текста позволят вам либо начитать аудиокнигу в виде файла MP3 или WAV, который вы можете прослушать потом, либо читать в реальном времени. Как правило, все существующие на данный момент "читалки" имеют визуальный интерфейс, в котором еще нужно совершить "определенные телодвижения" чтоб зазвучала ваша книга. Но "лень - двигатель прогресса". Всегда хочется чего-то проще, например: скопировал в буфер обмена текст и пошла его озвучка...

Краткий экскурс...
Чтобы ваш ПК/КПК смог заговорить, прежде всего, нужен сам синтезатор, выполняющий преобразование текстовой информации из файла в речь и имеющий некий интерфейс управления для взаимодействия с различными прикладными программами. Поскольку, на данный момент уже существует множество речевых продуктов, таких как Nuance, Sakrament TTS Engine, L&H TTS3000 Russian, то для унификации интерфейса компанией Microsoft был предложен, ставший уже де-факто (достаточно вспомнить Microsoft Agent), так называемый стандарт SAPI (Speech Application Programming Interface) под платформу Windows. Вот с ней-то мы и будем взаимодействовать.
Предпосылки реализации ПО. Существующие решения
Речевые движки интересующих нас языков (русский, английский, немецкий и т.д.) созданы практически под все виды платформ Windows. Например, под Windows 2000 по умолчанию идет SAPI 4.0, а Windows XP полностью поддерживает SAPI 5.1. Их современные версии позволяют читать текст любым голосом, для которого есть аллофонная база, хоть голосом ребенка или терминатора.