06 Апреля 2001 г. Телекоммуникационные порталы с точки зрения компьютерной телефонии (Компьютерная телефония, №1(7), 6 апреля 2001 г) В настоящие время мы переживаем период развития всевозможных
порталов и интегрированных служб. Не хочется быть занудным, но все же давайте
определимся - что такое портал! Портал – это есть место единого доступа к различной
информации с возможностью интеллектуального поиска и большой базой данных. Такое
определение, с той или иной точностью переведенное с английского языка, встречается
в зарубежном интернете повсеместно.
Но порталы бывают разные!
На данный момент можно выделить несколько типов порталов.
Если вести простое перечисление, то это: Web-порталы, голосовые
порталы, мобильные порталы, телекоммуникационные порталы. Давайте по подробнее
остановимся на каждом из них.
Сейчас, наиболее распространенные это Web порталы. Т.е. по
сути своей, это сервера в интернете, собирающие в себе много различной информации,
которая может быть структурирована по различным тематикам. Их можно еще назвать
Интернет порталами!
Чем больше информационных источников нашли владельцы “портала”
и чем большую базу данных имеет “портал”, тем к большему количеству информации
Вы можете получить доступ. Но иногда, в таком количестве можно и запутаться!
А в чем причина? Мне кажется в отсутствии удобно интерфейса доступа к информации
и не совершенству систем поиска.
Интерфейс доступа к такой информации, это Web страничка. Это
клавиатура и монитор компьютера, web терминала, ноутбука. Здорово, когда у вас
всегда под рукой компьютер, с которого Вы всегда можете получить доступ в интернет,
и найти интересующую Вас информацию! А как быть, если компьютера поблизости
нет?
Тут на помощь приходят голосовые порталы. Ну или должны приходить!
Рост пропускной способности интернета и появление такого понятия
как мультимедийный интернет (аудио и видео), в сочетании с беспроводными коммуникаторами,
меняет восприятие возможных способов получения информации. Если раньше, используя
телефон, мы управляли работой с помощью DTMF сигналов и слушали в ответ заранее
записанные промпты (классическое решение Interactive Voice Response), то сейчас,
получив более прогрессивные технологии распознавания и синтеза речи, мы имеем
возможность получать нужную информацию используя более понятную вещь – речь!
Под “голосовым порталом” чаще всего понимают – единый телефонный
номер доступа, позволяющий получать любую интересующую информацию, используя
в качестве интерфейса голос. Т.е. задавая предмет поиска и получая результаты
с помощью голоса. Например: Вы звоните по телефону портала XYZ и спрашиваете
- “информация о слиянии компании Milk&Soft и компании Soft&Milk?”, мощный
сервер преобразует вашу речь в текст и производит соответствующий поиск в базе
данных, после чего успешно начинает читать найденный результат.
С появление более гибких средств получения, а главное ввода
информации, мы можем не ограничиваться только погодой и гороскопами, а пойти
дальше, и получать содержимое WEB сайтов. Представьте пример, когда Вы читаете
свои любимы новости мобильной связи “Сотовик” по мобильному телефону, предварительно
сказав в трубку – “Сотовик пожалуйста!” Голосовые порталы могут быть интегрированы
с WEB сайтами, т.е. все что вы можете увидеть на WEB сайте компании, вы можете
прослушать с телефона. Это только один из частных случаев реализации голосовых
порталов.
Интеграция порождает новые услуги.
Например аренда голосовых порталов. Т.е. когда компания арендует
телефонный номер у оператора, а оператор, используя свое оборудование и каналы
связи, зачитывает содержимое WEB сайта клиента. Если раньше операторы сдавали
в аренду классические системы IVR, то сейчас это может не устроить многих клиентов.
И тем более, в условиях, когда в последние годы, стоимость “любого” трафика
значительно упала, и достигла уровня минимальных заработков, классическим телекомам
стоит задуматься об увеличении потока звонков, и привлечении новых клиентов
именно к своей сети связи, за счет предоставления дополнительных услуг, например
организации бесплатных голосовых порталов. Появляются такие термины как “телеком
хостирование” – предоставление не только Интернет каналов, но и телефонных коммуникаций.
Хороший пример незаменимости голосовых порталов - это возможность
узнать данные, нужные и актуальные только для вас, в конкретный момент времени
в конкретном месте.
“Вы едете на машине, GPS приемник, встроенный в машину, передает
информацию голосовому порталу о Вашем местоположении, система делает соответствующий
запрос в базу данных и выдает информацию о пробках, погоде, ближайших магазинах
именно для Вас!” Причем Вам не надо отвлекаться от дороги, смотреть на монитор
и гадать когда же надо повернуть на право! Вы просто говорите – “маршрут до
City-банка”, и бортовой компьютер озвучивает самую актуальную информацию о проезде,
с учетом пробок и аварий.
Но не все так хорошо! Существующие проблемы голосовых порталов
это отсутствие реально работающей технологии распознавания речи (голоса), что
менее актуально для запада, и резко актуально для России; не совершенство технологии
преобразования текста в речь (TTS Text To Speech); отсутствие стандартов на
преобразования Web страниц в речь.
Корпорация Dialogic предлагает ряд плат для непрерывного распознавания
речи (CSP Continues Speech Processing), позволяющих распознавать слитную речь,
но их возможности еще далеки от совершенства, да и даже если распознавание английской
речи происходило бы на приемлемом уровне, то с русским языком – были бы проблемы.
По моим данным, пока нет платформы, позволяющей распознавать слитную речь на
русском языке, с хоть каким то качеством. Представленные Dialogic платы разработаны
совместно с компаниями SpeechWorks и Nuance.
Приблизительный список разработчиков систем ASR & TTS:
CSELT (tehnovoice.cselt.it/main.htm)
Elan (www.elan.fr)
Force Computers (www.forcecomputers.com)
L&H (www.lhsl.com)
Locus Dialog (www.locusdialog.com)
Nuance (www.nuance.com)
Philips (www.speech.be.philips.com)
SpeechWorks (www.speechworks.com)
Syrinx (www.syrinx.com.au)
T-Netix (www.t-netix.com)
Vocalis (www.vocalis.com)
Не совершенство технологии TTS для России наиболее актуально.
Предлагаемые зарубежные решения не могут удовлетворить имеющийся спрос на системы
преобразования текста в речь, т.к. они не учитывают многих специфик русского
языка. В последние время появляются разработки отечественных компаний специализирующихся
на обработке голоса, но и они пока далеки от совершенства. Наличие пусть даже
идеальной технологии формирования речи, требует еще двух важных компонентов:
введение громадной базы данных фонем (или аллофонов) и постоянное обновление
словаря системы, с целью обеспечить правильное расстановку ударений. Серьезно
пока в России этим никто не занимается.
Преобразование информации ориентированной для просмотра на
экране, в вид пригодный для прочтения по телефону это большая часть работы системы
TTS. Точнее это задача предпроцессора текста, каким, например, является web
браузер, преобразующий html код в форматированный вывод текста на экран. Существование
стандарта voiceXML не определяет способа преобразования WEB страниц в пригодные
для прочтения тексты. Данный стандарт описывает общие принципы организации прочтения
и распознавания голосовых команд. Т.е. вы просто добавляете html тэги Test!
и читаете текст между ними. Каждый разработчик решает, как и что исключить из
исходной WEB страницы, что бы она корректно читалась по телефону! Если затрагивать
Российскую специфику наличия множества кодировок текста в интернете, то эта
проблема становиться еще более важной. Кстати преобразования требует не только
содержимое веба, но и e-mail письма.
Давайте на минутку подумаем что все эти проблемы не существуют
и перейдем к возможным применениям голосовых порталов.
Какие сегменты рынка будут пользоваться и платить за пользование
голосовыми порталами? Какие есть применения этой технологии?
Например:
- Человек едет на работу, и хочет прослушать сводку новостей на сегодня,
или прослушать изменение котировок акций интересующих его компаний.
- Та же ситуация с машиной, и человек прослушивает список запланированных
встреч на сегодня, проверяет свой почтовый ящик. А может и связаться с коллегами
прямо из своей адресной книги. Такой виртуальный секретарь!
- В командировке сотрудники могут использовать голосовые порталы для доступа
к своим голосовым, факсимильным и e-mail сообщениям. Могут найти ближайшей
для него ресторан (особенно актуально в не знакомом городе!), или гостиницу.
- Очень полезна возможность заказа различных видов билетов, причем по оптимально
рассчитанному маршруту. Это могут быть билеты как на самолет или поезд,
так и в кинотеатр или музей!
- Еще одно применение это возможность ведения вас по незнакомому городу.
Правда это работает только при наличии встроенного GPS приемника в вашу
машину!
Вообще, это может быть любой диалог с компьютером который вы
ведете, любая информация доступ к которой вы можете получать через интернет,
может быть доступна через голосовой портал.
Существуют суррогатные порталы где ответная информация записывается
в виде звуковых файлов, а не используя TTS. Можно ли поверить, что такие компании
могут записать например 5000 ресторанов в Москве!? Создание таких служб может
стоить в несколько раз дороже покупки технологии TTS.
Преимущества голосовых порталов над классическими решениями
компьютерной телефонии в том, что при реально работающей системе распознавания
речи, можно превратить сложное, иерархическое меню, в простую и интуитивную
систему навигации. Это позволяет добраться до нужной информации гораздо быстрее.
В случае, когда вы платите за каждую минуту соединения – это особенно актуально.
Можно получать любую информацию находясь в дали от мобильных
средств доступа, например мобильного телефона, ноутбука, Internet – терминала,
и что то же не мало важно, быть занятым при этом другим делом! Например, вести
машину и слушать сводку погоды.
Причем информация может быть представлена любыми типами, в
отличии от классических решений, где было несколько типов данных, например:
цифры, города, курсы и т.д. Использование технологии TTS приводит к отвязыванию
от типа информации и унифицированности ее обработки, и главное получения!
Голосовые порталы – конкуренция с WAP? Не понятно, но учитывая
увеличивающиеся производительности процессоров и увеличение хранилищ данных,
что повлечет за собой решение проблем слитного синтеза и распознавания речи,
то за голосовыми порталами будущее. К моменту решения проблем с распознавание
и синтезом речи, эти проблемы конкуренции с WAP могут сами исчезнуть.
Реальные примеры голосовых порталов на западе – это:
В России, на данный момент существуют только урезанные варианты
голосовых порталов, и скорее представляют собой развитые системы IVR, где для
ввода запроса на интересующую информацию используются DTMF, различные номера
доступа или живой оператор. Кстати если вы делаете голосовой портал, - дайте
мне знать, было бы интересно познакомиться с вашей работой!
По прогнозам аналитической группы Allied
Business Intelligence в США в 2001 году будет создано до 4 миллионов
стационарных голосовых порталов, а в 2005 году их число возрастет до 17 миллионов.
Что касается пользователей мобильных порталов, цифры, соответственно составят
1 миллион в 2001 и свыше 56 миллионов в 2005 году . Количество сайтов, поддерживающих
речевое распознавание в 2001 году составит 2000, а в 2005 превысит 250 000.
Рассмотрение “мобильных порталов” может занять много страниц
текста! Когда я писал эту статью, решил поискать что есть в интернете на тему
“мобильный портал”. И как я был удивлен, когда нашел множество ссылок на два
типа сайтов: ссылки на электронные магазины и второе на сайты – продающие мобильные
средства связи! С моей точки зрения мобильные порталы – это сайты позволяющие
получать доступ к различной информации, конвертирую ее в нужный формат, используя
мобильные устройства связи.
По общему мнению мобильный портал – это еще и сайт с которого
можно отправить SMS в разные сети, но по моему эту функцию можно отнести к телекоммуникационным
порталам. Об этом позже.
Технологии доступа к информации используя мобильные терминалы
(сотовые телефоны) – это WAP, SMS, GPRS. Все эти, и многие другие функции, можно
отнести к услугам сетей третьего поколения. Пока развитие таких услуг не оправдывает
надежды инвесторов. Возможно причина в том, что человеку трудно получать доступ
к информации используя маленькие экраны сотовых телефонов.
Возможно развитие технологий WAP и SMS скорой уйдет в прошлое,
так и не развившись… По некоторым данным, ведущие компании производители сотовых
телефонов, уже ведут тестовые испытания видео-телефонов! Возможно скоро мы перестанем
просто говорить, а будем общаться используя видео. Правда есть ситуации, когда
я например, не хочу что бы меня видели!
Вернувшись на землю, попытаюсь привести пример одного из мобильных
порталов.
Например, компания BeeOnline, предлагает несколько типов доступа
к информации:
- заказ информации на SMS.
- получение информации о месторасположении ближайших объектов, введя текущее
месторасположение.
В будущем у BeeOnline создание унифицированной системы обмена
сообщениями, и кросс доступа к сообщениям.
Главным подходом в организации связи становится единообразность
доступа к любой нужной информации, возможность этого доступа с любого удобного
устройства, из любого места, в любое время, что можно обеспечить, сделав “глобальным
коммуникатором” сеть Интернет.
Телекоммуникационные порталы – порталы Unified Messaging! Т.е.
системы позволяющие передавать, принимать и обрабатывать любые типы сообщений.
Возможность делать это используя разные терминалы доступа. В разное время. В
любом месте!
Технологически телекоммуникационный портал представляет собой
специальный сайт, интегрированный с телефонным сервером, поддерживающим технологии
ASR и TTS. Как правило, такие порталы основаны на нескольких серверах, например:
- Сервер компьютерной телефонии
- Сервер базы данных
- Интернет сервер (www, smtp, pop3)
- Хранилище данных.
Наличие разных операционных систем, на таких серверах (Unix
на InterNet серверах, и Windows NT на других) может сильно затруднить интеграцию,
при использовании не стандартных протоколов. Решить эти проблемы можно только
покупкой системы у одного поставщика, который проводит политику полной интеграции
с системами заказчика. Только такая схема работы, позволяет быстро построить
телекоммуникационный портал.
Какие услуги предоставляет своим пользователям такая система:
- Получение сообщений разных типов (e-mail, voice, fax, video, sms)
- Отправка сообщений разных типов (e-mail, voice, fax, video, sms)
- Полный контроль над системой используя web интерфейс
- Предоставление услуг интеллектуальной сети.
- Перенаправление вызовов,
- Свободный телефон,
- Единый номер,
- Уведомление о вызове,
- Поиск абонента и др.
Это далеко не полный список того, что может компьютерная телефония!
Возможности можно значительно расширить при использовании IP-телефонии. Например,
можно предоставлять услугу международного Call центра (центра обработки вызовов).
Представляете, вы звоните по номеру в своей стране, а звонок, в зависимости
от доступности операторов в глобальной виртуальной сети, перенаправляется в
другую точку мира или обрабатывается локально! Учитывая потребность в предоставлении
круглосуточного сервиса, учитывая потребность в все большей доступности услуг
и информации – такой сервис может стать очень популярным! А использование IP
телефонии позволит не сильно увеличить стоимость владения, по отношению к текущим
Call центрам.
Еще один очень хороший пример использования IP телефонии для
web – это возможность организации WEB-телефонов. Не надо разрывать соединение
с интернетом, что бы перезвонить в офис компании или магазин и уточнить сведенья
о товаре. Такие Voice over IP Call центры предлагают уже многие компании. В
России их пока несколько. Например компания Forte-IT (www.forte-it.ru,
www.vpost.ru). Много информации по Unified
Messaging и системам VoIP Call центров Вы можете найти на сайте компании CompTek
(www.comptek.ru)
В пример телекоммуникационного портала, можно привести сайт
WWW.VPOST.RU. Сервер представляет собой средство
доступа к голосовым и факс сообщениям получаемым с телефона. Возможность отправки
различных типов сообщений на различные средства связи. Это:
- Телефон (Voice) – E-mail
- Факс – E-mail
- Web (text) – Телефон (TTS)
- Web (voice) – Телефон
- Web (text) – SMS
- Web (text) – Пейджер.
Это не все возможные функции портала. С технической точки зрения
доступны еще такие интересные услуги как чтение e-mail сообщений и ответ на
них, организация услуг интеллекуальной сети (переадресация вызовов, свободный
телефон, другие), работы с SMS сообщениями, наличие системы кросс доступа к
сообщениям, ведение личного ассистента!
Так как портал vpost.ru работает полностью бесплатно, то введение
полного спектра доступных услуг представляется экономически не выгодным, и не
планируется. Но с развитием интереса провайдеров услуг связи к системам Unified
Messaging, возможность появления полнофункциональных порталов, все ближе и ближе.
Многие компании операторы интересуются установкой таких систем на своих сетях
связи и успешно начинают внедрять их у себя. (Если у Вас есть вопросы по таким
системам, вы можете уточнить их у меня!)
В планах vpost.ru превращение портала в “голосовой” портал!
Слабое развитие технологий пока не позволяет этого сделать, но возможно в ближайшие
месяцы такой прорыв произайдет!
Немного статистики: сейчас портал насчитывает более 40
тысяч пользователей, ежедневно его посещают тысячи человек. На портал работает
всего несколько человек и его обслуживает 4 сервера, используемые для различных
целей.
Большой потенциал для развития телекоммуникационных порталов
имеют компании с существующей инфраструктурой телефонной сети и интернет. Очень
трудно оценить степень затрат на создание таких порталов, и оценить эффективность
отдачи от таких услуг, но понятно, что в ближайшем будущем, без предоставления
такого пакета возможностей, компания оператор связи не сможет увеличивать свою
абонентскую базу и получать хорошие прибыли!

Схема построения vpost.ru (телекоммуникационного порталаб Unified Messaging)

Схема получения e-mail сообщений по телефону.

Статистика vpost.ru по популярности серверов:
|