摘要:文章提出了一种基于智能网的语音可扩展标记语言(VXML)语音浏览器;介绍了该浏览器的系统结构;给出了VXML标志到INAP消息的映射策略;并以应用服务器(AS)侧发起的语音短信业务流程和网络侧发起的短信重听业务流程为例,描述了VXML语音浏览器功能实体之间的业务流程。文章认为由于社会对声讯、聊天、企业门户等业务的需求不断增加,传统智能网业务生成系统已不能满足用户需要,而VXML适合开发各种交互式语音回应(IVR)业务,可促进智能网业务的发展。
关键词:智能网;业务管理功能;业务管理接入功能;语音可扩展标记语言
Abstract:Avoicebrowserbased on Intelligent Network (IN) and Voice Extensible Markup Language (VXML) is presented. The system architecture and the mapping strategy of VXML tag to Intelligent Network Application Part (INAP) message are analyzed. Taking the service flow of voice mail launched at the side of application server and the service flow of voice mail replay at the network side as examples, the service flows between different function-entities of VXML voice browser are described. With the increasing demand on voice information, chat and enterprise portal services, the traditional IN service generating system cannot meet the needs. But VXML is suitable to develop various interactive voice response services, so it can meet the demands and promote the development of IN services.
Keywords:IN;servicemanagement function; service management access function; VXML
传统的智能网(IN)是叠加在各个承载网上的一层附加网络。通过智能网应用协议(INAP)、移动网络增强定制应用逻辑应用协议(CAP)等协议,智能网的业务控制点(SCP)可以控制电信网完成路由、接续、计费、会议等基本功能,智能网的业务生成环境(SCE)通过组合业务无关的基本功能组件(SIB)搭建出各种各样的增值业务。随着智能网技术的广泛应用,以及社会对个性化业务、网络融合业务的需求,智能网系统本身,尤其是业务生成系统越来越不能满足需要。
1.传统智能网业务生成系统的弊端
智能网业务生成系统的不足和缺陷主要存在以下3个方面:
(1)业务开发
智能网的业务开发环境基于设备厂家私有的SCE,智能网标准体系没有对搭建业务的SIB进行标准化。这样,业务逻辑是和智能网业务平台紧密绑定的,从而使业务开发始终受限于智能网平台的实现方式。同时,业务的开发需要具有很强的电信网络协议知识背景,从而封杀了独立业务提供商和独立业务开发商的生存空间。
(2)业务的可移植性
由于智能网从设计之初就是和承载网络绑定的,与业务逻辑开发和使用的智能网协议紧密相关,因此基于某一种网络的业务很难移植到其他网络环境中。
(3)业务的客户化
业务的客户化是指根据用户的需求,随时改变业务的行为。传统的智能网技术很难满足用户对业务客户化和个性化的各种需求。
因此,传统的智能网业务开发和运营模式造成了电信增值业务种类的单一,寻求新的业务开发模式和新的业务增长点是业界专家们关心的话题。
2.电话增值业务的新增长点
随着信息技术的发展和普及,电话不再是人们仅仅用来进行语音通信的工具,人们希望通过它获得更多的信息;另一方面,互联网上有大量的内容和信息需要通过电话终端呈现。由于电信运营商有大量的空闲电话网络,需要利用闲置资源来提升话务量和服务质量,因而,语音互联网,一种具有代表性的内容服务业务应运而生。它可以使普通的电话用户使用自然语言通过互联网进行交互,获取相关的信息服务,且不需要特殊的终端;可以将使用互联网的用户扩展到所有的电话用户,有效地刺激话务量的增长。基于万维网联盟(W3C)可扩展标记语言(XML)的语音可扩展标记语(VXML)就是专门为开发此类业务而设计的一门语言。
3.语音可扩展标记语言
VXML的结构模型[1]如图1所示。
VXML的结构模型包含以下组件:
(1)文件服务器(即Web服务器)存放VXML脚本,保存应用程序的服务逻辑,并提供数据库查询与其他系统的操作功能,能够接收VXML编译器的请求,根据请求的内容以动态生成的VXML文档作为回应;
(2)VXML编译器负责解释VXML文档,引导和控制用户与执行平台之间的交互作用;
(3)执行平台根据编译器环境的指令,完成和用户的交互。
和Web浏览器类似,VXML编译器环境和执行平台构成了一个语音浏览器。
VXML2.0规范中定义的功能包括:合成语音输出功能、文语转换功能、语音文件输出功能、语音识别功能、识别双音多频(DTMF)输入功能、录音功能、简单的电话控制功能(如呼叫转移)。从VXML的功能可以看出,VXML适合开发各种交互式语音回应(IVR)业务,如声讯类业务类业务、聊天类业务、企业门户业务等。
4.基于智能网的VXML语音浏览器
4.1基于智能网的语音浏览器系统结构
图2是基于智能网的VXML语音浏览器的系统结构图。整个系统由处于非电信域的应用服务器(AS)和电信网域的开放智能网系统构成。和传统的业务商业模式相比,智能网的VXML语音浏览器的业务(业务数据和业务逻辑)位于电信域之外的应用服务器上。在非电信域,应用服务器上的业务流程由VXML脚本描述,业务数据则存放在应用服务器的数据库上。
在图2中,在智能网体系中增加了一些新的设备和功能实体来实现开放,新增的设备就是智能网网关,这是智能网实施对外开放功能必须增加的功能实体(这样不仅实现了消息转换功能,同时对非法的业务请求,消耗的只是智能网网关的计算时间和资源,不会对智能网和电信网络造成影响)。
智能网网关的定义如下:智能网网关是智能网的外部扩展服务器。它是智能网系统中逻辑上的功能实体,其功能是可设计和可扩展的。它将智能网的能力抽象为对外一致的可编程接口供第三方开发电信业务时简单调用。对AS来说,智能网网关就是一台能力服务器,对智能网侧来说,它将各种应用的协议或者数据转换成智能网能够识别的协议或者相反。智能网网关中包含两类基本的功能实体,分别是VXML解释能力服务器和智能网业务管理功能(SMF)实体。从用户数据管理的角度讲,智能网网关可被视为一个Web服务器,提供Web模式数据管理功能,将智能网业务管理访问功能(SMAF)以Web界面的形式呈现,允许用户通过Web方式管理和调整自己的用户文件。
4.1.1VXML解析器和执行平台的实现
和前面VXML的体系结构相对比,智能网网关可视为VXML的解释器环境,它实现对VXML的解释,将其转换成SCP能够识别的消息。而VXML体系结构中的执行功能由智能网中的SCP和IP来完成。SCP和IP之间通过用户交互描述(UIScript)机制进行消息交互。在VXML业务执行中,SCP根据VXML业务的流程(此流程经过了VXML解释器的翻译),控制业务交换点(SSP)进行接续、路由等与被叫用户的连接。当业务需要IP资源时,IP接受来自SCP的命令,实现VXML脚本中需要的和用户交互的功能任务,如播放提示音、执行文本转语音(TTS)、自动语音识别(ASR)功能等,并收集用户的响应信息(语音或字符输入)。IP负责生成一些事件,响应用户操作和系统事件(如定时器到期)。IP上的资源完全具备标准的VXML2.0要求的资源功能。因此,SCP和IP是一个天然的VXML执行平台。
4.1.2扩展的VXML功能
作为一种开放业务生成语言,适合业务部署和具有商业目的的附加功能尤为重要,如安全接入、业务管理功能等。然而VXML语义中未定义管理和第三方发起呼叫的功能,这就有必要通过某种机制来扩展VXML的功能。具体的管理功能包含与业务无关的部分和与业务相关的部分。与业务无关的部分如安全接入管理,包括AS的注册和认证功能等;与业务相关的部分包括业务的注册、业务的计费管理(费率和话单的管理)等。这些扩展功能通过AS和SCP之间协商的扩展VXML消息(VXML支持这种扩展模式)来实现。具体的扩展功能包括:AS的验证、计费策略、AS发起呼叫、AS请求报告等。这些管理功能和智能网的SMF和SMAF完成的功能一致,可将这些功能直接迁移到智能网网关。业务商用时,运营商将SMAF管理终端以Web页面的格式提供给第三方,SP的注册、业务特服号和文档服务器的统一资源定位(URL)地址的对应关系可以通过Web SMAF设置。
4.2VXML标志到INAP消息的映射分析
XML是一种介于计算机和人之间,容易被两者都理解的语言。XML中的标志(TAG)可以根据设计主体要表述的信息和数据的特征来命名,易于人的理解。XML采用结构化的数据结构,使得机器处理时不会产生异义。XML中的TAG是没有语义的。VXML汲取了XML的所有优点,赋予每一个TAG以明确的含义,因此VXML语言是语义化了的XML语言。VXML业务被执行时需要和网络中的实体进行交互。通过智能网的方式实现时,智能网网关中的VXML解释器将VXML语义映射成INAP、CAP、无线智能网(WIN)协议、会话启动协议(SIP)等网络协议。映射的原则和策略为:不是所有的TAG都需要映射到底层协议。语义中用到的和终端用户的交互、连接被叫、释放呼叫等这些需要底层网络解释执行的TAG需要映射,其他为了业务流程顺序执行的TAG只要在SCP上用相应的业务逻辑解释实现就可以了。
4.3业务流程描述
基于智能网的VXML语音浏览器是一种开放业务模式,业务可以由网络侧发起,也可以由应用侧发起。
当业务由AS侧发起时,AS将业务呼叫请求发给智能网网关,在脚本被解释执行之前先进行一些资格认证,消息的传输都通过扩展的VXML脚本来执行解释;智能网网关将解析过的请求发给SCP;SCP根据业务请求,通过SSP建立和被叫用户的连接(此时需要发起呼叫请求[2]来发起业务);在需要资源时连接IP,并通过智能网网关请求业务脚本描述;根据脚本的流程执行业务。图3是AS侧发起业务时的消息流程图。该消息流程图以语音短信业务为例。具体流程为:用户登录网站,在语音短信业务网页上填写短信内容(也可以点播歌曲等),将其发送到指定的用户终端。用户在收听短信时同时收到该短信的编码和密码,以备重听时使用。
当业务由网络侧发起时,用户拨接入号码,智能网的SCP根据业务的配置,将业务提交给智能网网关,智能网网关向对应的URL地址(对应AS的文档服务器)请求业务运行脚本;智能网网关上的解释器解释VXML脚本,并将其转换成SCP能够识别的消息,SCP根据脚本的流程,通过SSP实现连接控制,通过IP实现和用户的交互。在业务运行的过程中,SCP、智能网网关和AS会根据业务的需要进行多次的脚本传输。图4描述了网络侧发起业务时的消息流程图,这个消息流程图以短信重听功能(语音短信业务的功能之一)为例,被叫用户在收到语音短信后,还可以在一段时间内通过拨语音短信业务的接入码,重新收听短信内容。
在业务部署和运行的过程中,AS定时或者实时掌控业务信息(定制费率或者请求话单)等业务控制的主动权由业务的运营者掌握。
5.结束语
VXML的出现为电话语音系统带来全新的应用和开发概念,使语音系统开发人员可以用极其简单的方法实现复杂系统的开发。基于智能网的VXML技术的电话语音系统的实现结合了智能网先进的组网模式、强大的呼叫控制功能、专门的语音资源功能以及VXML技术本身的优点,利用了现有智能网设备能力,减少了设备投资和重复建设,并将VXML强大的业务功能引入到智能网体系中,对于智能网业务的演进[3]起到了很好的促进作用。
6.参考文献
[1]WorldWideWeb Consortium. Voice Extensible Markup Language (VoiceXML) Version 2.0 [S].
[2]ITU-TRecommendationQ.1214. Physical Plane for Intelligent Network Capability Set 2 [S].
[3]王柏.智能网教程[M]. 北京:北京邮电大学出版社, 2000.7.
作者简介:
王晓庆,北京邮电大学计算机科学与技术学院在读博士生,研究方向为下一代网络业务提供技术。张小强,北京邮电大学计算机科学与技术学院在读博士生,研究方向为下一代网络业务提供技术。