科大讯飞与Dialogic合作打造“能听会说”的3G视频应用系统解决方案
面临挑战
随着中国三大通信运营商重组的完成和3G牌照发放的结束,中国通信产业已经进入了3G时代。中国联通、中国移动、中国电信三大电信运营商在迎接发展机遇的同时,也面临着业务应用创新的巨大挑战。在3G时代,业务应用的创新已经成为各大运营商提升盈利能力的重要手段,为了支持多样化业务、多种终端以及设备间的交互,需要3G业务应用系统提供更人性化的交流模式,为用户提供个性化的新体验。在这方面,安徽科大讯飞信息科技股份有限公司(以下简称“科大讯飞”)基于全球领先的智能语音技术与Dialogic公司(以下简称“Dialogic”)合作打造的“能说话且能听懂话”的3G视频应用系统解决方案,为3G应用的普及和发展增添了一股强劲的动力。
成立于1999年的科大讯飞公司是国内最大的智能语音技术提供商,公司主要从事智能语音及语言技术研究、软件及相关产品开发、语音信息服务等业务。公司拥有自主创新的智能语音核心技术,该技术实现了人机语音交互,使人与机器之间的沟通变得像人与人之间的沟通一样顺畅。具体来说,科大讯飞的智能语音技术的核心包括语音合成和语音识别两项世界顶级技术。语音合成技术是让机器能说话,语音识别技术则是让机器能听懂人说话。此外,智能语音技术还包括语音编码、音色转换、口语评测、语音消噪和增强等技术。利用这些技术,未来3G视频应用将通过“语音”来完成指令输入、信息查询、身份识别、信息传递等功能。
智能语音技术在3G应用中将发挥越来越重要的作用。科大讯飞副总裁江涛先生说:“语音是人们交流和获取信息最自然、便捷的手段,利用智能语音技术可有效解决传统电信增值业务中输入不便、动态海量信息难以预录音等问题,应用前景极为广阔。”
对于QoS(Quality of Service,服务质量),系统网关的交换能力和处理能力是关键。科大讯飞高级研发经理黄勇先生说,“我们系统的服务质量要求达到电信级水平,因此我们要求合作伙伴提供的语音板卡等设备必须高度稳定,以避免在处理大量语音或其它媒体数据的时候,造成系统不稳、处理中断、响应缓慢等问题。另外,我们希望设备厂商能提供高效的开发环境,并能够在应用系统开发过程中提供快速、专业的技术支持服务。”
解决方案
科大讯飞基于全球领先的智能语音技术并与Dialogic和合作,采用了其CG及TX系列产品打造了“能听会说”的3G视频系统。该系统可以提供许多3G业务应用,例如:3G视频IVVR(Interactive Voice and Video Response,交互式语音及视频应答)、移动电视、视频点播、网络KTV、语音查询、语音短信等。该系统在结构方面主要包括两大部分:第一部分是媒体网关,第二部分是后台服务。
媒体网关由两类服务器组成:一类服务器选用Dialogic CG语音媒体卡,负责语音媒体信号的接入、处理、转换等工作;另一类服务器选用Dialogic TX 4000信令卡,负责实现通信信道的建立、维护和释放等工作。在基础软件方面,Dialogic 公司提供了功能丰富、高效灵活的 Natural Access 和 Video Access软件系统,作为3G视频应用系统的开发环境。此开发环境提供了大量函数,可以让科大讯飞的技术开发团队开发出各种创新型的3G应用。
后台服务由三类服务器组成,包括媒体服务器、应用服务器以及数据库服务器。媒体服务器存放录制好的视频音频节目供用户点播。此外媒体服务器还提供实时流媒体服务(Real Time Streaming Service),具体服务内容根据用户请求自动生成,如实时话单查询,查询结果通过RTSP 协议(Real Time Streaming Protocol)发送到远端用户的3G手机上。应用服务器用来执行具体的业务服务,应用系统中的流程规划、逻辑控制、业务管理均由应用服务器负责。数据库服务器用于基础数据的管理和应用执行中产生数据的存储。
科大讯飞高级研发经理黄勇先生介绍说:“Dialogic 公司先后为我们提供了数万端口的Dialogic CG6565等型号的多媒体板卡,Video Access软件, 以及TX4000系列信令板卡,未来部署端口数量还会不断攀升。Dialogic CG系列板卡提供16路或更多路T1/E1中继接口,并拥有高密度DSP处理资源,内置IP功能和高速PowerPC处理器。Dialogic公司的TX4000系列产品为各种SS7(Signaling System 7,7号信令系统)应用系统提供了功能强大而灵活的支持,提供的全面灵活的 SS7 信令堆栈 (MTP、ISUP、TUP、SCCP和TCAP)可以支持多达 32 路 SS7 信道。该平台处理容量大,占用主机处理资源少,可以让主机把更多的资源分配给其它应用。在实际的应用过程中,Dialogic CG系列和TX4000系列板卡均表现出了稳定、高效、功能强大等诸多优点,我们对其实际表现十分满意。”
科大讯飞3G视频系统拓扑图
实施效果
目前,科大飞讯采用Dialogic CG及TX系列产品打造的“能听会说”的3G视频系统解决方案已经全面进入市场,并以声动彩铃、音乐搜索、语音搜索等灵活多样的产品形式获得了市场的认可。以声动彩铃为例,这一产品不仅提供了通过简单的语音命令快速完成铃音的检索、下载、分配、赠送等业务操作的便捷手段,还提供了完善的运营分析管理功能,可以让用户获得更为完美的使用体验。根据初步统计,科大讯飞的声动彩铃产品已在三大运营商全面应用。
科大讯飞副总裁江涛先生说:“随着3G市场竞争的加剧,我们基于智能语音技术+ Dialogic产品打造的‘能听会说’的3G视频系统解决方案,可以帮助电信运营商在操作语音化、服务个性化、娱乐多样化等方面实现创新和突破,进而帮助运营商提升在3G市场中的综合竞争能力。”
在发展前景广阔的3G视频应用领域,科大讯飞全球领先的语音技术已经让人机交互成为现实,推动3G视频应用进入了新的时代。其实在金融、教育等多个领域,科大讯飞在语音技术核心研究和产业化方面的突出成就已经引起了各个行业的广泛关注,科大讯飞公司已经成为为“全球中文语音产业的领军企业”。