隨著城市建設(shè)步伐的加快,城市公共交通也得到了迅速發(fā)展,公交線路越來(lái)越多,極大地方便了市民和外地游客。同時(shí),公交公司也為人們提供了電話(huà)查詢(xún)公交線路的服務(wù)熱線。目前的服務(wù)熱線是人工查詢(xún)和自動(dòng)查詢(xún)2種方式。
在人工查詢(xún)時(shí),時(shí)間長(zhǎng)、效果不好;在自動(dòng)查詢(xún)時(shí),人們根據(jù)語(yǔ)音提示,采用按鍵操作的方式,也要進(jìn)行較長(zhǎng)的時(shí)間才能查詢(xún)完畢。例如:如果您要查詢(xún)"105'路公交車(chē)的運(yùn)行情況,就需要將"1", "0","5"三個(gè)數(shù)字通過(guò)電話(huà)機(jī)進(jìn)行按鍵選擇;如果您要查詢(xún)?nèi)ツ骋粋€(gè)地方的所有公交車(chē)次,那只能通過(guò)人工查詢(xún)了,因?yàn)橥ㄟ^(guò)按鍵是不能實(shí)現(xiàn)這種查詢(xún)服務(wù)的。
伴隨著計(jì)算機(jī)技術(shù)和數(shù)字電子技術(shù)的重大突破性發(fā)展,語(yǔ)音識(shí)別技術(shù)也趨于成熟,尤其是在大詞匯量、非特定的連續(xù)語(yǔ)音識(shí)別方面,取得了重大進(jìn)展,已經(jīng)進(jìn)入到實(shí)用階段[1]。因此,我們提出了采用一種公共語(yǔ)音識(shí)別系統(tǒng)對(duì)原有的服務(wù)熱線進(jìn)行改造的方案。
1 公交線路智能查詢(xún)系統(tǒng)的特點(diǎn)
該公交線路語(yǔ)音查詢(xún)系統(tǒng)包括按鍵查詢(xún)(只包含公交線路查詢(xún))和語(yǔ)音查詢(xún)(含按公交線路查詢(xún)和按城市地點(diǎn)查詢(xún))2部分,其中按鍵查詢(xún)主要為了適應(yīng)老客戶(hù),但系統(tǒng)主體是語(yǔ)音查詢(xún),其特點(diǎn)有:
(1)實(shí)現(xiàn)了交互問(wèn)答式查詢(xún),用戶(hù)只需按系統(tǒng)的提示作出相應(yīng)的回答,便可得到自己所需的信息。
(2)作為系統(tǒng)本身來(lái)說(shuō),實(shí)現(xiàn)了語(yǔ)音識(shí)別的大眾化,任何第一次使用本系統(tǒng)的用戶(hù),不需經(jīng)過(guò)語(yǔ)音訓(xùn)練,便可滿(mǎn)意的得到所需信息。
(3)可統(tǒng)計(jì)系統(tǒng)每天的話(huà)務(wù)量。
2 系統(tǒng)結(jié)構(gòu)與軟件方法
系統(tǒng)[1.2]主要由計(jì)算機(jī)網(wǎng)絡(luò)、人工座席、語(yǔ)音處理及存儲(chǔ)、系統(tǒng)管理(數(shù)據(jù)庫(kù)管理十語(yǔ)音編輯)幾部分組成,如圖1所示。本系統(tǒng)使用了工業(yè)機(jī),性能穩(wěn)定,系統(tǒng)平臺(tái)為Windows NT操作系統(tǒng),其作用是利用計(jì)算機(jī)和數(shù)字語(yǔ)音卡來(lái)處理大量繁雜的電話(huà)業(yè)務(wù),提供開(kāi)放式的公交線路智能查詢(xún)服務(wù),具有速度快、全天候、高效率等特點(diǎn)。
2.1 系統(tǒng)軟硬件平臺(tái)配置和開(kāi)發(fā)工具選擇(按30線配置)
系統(tǒng)的硬件采用工控機(jī),以實(shí)現(xiàn)較高的性能價(jià)格比,而且可以通過(guò)計(jì)算機(jī)集群系統(tǒng)大幅度提高整個(gè)系統(tǒng)的性能。具體是CPU為P4 2.4G以上,內(nèi)存為1G以上,硬盤(pán)為60G以上。
系統(tǒng)的軟件平臺(tái)選擇Windows NT。Windows NT具有良好的圖形管理功能,而且提供了可靠的技術(shù)支持和開(kāi)發(fā)環(huán)境。
語(yǔ)音卡采用D321/641語(yǔ)音卡,該卡在WindowsNT下的開(kāi)發(fā)非常成熟,可以處理各種不同的需求。
D321/641[3]語(yǔ)音卡具有一下特點(diǎn):
(1)集30/60路語(yǔ)音處理和El/2e1(PCM)數(shù)字中繼接口于一體,同時(shí)支持一號(hào)信令(ssl)和數(shù)字一號(hào)信令(Dssl)。
(2)功能強(qiáng)大,性?xún)r(jià)比高,便于用戶(hù)構(gòu)建性能穩(wěn)定、多功能的應(yīng)用系統(tǒng)。
(3)采用全DSP結(jié)構(gòu),處理能力強(qiáng)大,可減輕主機(jī)負(fù)擔(dān),保證高密度、大容量的應(yīng)用系統(tǒng)高效穩(wěn)定地運(yùn)行。同時(shí),DSP技術(shù)便于軟件升級(jí)。
數(shù)據(jù)庫(kù)系統(tǒng)采用SQL Server。SQL Server是Windows NT環(huán)境下比較成熟的數(shù)據(jù)庫(kù)產(chǎn)品,他具有大型數(shù)據(jù)庫(kù)系統(tǒng)的所有特性,而且便于與NT集成管理。
開(kāi)發(fā)工具選擇Visual C++,Visual Basic等。Visual C++功能強(qiáng)大、控制靈活,可以處理各種程序設(shè)計(jì)的需要;Visual Basic編制程序速度快,對(duì)程序設(shè)計(jì)人員要求不高,因此將兩者結(jié)合起來(lái)使用。
|
2.2 軟件設(shè)計(jì)
本系統(tǒng)界面由Visual Basic 6.0編程實(shí)現(xiàn)。以漢字和圖標(biāo)明確顯示其功能,操作簡(jiǎn)單,一目了然,便于值班人員操作和監(jiān)控。
各功能程序由Visual C++編程實(shí)現(xiàn),主要分為:檢測(cè)振鈴事件及接受用戶(hù)語(yǔ)音實(shí)現(xiàn)相應(yīng)的功能調(diào)用;確定進(jìn)入系統(tǒng)后界面菜單的有效狀態(tài)以及檢測(cè)和初始化電話(huà)語(yǔ)音卡;登錄數(shù)據(jù)庫(kù)服務(wù)器。
2.3 數(shù)據(jù)庫(kù)服務(wù)器的設(shè)計(jì)
客戶(hù)/服務(wù)器結(jié)構(gòu)[4]是基于數(shù)據(jù)庫(kù)的應(yīng)用程序廣泛采用的一種結(jié)構(gòu)。他利用了計(jì)算機(jī)系統(tǒng)硬件和軟件分布的不平衡性,把數(shù)據(jù)服務(wù)集中在服務(wù)器端,而識(shí)別客戶(hù)端則專(zhuān)門(mén)負(fù)責(zé)處理應(yīng)用邏輯和界面。這使得程序開(kāi)發(fā)的復(fù)雜性大大降低,同時(shí)識(shí)別客戶(hù)端和識(shí)別服務(wù)器實(shí)時(shí)通信、協(xié)同工作,減少了時(shí)延,保證了較高的識(shí)別效率??蛻?hù)/服務(wù)器結(jié)構(gòu)包括了2個(gè)獨(dú)立的實(shí)
體:識(shí)別客戶(hù)端和識(shí)別服務(wù)器。前者上運(yùn)行的應(yīng)用程序稱(chēng)為"前端"或"前臺(tái)",后者的稱(chēng)為"后端"。也就是說(shuō),服務(wù)器增加了"后端數(shù)據(jù)庫(kù)引擎",電話(huà)接入時(shí),識(shí)別客戶(hù)端接管電話(huà)用戶(hù)的語(yǔ)音輸入,實(shí)時(shí)傳送到識(shí)別服務(wù)器,并把識(shí)別服務(wù)器的識(shí)別結(jié)果向電話(huà)應(yīng)用平臺(tái)層返送,然后進(jìn)行內(nèi)部運(yùn)算查找符合條件的數(shù)據(jù),此時(shí)客戶(hù)機(jī)還可以利用這些閑置時(shí)間處理其他的工作,等到服務(wù)器處理完畢,就會(huì)把所需的數(shù)據(jù)傳遞給前端應(yīng)用程序。
由于客戶(hù)/服務(wù)器結(jié)構(gòu)的前端應(yīng)用程序并不直接對(duì)數(shù)據(jù)庫(kù)進(jìn)行處理,因此利用ODBC作為一個(gè)橋梁幫我們打開(kāi)前端應(yīng)用程序與后端數(shù)據(jù)庫(kù)管理系統(tǒng)的通道,并且由ODBC API提供制式化的控制函數(shù)來(lái)維護(hù)服務(wù)器的數(shù)據(jù)庫(kù)數(shù)據(jù)。
語(yǔ)音合成的處理是通過(guò)邊合成邊播放的策略,避免了由于合成長(zhǎng)文本帶來(lái)的較大的延時(shí)。該系統(tǒng)在分段播放語(yǔ)音時(shí),用戶(hù)的任何打斷都可以中止該次合成任務(wù),免去了無(wú)謂的資源消耗。
3 系統(tǒng)的實(shí)現(xiàn)
本系統(tǒng)在啟動(dòng)時(shí),首先會(huì)訪問(wèn)DataSource.ini文件,從中讀出有關(guān)數(shù)據(jù)庫(kù)信息,若數(shù)據(jù)庫(kù)服務(wù)器的數(shù)據(jù)改動(dòng)時(shí),只需改動(dòng)此文件便可。DataSource.ini文件內(nèi)容如下:
[Source]
namc=flight
[DSN]
name="ODBC ;DSN=flight;UID=flight;PWD=flight'其中:nAME=flight為數(shù)據(jù)源名稱(chēng),DSN為數(shù)據(jù)源名稱(chēng),UID為用戶(hù)ID,PWD為用戶(hù)密碼。
圖2為用戶(hù)通過(guò)語(yǔ)音實(shí)現(xiàn)的自動(dòng)查詢(xún)系統(tǒng)流程圖。
|
4 結(jié) 語(yǔ)
本系統(tǒng)是以通信系統(tǒng)為背景,滿(mǎn)足實(shí)際需要為目的,采用現(xiàn)有成熟的硬件產(chǎn)品與軟件開(kāi)發(fā)相結(jié)合的方法設(shè)計(jì)的一種使用方便、功能完善的語(yǔ)音查詢(xún)系統(tǒng),集成語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù),改變舊的使用電話(huà)按鍵查詢(xún)的使用方式,支持語(yǔ)音輸入,人性化的語(yǔ)音界面使查詢(xún)更便捷、更有親和力,為公交系統(tǒng)的熱線服務(wù)提供了可靠的技術(shù)支持。