軟件需求說明書(有示例).doc
《軟件需求說明書(有示例).doc》由會(huì)員分享,可在線閱讀,更多相關(guān)《軟件需求說明書(有示例).doc(18頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、Windows語音助手軟件規(guī)格說明書(SRS) 青島大學(xué)First Dream Team小組青島大學(xué)Windows語音助手軟件需求說明書 文檔編號(hào):D01版本號(hào):V1.1編寫:_編寫日期:_校對(duì):_校對(duì)日期:_審核:First Dream Team團(tuán)隊(duì)開發(fā)人員批準(zhǔn):_開發(fā)單位:青島大學(xué)First Dream Team團(tuán)隊(duì)項(xiàng)目負(fù)責(zé)人:_ 文檔修改記錄修改人修改時(shí)間版本號(hào)備注*2009-6-20V1.0初次編寫*2008-6-30V1.1調(diào)整需求,重點(diǎn)強(qiáng)調(diào)項(xiàng)目功能需求*2008-7-10V1.3細(xì)化需求,重新調(diào)整文檔結(jié)構(gòu)。*2008-8-1V1.4統(tǒng)一文檔結(jié)構(gòu)。目錄一引言51.1 編寫目的51.2
2、 項(xiàng)目背景51.3 定義51.4 參考資料7二任務(wù)概述82.1語音識(shí)別技術(shù)的起源與發(fā)展前景82.1.1語音識(shí)別技術(shù)簡介82.1.2語音識(shí)別技術(shù)的應(yīng)用92.1.3語音識(shí)別技術(shù)的發(fā)展102.2 功能簡介(目標(biāo))112.3用戶的特點(diǎn)112.4運(yùn)行環(huán)境112.4.1硬件環(huán)境112.4.2軟件環(huán)境122.5 條件與限制122.6假設(shè)與依賴12三大賽項(xiàng)目要求(功能需求)123.1功能需求介紹123.2功能需求實(shí)例圖133.2功能需求流程圖143.2功能一 語音識(shí)別與輸入153.2.1功能說明153.2.2功能描述153.3功能二屏幕取詞153.3.1功能說明153.3.2功能描述153.4功能三語音控制1
3、53.4.1功能說明153.4.2功能描述163.5功能四語音精靈163.5.1功能說明163.5.2功能描述163.6功能五語音朗讀(TTS)163.6.1功能說明163.6.2功能描述16四運(yùn)行要求174.1用戶界面174.2硬件接口174.3軟件接口174.4通信接口(無)18一引言1.1 編寫目的該文檔對(duì)所開發(fā)的Windows語音助手達(dá)到功能、性能、用戶界面及運(yùn)行環(huán)境等作出了詳細(xì)的說明。他作為對(duì)該系統(tǒng)概要設(shè)計(jì)的依據(jù),幫助開發(fā)人員了解本系統(tǒng)的框架思想及實(shí)現(xiàn)功能,并驗(yàn)證核實(shí)該產(chǎn)品能否滿足用戶要求的標(biāo)準(zhǔn),便于技術(shù)文檔和需求變化的管理。同時(shí)也是用戶與開發(fā)人員雙方對(duì)軟件需求取得共同理解的基礎(chǔ)。預(yù)
4、期讀者:大賽評(píng)委、項(xiàng)目投資商、產(chǎn)品用戶、開發(fā)人員,指導(dǎo)老師。1.2 項(xiàng)目背景 系統(tǒng)名稱:Windows語音助手 任務(wù)提出者:_ 開發(fā)者:青島大學(xué)First Dream Team團(tuán)隊(duì)。 面向用戶:1、 希望能夠借助語音系統(tǒng)更加快捷、方便的操作電腦的用戶。2、 無法很好利用鼠標(biāo)或鍵盤對(duì)電腦進(jìn)行操作的殘障人士用戶。 特此聲明:此軟件的開發(fā)作為后期商業(yè)項(xiàng)目的原型,均采用授權(quán)開發(fā)工具,產(chǎn)品擁有自主知識(shí)產(chǎn)權(quán),未經(jīng)允許不得隨意傳播或使用。1.3 定義 SDK:SDK 就是 Software Development Kit 的縮寫,中文意思就是 “軟件開發(fā)工具包”。這是一個(gè)覆蓋面相當(dāng)廣泛的名詞,可以這么說:輔
5、助開發(fā)某一類軟件的相關(guān)文檔、范例和工具的集合都可以叫做“SDK”。 TTS全稱為:TextToSpeech即文本合成語音,此為SAPI的基本類型之一,TTS可以將文本中的字符或文檔合成為語音并“說”出來。 SR全拼:Speech Recognise即語音識(shí)別,此也為SAPI的基本類型之二,SR則可以把人說話的語音轉(zhuǎn)換為易讀的字符或文檔。 SAPI SAPI又稱語音應(yīng)用程序編程接口,它減少了語音識(shí)別和語音合成應(yīng)用中的程序代碼,使得語音技術(shù)在廣泛和蓬勃發(fā)展的實(shí)際應(yīng)用中更容易使用。SAPI使得應(yīng)用程序和語音引擎之間高度緊密的結(jié)合。SAPI可以實(shí)時(shí)處理各種語音引擎在底層工作中的細(xì)節(jié)。 SAPI包括文本
6、合成語音應(yīng)用程序接口,語音識(shí)別應(yīng)用程序接口。SAPI的兩種基本類型是文本合成語音(TTS)引擎和語音識(shí)別 (SR)引擎。 WindowsAPI(Win32API)Windows API是一套用來控制Windows的各個(gè)部件(從桌面的外觀到為一個(gè)新進(jìn)程分配的內(nèi)存)的外觀和行為的一套預(yù)先定義的Windows函數(shù).用戶的每個(gè)動(dòng)作都會(huì)引發(fā)一個(gè)或幾個(gè)函數(shù)的運(yùn)行以告訴Windows發(fā)生了什么. API函數(shù)包含在Windows系統(tǒng)目錄下的動(dòng)態(tài)連接庫文件中(如User32.dll,GDI32.dll,Shell32.dll.). 1.4 參考資料1.大賽題目設(shè)置Windows語音助手的相關(guān)具體要求。2.參考書
7、籍: 語音識(shí)別與控制應(yīng)用技術(shù)作者: 劉幺和,宋庭新編著出 版 社: 科學(xué)出版社出版時(shí)間: 2008-2-1 新編API大全2009版 Microsoft MSDN Microsoft Speech SDK 5.1 Help C#開發(fā)技巧大全 中國水利出版社 C#數(shù)據(jù)安全手冊(cè) 人民郵電出版社 C#高級(jí)編程-清華大學(xué)出版社 國家標(biāo)準(zhǔn)軟件產(chǎn)品需求規(guī)格說明書 國家標(biāo)準(zhǔn)可行性分析報(bào)告 軟件工程作 者: 曾建潮 I S B N: 7562919542 出 版 社: 武漢工大 出版日期: 2004-5-1 軟件工程與軟件文檔寫作 作者: 文斌,劉長青,田原 編著 ISBN: 9787810825702 ,
8、7810825704 出版社: 清華大學(xué)出版社 出版日期: 2005-8-1 軟件需求工程作 者 黃國興 周勇 出 版 社 清華大學(xué)出版社 書 號(hào) 302-16860-7 出版時(shí)間 2008年4月 字?jǐn)?shù) 千字 二任務(wù)概述 項(xiàng)目最終采用最新微軟.NET技術(shù),并結(jié)合微軟最新語音識(shí)別引擎,通過語音輸入達(dá)到對(duì)計(jì)算機(jī)的基本控制。本項(xiàng)目在Visual Studio 2008 集成開發(fā)環(huán)境下開發(fā),基于.NET及Speech語音引擎平臺(tái)。給客戶帶來方便快捷的全新體驗(yàn)。2.1語音識(shí)別技術(shù)的起源與發(fā)展前景2.1.1語音識(shí)別技術(shù)簡介智能翻譯機(jī)、語音撥號(hào)、語音查詢、語音自動(dòng)定票系統(tǒng)、語音工業(yè)控制等等,可以想見,凡用計(jì)
9、算機(jī)的地方都會(huì)有語音識(shí)別。在計(jì)算機(jī)輔助教育方面,計(jì)算機(jī)就成為專業(yè)的家庭輔導(dǎo)教師;在幼兒進(jìn)行啟蒙教育的玩具中,語音識(shí)別也將倍受歡迎。電腦語音合成技術(shù)即CTI(Computer Telephone Integration),是用計(jì)算機(jī)技術(shù)處理電話語音。通常是建一個(gè)信息呼叫中心,用戶打來電話時(shí)計(jì)算機(jī)會(huì)自動(dòng)地一層層地轉(zhuǎn)給相關(guān)部門,一直到為用戶解決問題為止。有的語音信箱可以支持不同語種。CTI并非新技術(shù)。與網(wǎng)絡(luò)電話把數(shù)據(jù)壓縮打包進(jìn)行傳輸有所不同,CTI到底還是一種語音模擬傳輸技術(shù),只不過用上了計(jì)算機(jī)對(duì)語音進(jìn)行智能管理而已。發(fā)達(dá)國家早幾年就普及了這項(xiàng)應(yīng)用,“是個(gè)機(jī)構(gòu)就有呼叫中心”,以保證客戶或合作伙伴打來
10、的每一個(gè)電話都有回應(yīng)。中國卻還沒有走到這一步,目前除了電信部門普遍開通了“呼叫中心”服務(wù)之外,大多數(shù)企業(yè)還剛剛起步。這個(gè)差距反映了管理和競爭意識(shí)方面的問題。中文語音瀏覽器產(chǎn)品“Interversa”使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。Interversa已針對(duì)Pentium的SSE指令集進(jìn)行了優(yōu)化,并將在Pentium上實(shí)現(xiàn)最好的性能和識(shí)別率。常見的語音識(shí)別系統(tǒng)還有“命令和控制(Command&Control)”(是連續(xù)的,擁有小詞匯量和獨(dú)立揚(yáng)聲器)、“語音導(dǎo)航”、微軟的“不連續(xù)聽寫(Discrete Dictation)”(是不連續(xù)、大詞匯量和非獨(dú)立揚(yáng)聲器的),IBM的ViaV
11、oice則屬于連續(xù)聽寫。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù),也就是讓機(jī)器聽懂人類的語音。也就是說,如果電腦配置有“語音辨識(shí)”的程序組,那么當(dāng)你的聲音通過一個(gè)轉(zhuǎn)換裝置輸入電腦內(nèi)部、并以數(shù)位方式儲(chǔ)存后,語音辨識(shí)程序便開始以你輸入的聲音樣本與事先儲(chǔ)存好的聲音樣本進(jìn)行對(duì)比工作。聲音對(duì)比工作完成之后,電腦就會(huì)輸入一個(gè)它認(rèn)為最“象”的聲音樣本序號(hào),就可以知道你剛才念的聲音是什么意義,進(jìn)而執(zhí)行此命令。說起來簡單,但要真正建立辨識(shí)率高的語音辨識(shí)程序組,卻是非常困難而專業(yè)的,世界各地的學(xué)者們也還在努力研究最好的方式。專家學(xué)者們研究出許多破解這個(gè)問題的方法,如傅立葉轉(zhuǎn)
12、換、倒頻譜參數(shù)等,使目前的語音辨識(shí)系統(tǒng)已達(dá)到一個(gè)可接受的程度,并且辨識(shí)度愈來愈高。本項(xiàng)目是一個(gè)基于語音識(shí)別的一個(gè)智能化服務(wù)產(chǎn)品,是面向服務(wù)設(shè)計(jì)的成功案例之一。2.1.2語音識(shí)別技術(shù)的應(yīng)用語音識(shí)別技術(shù)的應(yīng)用主要有以下兩個(gè)方面。一是用于人機(jī)交流。目前這方面應(yīng)用的呼聲很高,因?yàn)槭褂面I盤、鼠標(biāo)與電子計(jì)算機(jī)進(jìn)行交流的這種方式,使許多非專業(yè)人員,特別是不懂英語或不熟悉漢語拼音的人被拒之于門外,影響到電子計(jì)算機(jī)的進(jìn)一步普及。語音識(shí)別技術(shù)的采用,改變了人與計(jì)算機(jī)的互動(dòng)模式,人們只需動(dòng)動(dòng)口,就能打開或關(guān)閉程序,改變工作界面。這種使電腦人性化的結(jié)果是使人的雙手得到解放,使每個(gè)人都能操作和應(yīng)用計(jì)算機(jī)。電話仍是目前使
13、用最為普遍的通信工具,通過電話與語音識(shí)別系統(tǒng)的協(xié)同工作,可以實(shí)現(xiàn)語音撥號(hào)、電話購物以及通過電話辦理銀行業(yè)務(wù)、炒股、上網(wǎng)檢索信息或處理電子件等。不久,能按主人口令接通電話、打開收音機(jī),以及通過聲紋識(shí)別來者身份的安全系統(tǒng)也將獲得應(yīng)用。語音識(shí)別技術(shù)的另一方面應(yīng)用便是語音輸入和合成語音輸出。現(xiàn)在,已經(jīng)出現(xiàn)能將口述的文稿輸入計(jì)算機(jī)并按指定格式編排的語音軟件,它比通過鍵盤輸入在速度上要提高24倍。裝有語音軟件的電腦還能通過語音合成把計(jì)算機(jī)里的文件用各種語言“讀”出來,這將大大推進(jìn)遠(yuǎn)程通信和網(wǎng)絡(luò)電話的發(fā)展。在現(xiàn)階段,語音技術(shù)主要用于電子商務(wù)、客戶服務(wù)和教育培訓(xùn)等領(lǐng)域,它對(duì)于節(jié)省人力、時(shí)間,提高工作效率將起到
14、明顯的作用。能實(shí)現(xiàn)自動(dòng)翻譯的語音識(shí)別系統(tǒng)目前也正在研究、完善之中。2.1.3語音識(shí)別技術(shù)的發(fā)展語音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。它是一門交叉學(xué)科,正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù)。語音識(shí)別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你說什么,這是人們長期以來夢(mèng)寐以求的事情。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識(shí)別是一門交叉學(xué)科。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)
15、計(jì),未來10年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語音識(shí)別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被美國新聞界評(píng)為1997年計(jì)算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語音識(shí)別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。語音識(shí)別產(chǎn)品將是繼電話、計(jì)算機(jī)、Internet之后信息產(chǎn)業(yè)界的又一次革命。如果我們能夠突破人機(jī)交互的瓶頸,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。正是這充滿潛力的市場(chǎng)前景使世界上一些知名公司無不看重“語音識(shí)別”這塊正待開發(fā)的市場(chǎng),IBM、Drag
16、on、Intel、Microsoft、Philips、Motorola、Apple、National、Nortel等大公司都設(shè)有專門的語音識(shí)別技術(shù)研發(fā)部或子公司,每年投入的研究經(jīng)費(fèi)達(dá)數(shù)千萬美元。Intel公司推出的Pentium為語音產(chǎn)品的實(shí)時(shí)化提供了進(jìn)一步的保證。反過來,語音產(chǎn)品的發(fā)展也將為半導(dǎo)體工業(yè)提供新的契機(jī)。在國際市場(chǎng)上,由于中國的國際地位與日俱增以及在經(jīng)濟(jì)和市場(chǎng)方面所處的重要地位,漢語語音識(shí)別越來越受到重視;各大公司都相繼投入到漢語語音識(shí)別系統(tǒng)的開發(fā)中,其投資也在逐年增加。日漸火爆的語音市場(chǎng)再一次給我們帶來了機(jī)遇和挑戰(zhàn);不斷涌現(xiàn)和日新月異的新產(chǎn)品將證明,語音識(shí)別產(chǎn)品是繼電話、計(jì)算機(jī)、
17、Internet之后,信息產(chǎn)業(yè)界的又一次革命。2.2 功能簡介(目標(biāo))本系統(tǒng)的主要功能是實(shí)現(xiàn)用戶通過語音來進(jìn)行對(duì)系統(tǒng)的操作以及完成對(duì)系統(tǒng)資源的控制與使用,使我們能夠用“嘴”遨游互聯(lián)網(wǎng)實(shí)現(xiàn)了“所說即所得”。講的通俗一點(diǎn),就是用戶“說話”來操縱電腦,省去使用鼠標(biāo),鍵盤的麻煩了。此外,還可以幫助用戶“讀”文本,實(shí)現(xiàn)文本到語音的轉(zhuǎn)換,同樣免去用戶長期用眼看資料的勞頓。 本產(chǎn)品實(shí)現(xiàn)了人機(jī)交互的功能,就能使任何人都可以對(duì)計(jì)算機(jī)“發(fā)號(hào)施令”,口授文章,甚至“親切交談”,真正全面地實(shí)現(xiàn)“君子動(dòng)口不動(dòng)手”的人機(jī)交互方式。為用戶操作windows系統(tǒng)提供一種更智能,更人性化的操作方式,通過語音來完成windows
18、基本操作,使用戶有一種親切的感覺。為用戶操作系統(tǒng)帶來一種耳目一新,方便、快捷的感受,語音的控制使用戶辦公及基本操作達(dá)到事半功備的效果。更加新穎的操作界面(語音精靈的加入)能使用戶在操作過程中達(dá)到一種娛樂的效果。2.3用戶的特點(diǎn)該語音系統(tǒng)既可使深入了解windows基本操作的用戶操作起來更加快捷、方便,也可對(duì)初步有windows操作知識(shí)的用戶進(jìn)一步學(xué)習(xí)電腦知識(shí)有輔助效果,使其學(xué)得更快??傮w來講本系統(tǒng)適用的用戶范圍較廣,只要具備一點(diǎn)電腦知識(shí)的用戶都可以順利的應(yīng)用本系統(tǒng)。2.4運(yùn)行環(huán)境2.4.1硬件環(huán)境CPU:2.2GHZ或更快;內(nèi)存:512MB或更大的內(nèi)存;硬盤:7200RPM或更快的硬盤;其他外
19、設(shè):麥克風(fēng)等音頻輸入設(shè)備,耳麥等音頻輸出設(shè)備;2.4.2軟件環(huán)境(一)操作系統(tǒng):Microsoft Windows XP Microsoft Windows Server 2003 Service Pack 2 Microsoft Windows Server 2008 (二)運(yùn)行環(huán)境 1. .NET FrameWork 3.5或更高版本。 2.正確安裝微軟SDK語音引擎包及微軟SDK語音引擎中日語言包。2.5 條件與限制由于本系統(tǒng)為語音識(shí)別系統(tǒng),程序運(yùn)行時(shí)需要接收并分析判斷來自終端輸入的語音音頻,所以程序運(yùn)行時(shí)對(duì)周圍環(huán)境的嘈雜程度要求很高,要求周圍環(huán)境噪音越小越好,最好是在一個(gè)安靜的環(huán)境里;
20、其次,在使用我們的產(chǎn)品之前,最好是做一個(gè)語音訓(xùn)練,以便讓計(jì)算機(jī)更熟悉用戶的聲音,方便用戶的操作,讓用戶使用的更舒心,我們更放心;再次,也要求用戶所使用的音頻輸入設(shè)備(麥克風(fēng))的質(zhì)量要好,也就是要保證語音識(shí)別率高。2.6假設(shè)與依賴本項(xiàng)目基于.NET并依賴于微軟最新語音識(shí)別引擎、Speech API5.1(語音編程接口)。三大賽項(xiàng)目要求(功能需求)3.1功能需求介紹利用現(xiàn)有語音引擎或獨(dú)立底層開發(fā)基于語音識(shí)別技術(shù)的Windows操作助手,助手能夠協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作,如啟動(dòng)某某軟件,關(guān)閉當(dāng)前窗口,關(guān)閉Window
21、s,點(diǎn)擊特定按鈕或選擇指定的菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(即使得該軟件窗口獲得焦點(diǎn)),拷貝屏幕區(qū)域,上翻或下翻當(dāng)前正在瀏覽的網(wǎng)頁或閱讀的文章,刪除文件,清空文件垃圾桶等。助手在協(xié)助用戶進(jìn)行各種操作時(shí)要在屏幕上明顯體現(xiàn)出該操作是助手幫助完成的,以區(qū)別于用戶通過鼠標(biāo)或鍵盤進(jìn)行的其他操作。要保證在不需要助手的時(shí)候,它會(huì)安靜的呆在一邊,不能影響用戶的正常操作。賽題中涉及的主要技術(shù)難點(diǎn)有兩個(gè),語音識(shí)別及屏幕取詞,本產(chǎn)品都已經(jīng)突破。此語音系統(tǒng)的主要功能是通過語音輸入、識(shí)別來實(shí)現(xiàn)最終的語音控制,其中語音識(shí)別子系統(tǒng)中又有語音訓(xùn)練向?qū)?、麥克風(fēng)設(shè)置向?qū)?、自定義詞庫、發(fā)音靈敏度設(shè)置等設(shè)置功能;此外,文本朗讀,
22、語音精靈是本系統(tǒng)的輔助功能;對(duì)本系統(tǒng)的功能介紹我們將在功能概要設(shè)計(jì)說明及細(xì)節(jié)說明中給出詳細(xì)的說明,下面通過一個(gè)形象的實(shí)例介紹系系統(tǒng)所提供的服務(wù)。3.2功能需求實(shí)例圖3.2功能需求流程圖3.2功能一 語音識(shí)別與輸入3.2.1功能說明 此功能應(yīng)該是本系統(tǒng)實(shí)現(xiàn)主功能的基礎(chǔ)重要功能,優(yōu)先級(jí)高。3.2.2功能描述要求系統(tǒng)能夠準(zhǔn)確識(shí)別用戶通過終端輸入的語音,在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,并也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作(涉及語音控制)。語音識(shí)別是大賽要求中提到的技術(shù)難點(diǎn)之一。用戶對(duì)著麥克風(fēng)說話,實(shí)現(xiàn)和計(jì)算機(jī)的互動(dòng),實(shí)際上是我們的產(chǎn)品接受了用戶說的內(nèi)容,然后把聲音轉(zhuǎn)換
23、為文字,在命令模式下,實(shí)現(xiàn)了用戶說什么計(jì)算機(jī)則會(huì)根據(jù)用戶所說的命令執(zhí)行相應(yīng)的操作。當(dāng)用戶的命令計(jì)算機(jī)不存在或用戶說的不準(zhǔn)確時(shí),我們的精靈則會(huì)提醒用戶沒有該命令,或說的命令不準(zhǔn)確提醒用戶請(qǐng)?jiān)僬f一遍。在輸入模式下,實(shí)現(xiàn)了完全取代鍵盤和鼠標(biāo)的操作,使用戶不用再利用鼠標(biāo)和鍵盤向計(jì)算機(jī)傳輸輸入的信息文字,在此模式下,用戶說什么,計(jì)算機(jī)就會(huì)“寫”什么。同時(shí),輸入模式和命令模式可以相互轉(zhuǎn)換。3.3功能二屏幕取詞3.3.1功能說明屏幕取詞功能同樣是實(shí)現(xiàn)主控制功能的重要基礎(chǔ)功能,是實(shí)現(xiàn)語音識(shí)別的重要基石之一。其優(yōu)先級(jí)別也較高。3.3.2功能描述通過此功能能夠取得桌面,系統(tǒng)窗體,以及任務(wù)欄、選項(xiàng)卡、標(biāo)簽等其內(nèi)部的
24、任何文本,在命令模式下,根據(jù)用戶說出的命令,在打開的窗體中進(jìn)行“查找”和“匹配”,在模糊匹配的協(xié)助下,找到用戶說出的命令然后執(zhí)行相應(yīng)的操作。此功能在描述上簡單,但是實(shí)現(xiàn)上將是一個(gè)難點(diǎn),屏幕取詞同樣也是大賽要求中提到的技術(shù)難點(diǎn)之二。3.4功能三語音控制3.4.1功能說明語音控制功能是本系統(tǒng)的主功能及核心功能,語音控制計(jì)算機(jī)的各個(gè)內(nèi)部操作。其優(yōu)先級(jí)別最高。3.4.2功能描述在語音識(shí)別,屏幕取詞的基礎(chǔ)上實(shí)現(xiàn)的語音控制最終達(dá)到協(xié)助用戶在任何可以輸入文字的地方根據(jù)用戶語音命令輸入文字,并也可以幫助用戶使用語音進(jìn)行Windows的常規(guī)操作,如啟動(dòng)某某軟件,關(guān)閉當(dāng)前窗口,關(guān)閉Windows,點(diǎn)擊特定按鈕或選
25、擇指定的菜單項(xiàng),激活某個(gè)正在運(yùn)行的軟件窗口(即使得該軟件窗口獲得焦點(diǎn)),拷貝屏幕區(qū)域,上翻或下翻當(dāng)前正在瀏覽的網(wǎng)頁或閱讀的文章,刪除文件,清空文件垃圾桶等等基礎(chǔ)操作。同時(shí),基于屏幕取詞和模糊匹配的協(xié)助下,語音控制實(shí)現(xiàn)了更深一層的突破,使用戶想要計(jì)算機(jī)執(zhí)行什么操作,只要對(duì)我們的產(chǎn)品下命令,應(yīng)用程序就會(huì)“告訴”計(jì)算機(jī)用戶想干什么,計(jì)算機(jī)就會(huì)執(zhí)行相應(yīng)的操作,達(dá)到用戶的需求。該產(chǎn)品就是“用戶“和“計(jì)算機(jī)”溝通的橋梁,方便他們之間的交流。真正實(shí)現(xiàn)了“君子動(dòng)口不動(dòng)手”。3.5功能四語音精靈3.5.1功能說明此功能是本系統(tǒng)的輔助功能之一,為我們的產(chǎn)品添加生趣和色彩。優(yōu)先級(jí)別中等。3.5.2功能描述語音小精靈
26、主要提高本系統(tǒng)使用的趣味性,增加了人機(jī)互動(dòng),同時(shí)語音小助手實(shí)時(shí)報(bào)時(shí),錯(cuò)誤提示等功能提高了實(shí)用價(jià)值。使用戶在使用我們的產(chǎn)品時(shí)能用的滿意,用的舒心,我們放心。3.6功能五語音朗讀(TTS)3.6.1功能說明此功能是本系統(tǒng)的輔助功能之二,優(yōu)先級(jí)別中等。3.6.2功能描述將文本變成語音進(jìn)行朗讀, 能用不同的語音來朗讀文本??梢岳首x中文或英文的(.txt)文本。在進(jìn)行語音朗讀前或朗讀時(shí)您可以隨時(shí)設(shè)置【音量大小】和【語音速度】,以保證文本輸出的語音音律流暢,使得您在聽取信息時(shí)感覺自然。此外,本軟件還可以將所朗讀的文本保存為音頻文件(.wav)。語音朗讀將會(huì)幫助用戶朗讀文本文件內(nèi)容,利用的是微軟SAPI的語
27、音合成技術(shù)及語音引擎將文本轉(zhuǎn)化成語音并輸出。在此功能中,您可以選擇“男”或“女“來讀您載入的文本,也可選擇“中文”或“英文”來朗讀。此功能從技術(shù)上來說,我們是調(diào)用系統(tǒng)中存在的各種語音引擎進(jìn)行朗讀,根本是調(diào)用com對(duì)象(全反射、沒有引用com ocx),并且使用引擎保存聲音。四運(yùn)行要求4.1用戶界面用戶界面簡介、實(shí)用,助手形象要有趣、大方、可愛。能夠博得用戶喜愛,讓用戶用的滿意舒心,我們也放心。4.2硬件接口1.接口名稱:音頻輸入接口 規(guī)格說明:用戶計(jì)算機(jī)音頻輸入插口。2.接口名稱:音頻輸出接口 規(guī)格說明:用戶計(jì)算機(jī)的音頻輸出接口。4.3軟件接口4.3.1SAPI(語音接口) 接口名稱:SAPI(語音接口) 規(guī)格說明:文本合成語音應(yīng)用程序接口,語音識(shí)別應(yīng)用程序接口 版本號(hào):5.1版4.3.2API 接口名稱:win32API(系統(tǒng)編程接口)規(guī)格說明:提供底層系統(tǒng)編程方案。版本號(hào): 待定。4.4通信接口(無)18
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- [部編人教版]三年級(jí)下冊(cè)蜜蜂課件
- [美術(shù)課件]探訪自然奇觀課件1
- 小學(xué)五年級(jí)上冊(cè)語文第二課小苗與大樹的對(duì)話PPT課件2
- 將陽光撒向心靈展示文稿
- 《好的故事》(完美版)優(yōu)秀課件
- 實(shí)際問題與二次函數(shù)
- 《太空一日》參考課件1
- 上腔靜脈綜合征
- 用厘米作單位量長度 (2)
- 冠心病教學(xué)查房
- 小兒發(fā)燒該如何護(hù)理
- 幼兒急疹的鑒別診斷
- 華南國際工業(yè)原料城項(xiàng)目品牌傳播構(gòu)想
- 頸椎雙開門術(shù)
- 人教新課標(biāo)三年級(jí)語文下冊(cè)《古詩兩首—詠柳3》