基于AI技術(shù)的媒資內(nèi)容管理平臺
《基于AI技術(shù)的媒資內(nèi)容管理平臺》由會員分享,可在線閱讀,更多相關(guān)《基于AI技術(shù)的媒資內(nèi)容管理平臺(6頁珍藏版)》請在裝配圖網(wǎng)上搜索。
基于 AI 技術(shù)的媒資內(nèi)容管理平臺 語音識別需求書 2017 年 11 月 文檔信息 產(chǎn)品名稱 項目需求確認(rèn)書 產(chǎn)品負(fù)責(zé)人 徐志亮 負(fù)責(zé)人聯(lián)系方式 22005899 51472 文檔修改記錄 版本 修改時間 修改人 修改章節(jié) 修改說明 目 錄 1 簡介 4 2 產(chǎn)品需求 4 2 1 產(chǎn)品需求概述 4 2 1 1 視頻預(yù)處理 5 2 1 2 語音識別文字輸出 5 2 1 3 高識別率 6 2 1 4 支持多種音頻格式 6 2 1 5 多語言識別 6 2 1 5 高識別效率 6 3 其他需求 6 3 1 服務(wù)器環(huán)境配置 6 3 2 測試需求 6 3 3 運維保障需求 7 項 目 需 求 報 告 1 簡介 1 1 項目背景 隨著計算機自動化技術(shù)的發(fā)展 語音識別 字幕識別 場景分割等技術(shù)已 經(jīng)日趨成熟 智能語義分析 智能素材關(guān)聯(lián) 人臉識別技術(shù)也在迅速發(fā)展 日 本 NHK 等發(fā)達國家已實際應(yīng)用 SMG 的自動編目可從語音識別和字幕識別入手 以新聞 戲曲類節(jié)目為切人點 在節(jié)目素材入庫媒資時將語音和字幕自動進行 文字化 減少編目人員工作量 之后 以自動場景分割技術(shù)為基礎(chǔ) 結(jié)合智能 語義分析 逐步對節(jié)目和素材實現(xiàn)全自動的標(biāo)引 提高整個媒資編目的自動化 率 降低媒資運營的人工成本 2 產(chǎn)品需求 2 1 產(chǎn)品需求概述 隨著計算機自動化技術(shù)的發(fā)展 語音識別 字幕識別 場景分割等技術(shù)已 經(jīng)日趨成熟 智能語義分析 智能素材關(guān)聯(lián) 人臉識別技術(shù)也在迅速發(fā)展 日 本 NHK 等發(fā)達國家已實際應(yīng)用 SMG 可從語音識別入手 在節(jié)目素材入庫媒資 時將語音和字幕自動進行文字化 之后 以自動場景分割技術(shù)為基礎(chǔ) 結(jié)合智 能語義分析 逐步對節(jié)目和素材實現(xiàn)全自動的標(biāo)引 項 目 需 求 報 告 該項目的目標(biāo)是通過語音識別 對視頻進行文字內(nèi)容和關(guān)鍵詞的提取 提 取后的內(nèi)容和關(guān)鍵詞按照視頻名稱和視頻時間信息進行存儲 最終為用戶提供 文字內(nèi)容和關(guān)鍵詞的檢索服務(wù) 2 1 1 視頻預(yù)處理 視頻預(yù)處理主要實現(xiàn)對視頻進行提取音頻視頻提取音頻 從視頻文件中提 取音頻文件 音頻格式為 mp3 或 wav 2 1 2 語音識別文字輸出 自動識別音 視頻 包括主流格式高 低碼格式 中的語音 并將其識別 為文本內(nèi)容 并頁面中展示 語音識別文本應(yīng)包含時間戳 即表示在該段時間內(nèi)音頻的識別結(jié)果 語音 識別的結(jié)果按照時間的順序 入點時間 出點時間 在每個視頻素材的詳情頁 進行展示 語音識別文字輸出應(yīng)當(dāng)為完整句子形式 詞等 另外應(yīng)具有智能的功能 例如 電話號碼 車牌 日期 時間以及量詞的規(guī)整 如 五點三十 會識別 規(guī)整為 5 30 自動斷句 并且在文本中加入標(biāo)點如好 并且能夠識別詞屬性 詞屬性包 括 普通詞 語氣猶豫詞 如 嗯 啊 呃 或者無意義的重復(fù)詞等 標(biāo) 點符號 如 等 項 目 需 求 報 告 2 1 3 高識別率 在音頻中為標(biāo)準(zhǔn)普通話的情況下 語音識別率需要達到 90 以上 若音頻 中為較為不標(biāo)準(zhǔn)普通話 則語音識別率可以稍微降低識別率要求 2 1 4 支持多種音頻格式 語音識別應(yīng)支持多種視頻格式 例如 wav flac opus m4a mp3 2 1 5 多語言識別 語音識別可能需要識別普通話 上海話 以及英語等 根據(jù)目前項目需求 至少需要能夠識別普通話以及上海話 并且達到較好的識別效果 2 1 5 高識別效率 由于音頻量大 所以需要高效率的語音識別軟件 音頻時長與識別時間的 比要大于 6 1 否則無法正常完成語音識別業(yè)務(wù) 3 其他需求 3 1 測試需求 兼容性測試 壓力測試 流程測試 安全性測試 兼容性測試需求 PC 端兼容要求 瀏覽器 IE8 Chrome 火狐 屏幕分辨率 1024 768 1920 1080 系統(tǒng) winXP win10- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
15 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 基于 AI 技術(shù) 內(nèi)容管理 平臺
鏈接地址:http://m.appdesigncorp.com/p-8964445.html