基于AI技術的媒資內容管理平臺
《基于AI技術的媒資內容管理平臺》由會員分享,可在線閱讀,更多相關《基于AI技術的媒資內容管理平臺(6頁珍藏版)》請在裝配圖網上搜索。
基于 AI 技術的媒資內容管理平臺 語音識別需求書 2017 年 11 月 文檔信息 產品名稱 項目需求確認書 產品負責人 徐志亮 負責人聯(lián)系方式 22005899 51472 文檔修改記錄 版本 修改時間 修改人 修改章節(jié) 修改說明 目 錄 1 簡介 4 2 產品需求 4 2 1 產品需求概述 4 2 1 1 視頻預處理 5 2 1 2 語音識別文字輸出 5 2 1 3 高識別率 6 2 1 4 支持多種音頻格式 6 2 1 5 多語言識別 6 2 1 5 高識別效率 6 3 其他需求 6 3 1 服務器環(huán)境配置 6 3 2 測試需求 6 3 3 運維保障需求 7 項 目 需 求 報 告 1 簡介 1 1 項目背景 隨著計算機自動化技術的發(fā)展 語音識別 字幕識別 場景分割等技術已 經日趨成熟 智能語義分析 智能素材關聯(lián) 人臉識別技術也在迅速發(fā)展 日 本 NHK 等發(fā)達國家已實際應用 SMG 的自動編目可從語音識別和字幕識別入手 以新聞 戲曲類節(jié)目為切人點 在節(jié)目素材入庫媒資時將語音和字幕自動進行 文字化 減少編目人員工作量 之后 以自動場景分割技術為基礎 結合智能 語義分析 逐步對節(jié)目和素材實現全自動的標引 提高整個媒資編目的自動化 率 降低媒資運營的人工成本 2 產品需求 2 1 產品需求概述 隨著計算機自動化技術的發(fā)展 語音識別 字幕識別 場景分割等技術已 經日趨成熟 智能語義分析 智能素材關聯(lián) 人臉識別技術也在迅速發(fā)展 日 本 NHK 等發(fā)達國家已實際應用 SMG 可從語音識別入手 在節(jié)目素材入庫媒資 時將語音和字幕自動進行文字化 之后 以自動場景分割技術為基礎 結合智 能語義分析 逐步對節(jié)目和素材實現全自動的標引 項 目 需 求 報 告 該項目的目標是通過語音識別 對視頻進行文字內容和關鍵詞的提取 提 取后的內容和關鍵詞按照視頻名稱和視頻時間信息進行存儲 最終為用戶提供 文字內容和關鍵詞的檢索服務 2 1 1 視頻預處理 視頻預處理主要實現對視頻進行提取音頻視頻提取音頻 從視頻文件中提 取音頻文件 音頻格式為 mp3 或 wav 2 1 2 語音識別文字輸出 自動識別音 視頻 包括主流格式高 低碼格式 中的語音 并將其識別 為文本內容 并頁面中展示 語音識別文本應包含時間戳 即表示在該段時間內音頻的識別結果 語音 識別的結果按照時間的順序 入點時間 出點時間 在每個視頻素材的詳情頁 進行展示 語音識別文字輸出應當為完整句子形式 詞等 另外應具有智能的功能 例如 電話號碼 車牌 日期 時間以及量詞的規(guī)整 如 五點三十 會識別 規(guī)整為 5 30 自動斷句 并且在文本中加入標點如好 并且能夠識別詞屬性 詞屬性包 括 普通詞 語氣猶豫詞 如 嗯 啊 呃 或者無意義的重復詞等 標 點符號 如 等 項 目 需 求 報 告 2 1 3 高識別率 在音頻中為標準普通話的情況下 語音識別率需要達到 90 以上 若音頻 中為較為不標準普通話 則語音識別率可以稍微降低識別率要求 2 1 4 支持多種音頻格式 語音識別應支持多種視頻格式 例如 wav flac opus m4a mp3 2 1 5 多語言識別 語音識別可能需要識別普通話 上海話 以及英語等 根據目前項目需求 至少需要能夠識別普通話以及上海話 并且達到較好的識別效果 2 1 5 高識別效率 由于音頻量大 所以需要高效率的語音識別軟件 音頻時長與識別時間的 比要大于 6 1 否則無法正常完成語音識別業(yè)務 3 其他需求 3 1 測試需求 兼容性測試 壓力測試 流程測試 安全性測試 兼容性測試需求 PC 端兼容要求 瀏覽器 IE8 Chrome 火狐 屏幕分辨率 1024 768 1920 1080 系統(tǒng) winXP win10- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 基于 AI 技術 內容管理 平臺
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.appdesigncorp.com/p-8964445.html