Dolphin1000智能廣告監(jiān)播分析系統(tǒng)】
(智能自動截取工業(yè)級 詳情見www.zghpc.com)
1,廣告公司、電視購物公司、廣告投放量大的企業(yè)都需要解決以下問題:
實(shí)時(shí)收看將要播出的電視廣告(有線電纜內(nèi)包含的全部頻道);
監(jiān)控廣告播出情況,對漏播、延播、廣告前后環(huán)境實(shí)施錄像,以便日后核對;
將同業(yè)的個(gè)別或全部產(chǎn)品廣告實(shí)施錄像,以便隨時(shí)參閱、分析、篩選產(chǎn)品和時(shí)段;
實(shí)現(xiàn)無人值守的電視廣告錄像,以提高員工工作效率;
利用系統(tǒng)自動地對電視廣告播出視頻進(jìn)行廣告識別、條目登記,直接生成廣告監(jiān)播報(bào)表和分析圖表;
相關(guān)部門經(jīng)理需要在工作筆記本上隨時(shí)隨地的監(jiān)控電視廣告的播出;
鑒于以上問題,現(xiàn)將系統(tǒng)的關(guān)鍵性環(huán)節(jié)說明如下,以利于盡可能的靠近用戶的現(xiàn)實(shí)需要:
2,傳統(tǒng)的廣告監(jiān)播方式
用傳統(tǒng)的廣告監(jiān)播方式來處理一套電臺(電視)節(jié)目中廣告信息的過程通常包括下列步驟:
第一日: 用傳統(tǒng)的錄像機(jī)、錄音機(jī)錄制節(jié)目并保存
第二日: 廣告監(jiān)測人員通過回放錄音/錄象,記錄出現(xiàn)的廣告信息
第三日: 廣告監(jiān)測人員將監(jiān)看數(shù)據(jù)交監(jiān)播中心處理
第四日: 獲取監(jiān)播報(bào)告
我們通常說廣播、電視廣告監(jiān)測是大量的人力堆積起來的數(shù)據(jù),這一點(diǎn)都不夸張,尤其是電臺廣播,因?yàn)槿说亩o法辨別以倍速播放聲音的內(nèi)容,但卻能大致看明白以倍速播放的視頻圖象。也就是說,一個(gè)監(jiān)測員若要真實(shí)可信地處理前一天全部24小時(shí)的數(shù)據(jù),就必須花26-30個(gè)小時(shí)的時(shí)間。這樣,一個(gè)電臺一個(gè)頻段每天24小時(shí)的監(jiān)測數(shù)據(jù)處理,將需要3-4個(gè)人工來完成,而后還需要人員錄入、QC,*后才能生成監(jiān)播結(jié)果報(bào)告單,總共需要4-5個(gè)人工來完成。
3,基于音頻的廣告智能監(jiān)播技術(shù)原理
在電臺或電視節(jié)目中播放的廣告普遍具有下列特征:
1、 同一版本的某個(gè)廣告的播出時(shí)間上具有重復(fù)性和連續(xù)性,時(shí)間短的會重復(fù)播放一星期,長的甚至?xí)_(dá)到半年以上。
2、 重復(fù)播放的廣告都具有相同的音頻特征(聲紋和頻譜)。
3、 不同版本的廣告具有完全不同的音頻特征。
例如,下面看到的就是某個(gè)廣告樣本的“音頻特征波形圖”:
如果能夠通過語音識別引擎將某套節(jié)目中首次出現(xiàn)的某廣告的音頻特征信息提取出來,制作為該廣告的音頻識別樣本,就可以通過語音識別引擎用該樣本對后續(xù)數(shù)據(jù)進(jìn)行連續(xù)自動識別,并將識別出的廣告記錄到數(shù)據(jù)庫中,從而實(shí)現(xiàn)基于音頻的廣告自動監(jiān)播。
實(shí)現(xiàn)基于音頻的廣告自動監(jiān)播的技術(shù)關(guān)鍵是語音識別引擎的設(shè)計(jì),需要解決下列技術(shù)難題:
? 廣告識別準(zhǔn)確度。如果識別準(zhǔn)確度低于80%,系統(tǒng)的可信程度就不可接受。而識別準(zhǔn)確度高的算法往往計(jì)算量也非常大。
? 計(jì)算能力。語音識別算法的計(jì)算量非常大,普通的CPU難以負(fù)擔(dān),只能采用專用DSP硬件實(shí)現(xiàn)的方案。
? 處理速度。一般而言,實(shí)際的應(yīng)用系統(tǒng)都需要同時(shí)監(jiān)播數(shù)十套電臺、電視節(jié)目。這對識別引擎的硬件設(shè)計(jì)提出了很高的要求。
4,ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng),
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)以99%的識別準(zhǔn)確度為設(shè)計(jì)目標(biāo),充分利用了飛速發(fā)展的DSP技術(shù),攻克了上述技術(shù)難題,使基于音頻的廣告自動監(jiān)播進(jìn)入實(shí)用階段。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)采用基于高速DSP高速、高精度語音識別算法,實(shí)現(xiàn)了電臺、有線電視節(jié)目中播出廣告的自動識別和分析統(tǒng)計(jì)。根據(jù)操作員預(yù)先確定的廣告樣本,本系統(tǒng)能從電臺、電視的聲音信號中準(zhǔn)確地識別出某個(gè)廣告是否出現(xiàn)、在什么時(shí)間出現(xiàn)(精確到0.1秒),以及該廣告播放的時(shí)間長度。識別出的廣告的相關(guān)信息被自動存入數(shù)據(jù)庫。
ZG DOLPHIN 1000型 智能廣告監(jiān)播系統(tǒng)除了具備廣告智能監(jiān)播功能以外,同時(shí)還具有節(jié)目監(jiān)錄功能。通過掛接大容量的海量存儲設(shè)備,ZG系統(tǒng)夠?qū)⑷抗?jié)目數(shù)據(jù)保存30天以上甚至更長,以便事后查證。
4.1,語音識別工作站
語音識別工作站是整個(gè)音頻廣告自動監(jiān)播系統(tǒng)的核心設(shè)備,包括廣告識別所需的全部硬件部分和軟件,具體包括:
a,工業(yè)級的高性能專業(yè)計(jì)算平臺及相應(yīng)的調(diào)度軟件,滿足系統(tǒng)24小時(shí)連續(xù)不間斷運(yùn)行的需要。
b,專用的超大容量音頻數(shù)據(jù)采集硬件及相應(yīng)軟件,可以同時(shí)對多達(dá)10路電臺音頻(或電視伴音信號)進(jìn)行數(shù)字化,并將數(shù)字化的聲音數(shù)據(jù)和視頻數(shù)據(jù)以文件方式保存到工作站的本地硬盤或外掛的磁盤陣列上。
c,專用的視頻數(shù)據(jù)采集硬件及相應(yīng)軟件,采用*先進(jìn)的MPEG4壓縮技術(shù),可以同時(shí)對多達(dá)10路輸入視頻信號進(jìn)行數(shù)據(jù)采集和壓縮,將視頻數(shù)據(jù)的碼流將到了*低。
d,專用硬件構(gòu)成的超級語音識別引擎,用以對輸入的原聲數(shù)據(jù)提取音頻特征。語音識別引擎使用了目前*先進(jìn)的DSP芯片陣列和識別算法,可以同時(shí)對多達(dá)10路輸入原聲數(shù)據(jù)的音頻特征進(jìn)行并行計(jì)算。
e,每臺識別工作站可以同時(shí)處理多達(dá)10套廣播或電視節(jié)目。
4.2,磁盤陣列
音頻、視頻信號數(shù)字化后,每天產(chǎn)生的數(shù)據(jù)量是相當(dāng)可觀的。對于電臺節(jié)目,每天24小時(shí)產(chǎn)生的數(shù)據(jù)大約為1G(1000M bytes)左右;對于電視節(jié)目,采用*先進(jìn)的MPEG4壓縮格式,每天24小時(shí)產(chǎn)生的數(shù)據(jù)大約為6G左右(包括聲音原聲數(shù)據(jù)和視頻圖象數(shù)據(jù))。
例如,如果需要在一臺識別工作站上同時(shí)監(jiān)測16套電視節(jié)目和16套廣播節(jié)目,并且要求聲音和圖象數(shù)據(jù)都至少保存90天,那么需要的存儲空間大約為:
6G*16*90 = 8640 G
1G*16*90=1440G
如此大的存儲要求需要使用海量存儲設(shè)備,通常是磁盤陣列。
4.3,操作員終端
本系統(tǒng)中,所有需要人工參與的工作都是在操作員終端上進(jìn)行。操作員終端提供友好、方便的圖形化人機(jī)交互界面,實(shí)現(xiàn)正常節(jié)目的確定、廣告樣本的提取、廣告監(jiān)聽/監(jiān)看、自動識別、廣告識別結(jié)果的存儲和管理等功能。
操作員每天的主要任務(wù),主要包括下列內(nèi)容:
(1) 打開保存在工作站上的某套電臺或電視節(jié)目某天的錄音和錄象文件。
(2) 系統(tǒng)用前一日(或多日)的樣本庫對當(dāng)日原聲進(jìn)行自動預(yù)識別。識別出的廣告會自動標(biāo)注到波形上,同時(shí)將相關(guān)信息保存到數(shù)據(jù)庫中。
(3) 利用終端軟件提供的工具聽取(查看)原聲數(shù)據(jù)(和圖象),從中發(fā)現(xiàn)新廣告,將新出新廣告制作成樣本。
(4) 給新樣本輸入主題詞并保存。此時(shí)終端軟件會自動在當(dāng)日原聲文件中對新樣本進(jìn)行自動識別,將識別出的新樣本在波形上進(jìn)行標(biāo)記,并記錄到數(shù)據(jù)庫中。
(5) 操作員重復(fù)步驟(3)~(4),直到完成對該日全部新廣告的提取和處理。
操作員終端按照實(shí)際需要進(jìn)行配置。一般而言,如果每天24小時(shí)的數(shù)據(jù)都需要處理,每3~4套節(jié)目需要配置一臺操作員終端。
下面是操作員終端的一個(gè)操作界面:
4.4,監(jiān)播結(jié)果數(shù)據(jù)庫服務(wù)器
數(shù)據(jù)庫服務(wù)器上主要存放每套節(jié)目的樣本信息和監(jiān)播結(jié)果的數(shù)據(jù)庫。
監(jiān)播結(jié)果數(shù)據(jù)庫集中存放各套節(jié)目監(jiān)播結(jié)果。數(shù)據(jù)庫中每條記錄都包含下列信息:
? 媒體來源,如某某廣播電臺FM xx.xxxHz,某某廣播電臺AM xx.xxxHz,某某電視臺
? 廣告名稱(主題詞)
? 節(jié)目類型。對于17號令的應(yīng)用而言,分公益廣告、酒類廣告、影響進(jìn)食類廣告、普通廣告、禁止播放類廣告、節(jié)目
? 播出日期、時(shí)間
? 廣告/節(jié)目持續(xù)時(shí)長
用戶收益:
? 實(shí)現(xiàn)實(shí)時(shí)監(jiān)督播出的廣告播出長度,播出時(shí)間的精確性
? 可以監(jiān)督電視臺因工作過失產(chǎn)生的漏播,缺幀等情況
? 可作為電視臺是否落實(shí)廣告播出合同的依據(jù)
? 可實(shí)現(xiàn)在同一時(shí)刻內(nèi)同時(shí)監(jiān)控多個(gè)廣告播出情況的功能
? 可有效地收集同業(yè)的媒介廣告播出情況,利于用戶有效地進(jìn)行行業(yè)分析