白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

首頁(yè) / 專利庫(kù) / 電腦圖像 / 幀存儲(chǔ)器 / 一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備

一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備

閱讀:319發(fā)布:2020-05-08

專利匯可以提供一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備專利檢索,專利查詢,專利分析的服務(wù)。并且本 發(fā)明 適用于視頻壓縮技術(shù)領(lǐng)域,提供了一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備,所述方法包括:將訓(xùn)練視頻表示為一個(gè)包含N 幀 的幀序列,其中N為正整數(shù);構(gòu)建一個(gè)與所述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1 力 。,下面是一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備專利的具體信息內(nèi)容。

1.一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,包括:
將訓(xùn)練視頻表示為一個(gè)包含N的幀序列,其中N為正整數(shù);
構(gòu)建一個(gè)與所述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1基于所述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)所述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
所述幀序列中每一幀都輸入所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
2.如權(quán)利要求1所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)包括:
S1:將所述第m-1幀重構(gòu)幀作為所述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀;
S2:計(jì)算所述第m幀重構(gòu)幀與第m幀的損失函數(shù),并根據(jù)所述損失函數(shù)進(jìn)行梯度更新,調(diào)整所述視頻壓縮網(wǎng)絡(luò)的權(quán)重參數(shù);
S3:重復(fù)執(zhí)行S1到S2直至所述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止。
3.如權(quán)利要求2所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述重復(fù)執(zhí)行S1到S2直至所述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止包括:
重復(fù)執(zhí)行S1到S2直至所述視頻壓縮網(wǎng)絡(luò)達(dá)到預(yù)設(shè)的重建質(zhì)量為止

重復(fù)執(zhí)行S1到S2的次數(shù)達(dá)到預(yù)設(shè)次數(shù)為止。
4.如權(quán)利要求2所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法,其特征在于,所述將所述第m-1幀重構(gòu)幀作為所述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀包括:
當(dāng)m=2時(shí),所述第m-1幀重構(gòu)幀即為所述訓(xùn)練視頻的第1幀。
5.一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置,其特征在于,包括:
視頻幀,用于將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù);
網(wǎng)絡(luò)構(gòu)建模塊,用于構(gòu)建一個(gè)與所述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
訓(xùn)練模塊,用于根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1參數(shù)更新模塊,用于基于所述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)所述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
訓(xùn)練完成模塊,用于所述幀序列中每一幀都輸入所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
6.如權(quán)利要求5所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置,其特征在于,所述訓(xùn)練模塊包括:
重構(gòu)幀單元,用于將所述第m-1幀重構(gòu)幀作為所述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀;
參數(shù)調(diào)整單元,用于計(jì)算所述第m幀重構(gòu)幀與第m幀的損失函數(shù),并根據(jù)所述損失函數(shù)進(jìn)行梯度更新,調(diào)整所述視頻壓縮網(wǎng)絡(luò)的權(quán)重參數(shù);
循環(huán)單元,用于重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至所述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止。
7.如權(quán)利要求6所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置,其特征在于,所述重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至所述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止包括:
重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至所述視頻壓縮網(wǎng)絡(luò)達(dá)到預(yù)設(shè)的重建質(zhì)量為止

重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元的次數(shù)達(dá)到預(yù)設(shè)次數(shù)為止。
8.如權(quán)利要求6所述的視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置,其特征在于,所述將所述第m-1幀重構(gòu)幀作為所述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀包括:
當(dāng)m=2時(shí),所述第m-1幀重構(gòu)幀即為所述訓(xùn)練視頻的第1幀。
9.一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在所述存儲(chǔ)器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任一項(xiàng)所述方法的步驟。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至4任一項(xiàng)所述方法的步驟。

說(shuō)明書全文

一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備

技術(shù)領(lǐng)域

[0001] 本發(fā)明屬于視頻壓縮技術(shù)領(lǐng)域,尤其涉及一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法、裝置及終端設(shè)備。

背景技術(shù)

[0002] 現(xiàn)有技術(shù)中單碼點(diǎn)模型在視頻序列的測(cè)試中存在較為嚴(yán)重的衰減,主要原因還是因?yàn)橛?xùn)練測(cè)試不匹配造成的,目前的模型訓(xùn)練中用兩個(gè)I作為參考幀來(lái)壓縮當(dāng)前幀,而在模型性能測(cè)試中,需要把恢復(fù)的重建幀作為參考幀,而模型沒(méi)有見(jiàn)過(guò)這種參考幀,因此導(dǎo)致模型的重建質(zhì)量下降。
[0003] 因此有必要提出一種新的技術(shù)方案,以解決上述問(wèn)題。

發(fā)明內(nèi)容

[0004] 有鑒于此,本發(fā)明實(shí)施例提供了一種視頻壓縮方法、裝置終端設(shè)備,以解決現(xiàn)有技術(shù)中的問(wèn)題。
[0005] 本發(fā)明實(shí)施例的第一方面提供了一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法,包括:
[0006] 將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù);
[0007] 構(gòu)建一個(gè)與所述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
[0008] 根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1
[0009] 基于所述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)所述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
[0010] 所述幀序列中每一幀都輸入所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
[0011] 本發(fā)明實(shí)施例的第二方面提供了一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置,包括:
[0012] 視頻幀,用于將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù);
[0013] 網(wǎng)絡(luò)構(gòu)建模塊,用于構(gòu)建一個(gè)與所述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
[0014] 訓(xùn)練模塊,用于根據(jù)第m-1幀重構(gòu)幀訓(xùn)練所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1
[0015] 參數(shù)更新模塊,用于基于所述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)所述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
[0016] 訓(xùn)練完成模塊,用于所述幀序列中每一幀都輸入所述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
[0017] 本發(fā)明實(shí)施例的第三方面提供了一種視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備,包括存儲(chǔ)器、處理器以及存儲(chǔ)在上述存儲(chǔ)器中并可在上述處理器上運(yùn)行的計(jì)算機(jī)程序,上述處理器執(zhí)行上述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上第一方面所提供的方法的步驟。
[0018] 本發(fā)明實(shí)施例的第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),上述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,上述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上第一方面所提供的方法的步驟。
[0019] 本發(fā)明實(shí)施例與現(xiàn)有技術(shù)相比存在的有益效果是:
[0020] 本發(fā)明利用視頻序列作為訓(xùn)練樣本,將視頻壓縮網(wǎng)絡(luò)恢復(fù)的當(dāng)前幀的重建幀作為參考幀,從而讓視頻壓縮網(wǎng)絡(luò)學(xué)習(xí)到重建幀的特征分布,使得視頻壓縮網(wǎng)絡(luò)能夠有更好的重建能附圖說(shuō)明
[0021] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0022] 圖1是本發(fā)明實(shí)施例提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法的實(shí)現(xiàn)流程示意圖;
[0023] 圖2是本發(fā)明實(shí)施例提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置的示意圖;
[0024] 圖3是本發(fā)明實(shí)施例提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備的示意圖。

具體實(shí)施方式

[0025] 以下描述中,為了說(shuō)明而不是為了限定,提出了諸如特定系統(tǒng)結(jié)構(gòu)、技術(shù)之類的具體細(xì)節(jié),以便透徹理解本發(fā)明實(shí)施例。然而,本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)清楚,在沒(méi)有這些具體細(xì)節(jié)的其它實(shí)施例中也可以實(shí)現(xiàn)本發(fā)明。在其它情況中,省略對(duì)眾所周知的系統(tǒng)、裝置、電路以及方法的詳細(xì)說(shuō)明,以免不必要的細(xì)節(jié)妨礙本發(fā)明的描述。
[0026] 為了說(shuō)明本發(fā)明所述的技術(shù)方案,下面通過(guò)具體實(shí)施例來(lái)進(jìn)行說(shuō)明。
[0027] 實(shí)施例一
[0028] 圖1示出了本發(fā)明實(shí)施例一提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法的實(shí)現(xiàn)流程,該方法的執(zhí)行主體可以是終端設(shè)備,詳述如下:
[0029] 步驟S101,將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù)。
[0030] 可選地,當(dāng)連續(xù)的圖像變化每秒超過(guò)24幀畫面以上時(shí),根據(jù)視覺(jué)暫留原理,人眼無(wú)法辨別單幅的靜態(tài)畫面,看上去是平滑連續(xù)的視覺(jué)效果,這樣連續(xù)的畫面叫做視頻。所以視頻是由若干幀畫面構(gòu)成的,即視頻為一個(gè)包含N幀的幀序列,其中N為正整數(shù)。
[0031] 步驟S102,構(gòu)建一個(gè)與上述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò)。
[0032] 可選地,構(gòu)建一個(gè)與上述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò),其中上述視頻壓縮網(wǎng)絡(luò)可以是卷積神經(jīng)網(wǎng)絡(luò)。可選地,構(gòu)建壓縮網(wǎng)絡(luò)可以是人工構(gòu)建的網(wǎng)絡(luò),也可以采用網(wǎng)絡(luò)搜索的方式搭建一個(gè)網(wǎng)絡(luò),也可以是兩者的結(jié)合,此處不做限定。
[0033] 進(jìn)一步地,對(duì)于網(wǎng)絡(luò)中的訓(xùn)練參數(shù)(如學(xué)習(xí)率、批處理參數(shù)、權(quán)值衰減等),可以采用隨機(jī)搜索(Random?search)、網(wǎng)格搜索(Grid?search)、貝葉斯優(yōu)化(Bayesian?optimization)、強(qiáng)化學(xué)習(xí)(Reinforcement?learning)、進(jìn)化算法(Evolutionary?Algorithm)等Hyperparameter?optimization(HO)框架來(lái)進(jìn)行設(shè)置。對(duì)于定義網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)(如網(wǎng)絡(luò)的層數(shù)、每層的算子、卷積中的濾波器尺寸等),通過(guò)網(wǎng)絡(luò)架構(gòu)搜索(Neural?Architecture?Search,NAS)來(lái)進(jìn)行調(diào)優(yōu),應(yīng)理解,此處僅針對(duì)構(gòu)建網(wǎng)絡(luò)時(shí)調(diào)參的一些方法進(jìn)行舉例說(shuō)明,不應(yīng)對(duì)構(gòu)建網(wǎng)絡(luò)的過(guò)程構(gòu)成任何限定。
[0034] 步驟S103,根據(jù)第m-1幀重構(gòu)幀訓(xùn)練上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1
[0035] S1031:將上述第m-1幀重構(gòu)幀作為上述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀;
[0036] 可選地,將上述第m-1幀重構(gòu)幀輸入視頻壓縮網(wǎng)絡(luò)中,上述視頻壓縮網(wǎng)絡(luò)可以為卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)可以包括至少一個(gè)卷積層。進(jìn)一步地,上述卷積層可包括卷積核,輸入卷積層的圖像經(jīng)過(guò)與卷積核的卷積運(yùn)算后去除冗余的圖像信息,輸出包含特征信息的圖像。如果上述卷積核的尺寸大于1×1,則卷積層可以輸出多幅尺寸小于輸入圖像的特征圖,在經(jīng)過(guò)多個(gè)卷積層的處理后,輸入卷積神經(jīng)網(wǎng)絡(luò)的圖像的尺寸經(jīng)過(guò)了多級(jí)收縮,得到多幅尺寸小于輸入神經(jīng)網(wǎng)絡(luò)的圖像尺寸的特征圖。進(jìn)一步地,在本發(fā)明實(shí)施例中,將第m-1幀重構(gòu)幀輸入到視頻壓縮網(wǎng)絡(luò)生成對(duì)應(yīng)的第m幀重構(gòu)幀可以是反卷積操作,反卷積操作則與上述描述的輸入圖像去除冗余信息生成特征圖像的過(guò)程相反。
[0037] 其中,當(dāng)m=2時(shí),上述第m-1幀重構(gòu)幀即為上述訓(xùn)練視頻的第1幀。即當(dāng)m-1=1的時(shí)候,由于每一幀都需要利用上一幀的重構(gòu)幀,而第m-1即第1幀前面沒(méi)有任何幀,故將第1幀直接作為第2幀壓縮時(shí)的輸入。
[0038] S1032:計(jì)算上述第m幀重構(gòu)幀與第m幀的損失函數(shù),并根據(jù)上述損失函數(shù)進(jìn)行梯度更新,調(diào)整上述視頻壓縮網(wǎng)絡(luò)的權(quán)重參數(shù);
[0039] 可選地,第m幀重構(gòu)幀與第m幀之間的損失函數(shù)可以使用MSE(均方誤差)。具體的,MSE的公式如公式(1)所示:
[0040]
[0041] 其中,H為第m幀重構(gòu)幀的高,W為第m幀重構(gòu)幀的寬,C為第m幀重構(gòu)幀通道數(shù),X’代表第m幀重構(gòu)幀,X代表第m幀,X’i,j,k代表第m幀重構(gòu)幀中第k通道第i行第j列的數(shù)值,Xi,j,k代表第m幀中第k通道第i行第j列的數(shù)值。
[0042] 可選地,梯度更新的公式如公式(2)所示:
[0043] W′=W-αΔW??(2)
[0044] 其中,W代表網(wǎng)絡(luò)的權(quán)重參數(shù),W’代表更新后的權(quán)重參數(shù),α是預(yù)先設(shè)定的學(xué)習(xí)率,ΔW是計(jì)算梯度。
[0045] 可選地,在進(jìn)行梯度更新的時(shí)候,可以使用現(xiàn)有的自適應(yīng)梯度優(yōu)化器來(lái)進(jìn)行計(jì)算。具體地,可以使用Adam優(yōu)化器。進(jìn)一步地,在Adam優(yōu)化器中輸入上述MSE計(jì)算結(jié)果、網(wǎng)絡(luò)的權(quán)重參數(shù)、預(yù)先設(shè)定的學(xué)習(xí)率,即可得到更新后的權(quán)重參數(shù)。
[0046] 進(jìn)一步地,將上述計(jì)算得到的更新后的權(quán)重參數(shù)替換掉視頻壓縮網(wǎng)絡(luò)中原有的權(quán)重參數(shù)。
[0047] S1033:重復(fù)執(zhí)行S1031到S1032直至上述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止。
[0048] 可選地,上述重復(fù)執(zhí)行S1031到S1032直至上述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止包括:
[0049] 重復(fù)執(zhí)行S1到S2直至上述視頻壓縮網(wǎng)絡(luò)達(dá)到預(yù)設(shè)的重建質(zhì)量為止
[0050] 或
[0051] 重復(fù)執(zhí)行S1到S2的次數(shù)達(dá)到預(yù)設(shè)次數(shù)為止。
[0052] 進(jìn)一步地,重復(fù)執(zhí)行S1031到S1032的次數(shù)達(dá)到預(yù)設(shè)次數(shù)為止,其中預(yù)設(shè)次數(shù)為人工預(yù)先設(shè)置在視頻壓縮程序中或者預(yù)先設(shè)置在裝載視頻壓縮程序的終端設(shè)備中。
[0053] 進(jìn)一步地,重復(fù)執(zhí)行S1031到S1032直至視頻壓縮網(wǎng)絡(luò)達(dá)到預(yù)設(shè)的重建質(zhì)量為止。其中,上述視頻壓縮網(wǎng)絡(luò)的重建質(zhì)量可以使用峰值信噪比PSNR(Peak?Signal?to?Noise?Ratio)和像素比特BPP(bits?per?pixel)來(lái)表示。具體地,將測(cè)試圖集放入到上述視頻壓縮網(wǎng)絡(luò)中測(cè)試上述視頻壓縮網(wǎng)絡(luò)的重建質(zhì)量,可以用峰值信噪比PSNR和像素比特BPP來(lái)表示。
可選地,在固定的像素比特BPP下,判斷峰值信噪比PSNR是否達(dá)到預(yù)設(shè)閾值,峰值信噪比PSNR越高則代表幀在壓縮中損失的信息越少。可選地,上述測(cè)試圖集可以包括24張柯達(dá)標(biāo)準(zhǔn)測(cè)試圖集,此處不作限定。
[0054] 步驟S104,基于上述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)上述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀。
[0055] 可選地,將上述第m-1幀重構(gòu)幀和第m幀輸入上述權(quán)重參數(shù)更新后的視頻壓縮網(wǎng)絡(luò)中,得到第m幀重構(gòu)幀。
[0056] 步驟S105,上述幀序列中每一幀都輸入上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
[0057] 可選地,步驟S101至步驟S105為一個(gè)視頻訓(xùn)練樣本的訓(xùn)練過(guò)程。在本實(shí)施例中,可以包括多個(gè)視頻訓(xùn)練樣本,在一個(gè)視頻訓(xùn)練樣本執(zhí)行步驟S101至步驟S105后訓(xùn)練完的視頻壓縮網(wǎng)絡(luò),作為下一個(gè)視頻訓(xùn)練樣本的視頻壓縮網(wǎng)絡(luò)繼續(xù)進(jìn)行訓(xùn)練,此處不對(duì)視頻訓(xùn)練樣本的數(shù)量進(jìn)行限定。
[0058] 本實(shí)施例中,通過(guò)利用視頻序列作為訓(xùn)練樣本,將視頻壓縮網(wǎng)絡(luò)恢復(fù)的當(dāng)前幀的重建幀作為參考幀,從而讓視頻壓縮網(wǎng)絡(luò)學(xué)習(xí)到重建幀的特征分布,使得視頻壓縮網(wǎng)絡(luò)能夠有更好的重建能力。
[0059] 應(yīng)理解,上述實(shí)施例中各步驟的序號(hào)的大小并不意味著執(zhí)行順序的先后,各過(guò)程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對(duì)本發(fā)明實(shí)施例的實(shí)施過(guò)程構(gòu)成任何限定。
[0060] 實(shí)施例二
[0061] 圖2示出了本發(fā)明實(shí)施例提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置的結(jié)構(gòu)框圖,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分。該視頻壓縮網(wǎng)絡(luò)訓(xùn)練裝置2包括:視頻幀模塊21、網(wǎng)絡(luò)構(gòu)建模塊22、訓(xùn)練模塊23、參數(shù)更新模塊24、訓(xùn)練完成模塊25。
[0062] 其中,視頻幀模塊21,用于將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù);
[0063] 網(wǎng)絡(luò)構(gòu)建模塊22,用于構(gòu)建一個(gè)與上述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
[0064] 訓(xùn)練模塊23,用于根據(jù)第m-1幀重構(gòu)幀訓(xùn)練上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1
[0065] 參數(shù)更新模塊24,用于基于上述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)上述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
[0066] 訓(xùn)練完成模塊25,用于上述幀序列中每一幀都輸入上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
[0067] 可選地,上述訓(xùn)練模塊23包括:
[0068] 重構(gòu)幀單元,用于將上述第m-1幀重構(gòu)幀作為上述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀;
[0069] 參數(shù)調(diào)整單元,用于計(jì)算上述第m幀重構(gòu)幀與第m幀的損失函數(shù),并根據(jù)上述損失函數(shù)進(jìn)行梯度更新,調(diào)整上述視頻壓縮網(wǎng)絡(luò)的權(quán)重參數(shù);
[0070] 循環(huán)單元,用于重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至上述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止。
[0071] 進(jìn)一步地,上述重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至上述視頻壓縮網(wǎng)絡(luò)滿足預(yù)設(shè)條件為止包括:
[0072] 重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元直至上述視頻壓縮網(wǎng)絡(luò)達(dá)到預(yù)設(shè)的重建質(zhì)量為止
[0073] 或
[0074] 重復(fù)執(zhí)行重構(gòu)幀單元到參數(shù)調(diào)整單元的次數(shù)達(dá)到預(yù)設(shè)次數(shù)為止。
[0075] 可選地,上述將上述第m-1幀重構(gòu)幀作為上述視頻壓縮網(wǎng)絡(luò)的輸入,得到第m幀重構(gòu)幀包括:
[0076] 當(dāng)m=2時(shí),上述第m-1幀重構(gòu)幀即為上述訓(xùn)練視頻的第1幀。
[0077] 實(shí)施例三
[0078] 圖3是本發(fā)明一實(shí)施例提供的視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備的示意圖。如圖3所示,該實(shí)施例的視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3包括:處理器30、存儲(chǔ)器31以及存儲(chǔ)在上述存儲(chǔ)器31中并可在上述處理器30上運(yùn)行的計(jì)算機(jī)程序32,例如視頻壓縮網(wǎng)絡(luò)訓(xùn)練程序。上述處理器30執(zhí)行上述計(jì)算機(jī)程序32時(shí)實(shí)現(xiàn)上述各個(gè)視頻壓縮網(wǎng)絡(luò)訓(xùn)練方法實(shí)施例中的步驟,例如圖1所示的步驟101至105?;蛘?,上述處理器30執(zhí)行上述計(jì)算機(jī)程序32時(shí)實(shí)現(xiàn)上述各裝置實(shí)施例中各模塊/單元的功能,例如圖2所示模塊21至25的功能。
[0079] 示例性的,上述計(jì)算機(jī)程序32可以被分割成一個(gè)或多個(gè)模塊/單元,上述一個(gè)或者多個(gè)模塊/單元被存儲(chǔ)在上述存儲(chǔ)器31中,并由上述處理器30執(zhí)行,以完成本發(fā)明。上述一個(gè)或多個(gè)模塊/單元可以是能夠完成特定功能的一系列計(jì)算機(jī)程序指令段,該指令段用于描述上述計(jì)算機(jī)程序32在上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3中的執(zhí)行過(guò)程。例如,上述計(jì)算機(jī)程序32可以被分割成視頻幀模塊、網(wǎng)絡(luò)構(gòu)建模塊、訓(xùn)練模塊、參數(shù)更新模塊、訓(xùn)練完成模塊,各模塊具體功能如下:
[0080] 視頻幀模塊,用于將訓(xùn)練視頻表示為一個(gè)包含N幀的幀序列,其中N為正整數(shù);
[0081] 網(wǎng)絡(luò)構(gòu)建模塊,用于構(gòu)建一個(gè)與上述訓(xùn)練視頻對(duì)應(yīng)的視頻壓縮網(wǎng)絡(luò);
[0082] 訓(xùn)練模塊,用于根據(jù)第m-1幀重構(gòu)幀訓(xùn)練上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù),其中1
[0083] 參數(shù)更新模塊,用于基于上述更新權(quán)重參數(shù)后的視頻壓縮網(wǎng)絡(luò),根據(jù)上述第m-1幀重構(gòu)幀和第m幀得到第m幀重構(gòu)幀;
[0084] 訓(xùn)練完成模塊,用于上述幀序列中每一幀都輸入上述視頻壓縮網(wǎng)絡(luò)并更新權(quán)重參數(shù)后,得到訓(xùn)練完成的視頻壓縮網(wǎng)絡(luò)。
[0085] 上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3可以是桌上型計(jì)算機(jī)、筆記本、掌上電腦及服務(wù)器等計(jì)算設(shè)備。上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備可包括,但不僅限于,處理器30、存儲(chǔ)器31。本領(lǐng)域技術(shù)人員可以理解,圖3僅僅是視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的示例,并不構(gòu)成對(duì)視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件,例如上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備還可以包括輸入輸出設(shè)備、網(wǎng)絡(luò)接入設(shè)備、總線等。
[0086] 所稱處理器30可以是中央處理單元(Central?Processing?Unit,CPU),還可以是其他通用處理器、數(shù)字信號(hào)處理器(Digital?Signal?Processor,DSP)、專用集成電路(Application?Specific?Integrated?Circuit,ASIC)、現(xiàn)成可編程陣列(Field-Programmable?Gate?Array,F(xiàn)PGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。
[0087] 上述存儲(chǔ)器31可以是上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的內(nèi)部存儲(chǔ)單元,例如視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的硬盤或內(nèi)存。上述存儲(chǔ)器31也可以是上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的外部存儲(chǔ)設(shè)備,例如上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3上配備的插接式硬盤,智能存儲(chǔ)卡(Smart?Media?Card,SMC),安全數(shù)字(Secure?Digital,SD)卡,閃存卡(Flash?Card)等。進(jìn)一步地,上述存儲(chǔ)器31還可以既包括上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備3的內(nèi)部存儲(chǔ)單元也包括外部存儲(chǔ)設(shè)備。上述存儲(chǔ)器31用于存儲(chǔ)上述計(jì)算機(jī)程序以及上述視頻壓縮網(wǎng)絡(luò)訓(xùn)練終端設(shè)備所需的其他程序和數(shù)據(jù)。上述存儲(chǔ)器31還可以用于暫時(shí)地存儲(chǔ)已經(jīng)輸出或者將要輸出的數(shù)據(jù)。
[0088] 由上可見(jiàn),本實(shí)施例通過(guò)利用視頻序列作為訓(xùn)練樣本,將視頻壓縮網(wǎng)絡(luò)恢復(fù)的當(dāng)前幀的重建幀作為參考幀,從而讓視頻壓縮網(wǎng)絡(luò)學(xué)習(xí)到重建幀的特征分布,使得視頻壓縮網(wǎng)絡(luò)能夠有更好的重建能力。
[0089] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡(jiǎn)潔,僅以上述各功能單元、模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中可以根據(jù)需要而將以上安全數(shù)字閃存卡等,進(jìn)一步地,上述存儲(chǔ)器還可以既包括上述某某裝置終端設(shè)備的內(nèi)部存儲(chǔ)單元也包括外部存儲(chǔ)設(shè)備,上述存儲(chǔ)器用于存儲(chǔ)上述計(jì)算機(jī)程序以及上述終端設(shè)備所需要的其他程序和數(shù)據(jù),上述存儲(chǔ)器還可以用于暫時(shí)的存儲(chǔ)已經(jīng)輸出或者將要輸出的數(shù)據(jù)。
[0090] 所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡(jiǎn)潔,僅以上述各功能單元、模塊的劃分進(jìn)行舉例說(shuō)明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能單元、模塊完成,即將上述裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能單元或模塊,以完成以上描述的全部或者部分功能。實(shí)施例中的各功能單元、模塊可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中,上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。另外,各功能單元、模塊的具體名稱也只是為了便于相互區(qū)分,并不用于限制本申請(qǐng)的保護(hù)范圍。上述系統(tǒng)中單元、模塊的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
[0091] 在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述或記載的部分,可以參見(jiàn)其它實(shí)施例的相關(guān)描述。
[0092] 本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計(jì)算機(jī)軟件和電子硬件的結(jié)合來(lái)實(shí)現(xiàn)。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
[0093] 在本發(fā)明所提供的實(shí)施例中,應(yīng)該理解到,所揭露的裝置/終端設(shè)備和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置/終端設(shè)備實(shí)施例僅僅是示意性的,例如,上述模塊或單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通訊連接可以是通過(guò)一些接口,裝置或單元的間接耦合或通訊連接,可以是電性,機(jī)械或其它的形式。
[0094] 所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0095] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
[0096] 所述集成的模塊/單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,也可以通過(guò)計(jì)算機(jī)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的計(jì)算機(jī)程序可存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該計(jì)算機(jī)程序在被處理器執(zhí)行時(shí),可實(shí)現(xiàn)上述各個(gè)方法實(shí)施例的步驟。其中,所述計(jì)算機(jī)程序包括計(jì)算機(jī)程序代碼,所述計(jì)算機(jī)程序代碼可以為源代碼形式、對(duì)象代碼形式、可執(zhí)行文件或某些中間形式等。所述計(jì)算機(jī)可讀介質(zhì)可以包括:能夠攜帶所述計(jì)算機(jī)程序代碼的任何實(shí)體或裝置、記錄介質(zhì)、U盤、移動(dòng)硬盤、磁碟、光盤、計(jì)算機(jī)存儲(chǔ)器、只讀存儲(chǔ)器(ROM,Read-Only?Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random?Access?Memory)、電載波信號(hào)、電信信號(hào)以及軟件分發(fā)介質(zhì)等。需要說(shuō)明的是,所述計(jì)算機(jī)可讀介質(zhì)包含的內(nèi)容可以根據(jù)司法管轄區(qū)內(nèi)立法和專利實(shí)踐的要求進(jìn)行適當(dāng)?shù)脑鰷p,例如在某些司法管轄區(qū),根據(jù)立法和專利實(shí)踐,計(jì)算機(jī)可讀介質(zhì)不包括是電載波信號(hào)和電信信號(hào)。
[0097] 以上所述實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
高效檢索全球?qū)@?/div>

專利匯是專利免費(fèi)檢索,專利查詢,專利分析-國(guó)家發(fā)明專利查詢檢索分析平臺(tái),是提供專利分析,專利查詢,專利檢索等數(shù)據(jù)服務(wù)功能的知識(shí)產(chǎn)權(quán)數(shù)據(jù)服務(wù)商。

我們的產(chǎn)品包含105個(gè)國(guó)家的1.26億組數(shù)據(jù),免費(fèi)查、免費(fèi)專利分析。

申請(qǐng)?jiān)囉?/a>

QQ群二維碼
意見(jiàn)反饋