白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

首頁 / 專利庫 / 數(shù)學(xué)與統(tǒng)計(jì) / 信息檢索 / 基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法

基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法

閱讀:1034發(fā)布:2020-05-11

專利匯可以提供基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法專利檢索,專利查詢,專利分析的服務(wù)。并且本 發(fā)明 提出了一種基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,用于解決現(xiàn)有跨模態(tài)哈希檢索方法中存在的檢索精率低的技術(shù)問題。實(shí)現(xiàn)步驟為:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)分成 訓(xùn)練數(shù)據(jù) 和查詢數(shù)據(jù);獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼;采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù);對(duì)目標(biāo)損失函數(shù)進(jìn)行順序 迭代 優(yōu)化;計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;獲取查詢數(shù)據(jù)的檢索結(jié)果。本發(fā)明提供的方案采用三元組信息構(gòu)建目標(biāo)損失函數(shù),增加語義信息,同時(shí)加入模態(tài)內(nèi)的損失函數(shù),增加方法的判別性,能夠有效地提高跨模態(tài)檢索的 精度 。本發(fā)明可用于 物聯(lián)網(wǎng) 信息檢索 、 電子 商務(wù)以及移動(dòng)設(shè)備等的圖片與文本互搜索服務(wù)。,下面是基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法專利的具體信息內(nèi)容。

1.一種基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,其特征在于,包括如下步驟:
(1)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
確定兩種模態(tài)的數(shù)據(jù):圖像數(shù)據(jù)和文本數(shù)據(jù),提取文本數(shù)據(jù)的Bag-of-words特征,保留圖像數(shù)據(jù)的原始像素特征,并將圖像數(shù)據(jù)分成圖像訓(xùn)練數(shù)據(jù)和圖像查詢數(shù)據(jù),將文本數(shù)據(jù)分成文本訓(xùn)練數(shù)據(jù)和文本查詢數(shù)據(jù);
(2)獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼:
將文本訓(xùn)練數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本訓(xùn)練數(shù)據(jù)哈希碼,同時(shí)將圖像訓(xùn)練數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像訓(xùn)練數(shù)據(jù)哈希碼;
(3)采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù)J:
(3a)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像文本模態(tài)間的三元組損失函數(shù)J1:
其中,x表示文本模態(tài);y表示圖像模態(tài); 表示三元組;qm,pm,nm分別表示錨點(diǎn)數(shù)據(jù),正例數(shù)據(jù)和負(fù)例數(shù)據(jù); 表示圖像深度網(wǎng)絡(luò)輸出的圖像訓(xùn)練數(shù)據(jù)哈希碼; 表示文本深度網(wǎng)絡(luò)輸出的文本訓(xùn)練數(shù)據(jù)哈希碼;k表示哈希碼長度;N表示數(shù)據(jù)個(gè)數(shù);M表示三元組個(gè)數(shù); 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;σ(x)表示sigmoid函數(shù) 超參數(shù)α表示一個(gè)閾值參數(shù);
其中wx和wy分別表示文本深度網(wǎng)絡(luò)參數(shù)和圖像深度網(wǎng)絡(luò)
的網(wǎng)絡(luò)參數(shù);
(3b)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本圖像模態(tài)間的三元組損失函數(shù)J2:
其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3c)將圖像文本模態(tài)間的三元組損失函數(shù)J1與文本圖像模態(tài)間的三元組損失函數(shù)J2相加,得到模態(tài)間的三元組損失函數(shù)Jinter;
(3d)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像模態(tài)內(nèi)的三元組損失函數(shù)J3:
其中, 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3f)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本模態(tài)內(nèi)的三元組損失函數(shù)J4:
其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3g)將圖像模態(tài)內(nèi)的三元組損失函數(shù)J3與文本模態(tài)內(nèi)的三元組損失函數(shù)J4相加,得到模態(tài)內(nèi)的三元組損失函數(shù)Jintra;
(3h)利用步驟(2)得到的圖像訓(xùn)練數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼計(jì)算圖正則化損失函數(shù)Jre,并將圖正則化損失函數(shù)Jre與模態(tài)間的三元組損失函數(shù)Jinter和模態(tài)內(nèi)的三元組損失函數(shù)Jintra相加,得到目標(biāo)損失函數(shù)J,其中,Jre的表達(dá)式為:
s.t.B=Bx=By∈{-1,1}k×N
其中,S表示相似矩陣; 表示統(tǒng)一的哈希碼;L表示拉普拉斯矩陣;Bx表示文本訓(xùn)練數(shù)據(jù)哈希碼;By表示圖像訓(xùn)練數(shù)據(jù)哈希碼;γ,η和β表示平衡參數(shù);Z表示元素全為1的矩陣; 表示矩陣的F范數(shù);tr(·)表示矩陣的跡;
(4)對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化,得到文本深度網(wǎng)絡(luò)參數(shù)wx、圖像深度網(wǎng)絡(luò)參數(shù)wy和圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B;
(5)計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;
(5a)將文本查詢數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本查詢數(shù)據(jù)哈希碼
其中,xq表示一個(gè)文本查詢數(shù)據(jù);
(5b)將圖像查詢數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像查詢數(shù)據(jù)哈希碼其中,yq表示一個(gè)圖像查詢數(shù)據(jù);
(6)獲取查詢數(shù)據(jù)檢索結(jié)果:
計(jì)算圖像查詢數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θyx,同時(shí)計(jì)算文本查詢數(shù)據(jù)哈希碼和圖像訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θxy,并按照由小到大的順序?qū)Ζ葃x和θxy分別進(jìn)行排序,得到多個(gè)與查詢數(shù)據(jù)距離較小的訓(xùn)練數(shù)據(jù)作為檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,其特征在于,步驟(4)所述的對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
(4a)固定目標(biāo)損失函數(shù)J中的文本深度網(wǎng)絡(luò)參數(shù)wx和圖像深度網(wǎng)絡(luò)參數(shù)wy,并令得到圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B:
其中, 表示圖像深度網(wǎng)絡(luò)輸出的圖像訓(xùn)練數(shù)據(jù)哈希碼; 表示文本深度
網(wǎng)絡(luò)輸出的文本訓(xùn)練數(shù)據(jù)哈希碼;L表示拉普拉斯矩陣;I表示單位矩陣;β和γ表示平衡參數(shù);
(4b)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和圖像深度網(wǎng)絡(luò)參數(shù)wy,使用后向傳播方法學(xué)習(xí)文本深度網(wǎng)絡(luò)參數(shù)wx;對(duì)第i個(gè)文本訓(xùn)練數(shù)據(jù)的哈希碼G*i求偏導(dǎo)可得:
其中,M表示三元組個(gè)數(shù);σ(x)表示sigmoid函數(shù) 表示第i個(gè)文本訓(xùn)練
數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;超參數(shù)α表示一個(gè)閾值;
表示統(tǒng)一的哈希碼;γ和η表示平衡參數(shù);Z表示元素全為1的矩陣;
(4c)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和文本深度網(wǎng)絡(luò)參數(shù)wx,使用后向傳播法方學(xué)習(xí)圖像深度網(wǎng)絡(luò)參數(shù)wy;對(duì)第i個(gè)圖像訓(xùn)練數(shù)據(jù)的哈希碼F*i求導(dǎo)可得:
其中, 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(4d)令迭代次數(shù)加一,返回步驟(4a)繼續(xù)迭代直至最大迭代次數(shù)或目標(biāo)損失函數(shù)J小于預(yù)先設(shè)置的損失常數(shù)。

說明書全文

基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法

技術(shù)領(lǐng)域

[0001] 本發(fā)明屬于計(jì)算機(jī)視覺技術(shù)領(lǐng)域,涉及大規(guī)模的圖像數(shù)據(jù)和文本數(shù)據(jù)之間的互相檢索,具體是一種基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,可用于物聯(lián)網(wǎng)信息檢索、電子商務(wù)以及移動(dòng)設(shè)備等的圖片與文本互搜索服務(wù)。

背景技術(shù)

[0002] 隨著互聯(lián)網(wǎng)技術(shù)和社交網(wǎng)站的飛速發(fā)展,每天都會(huì)產(chǎn)生海量的多媒體數(shù)據(jù),比如文本,圖像,視頻和音頻等,實(shí)現(xiàn)跨模態(tài)數(shù)據(jù)之間的互相檢索已經(jīng)成為信息檢索領(lǐng)域中的研究熱點(diǎn)。哈希方法法是一種非常有效的信息檢索方法,具有低耗內(nèi)存和快速檢索的優(yōu)點(diǎn)。哈希方法可以分成單模態(tài)哈希方法,多模態(tài)哈希方法和跨模態(tài)哈希方法。單模態(tài)哈希方法的查詢數(shù)據(jù)和檢索結(jié)果屬于同一模態(tài),數(shù)據(jù)特征來自同構(gòu)特征空間。多模態(tài)哈希方法的查詢數(shù)據(jù)和檢索結(jié)果屬于同一模態(tài),數(shù)據(jù)特征來自異質(zhì)特征空間??缒B(tài)哈希方法的查詢數(shù)據(jù)和檢索結(jié)果屬于不同模態(tài),數(shù)據(jù)特征來自異質(zhì)特征空間??缒B(tài)哈希檢索方法的核心思想是將不同模態(tài)的數(shù)據(jù)投影到一個(gè)通用的漢明空間,在這個(gè)空間中得到不同模態(tài)數(shù)據(jù)的哈希碼,其中哈希碼之間的漢明距離與原始數(shù)據(jù)之間的語義相似性相對(duì)應(yīng),然后通過計(jì)算哈希碼之間的漢明距離返回檢索結(jié)果??缒B(tài)哈希方法可以分為無監(jiān)督方法和有監(jiān)督方法,無監(jiān)督跨模態(tài)哈希方法主要通過挖掘和保持多模態(tài)數(shù)據(jù)的潛在相關(guān)性來獲得哈希編碼,而有監(jiān)督跨模態(tài)哈希方法旨在利用訓(xùn)練數(shù)據(jù)類標(biāo)信息的語義相似性,來提高哈希檢索的檢索精度。淺層的有監(jiān)督跨模態(tài)哈希檢索方法將特征提取過程和哈希碼學(xué)習(xí)過程分開,導(dǎo)致兩個(gè)過程不能很好的兼容。而深度的有監(jiān)督跨模態(tài)哈希檢索方法將特征提取過程和哈希碼學(xué)習(xí)過程結(jié)合在一個(gè)端對(duì)端的深度網(wǎng)絡(luò)中,提取多層抽象特征并能有效地捕捉不同模態(tài)數(shù)據(jù)之間的異質(zhì)關(guān)聯(lián),提高檢索精度??缒B(tài)哈希檢索技術(shù)的關(guān)鍵在于對(duì)不同模態(tài)數(shù)據(jù)的關(guān)系進(jìn)行建模,難點(diǎn)就是跨越語義鴻溝,所以如何設(shè)計(jì)高精度的跨模態(tài)哈希檢索方法是現(xiàn)階段亟待解決的問題。當(dāng)前,研究人員已經(jīng)提出一些深度的有監(jiān)督跨模態(tài)哈希檢索方法。
[0003] 例如Qing-Yuan?Jiang和Wu-Jun?Li在2017年的Computer?Vision?and?Pattern?Recognition會(huì)議中發(fā)表了名為“Deep?Cross-Modal?Hashing”的文章,公開了一種基于深度學(xué)習(xí)的跨模態(tài)哈希檢索方法,文中提出將特征提取過程和哈希碼學(xué)習(xí)過程結(jié)合在一個(gè)端對(duì)端的深度網(wǎng)絡(luò)中,實(shí)現(xiàn)兩個(gè)過程的兼容,提高檢索精度。由于該方法使用成對(duì)監(jiān)督信息建立目標(biāo)損失函數(shù),僅描述兩個(gè)數(shù)據(jù)之間的成對(duì)關(guān)系缺乏豐富的語義信息,而且該方法只考慮模態(tài)間的相似性而忽略了模態(tài)內(nèi)的相似性,檢索精度還有待提高。

發(fā)明內(nèi)容

[0004] 本發(fā)明的目的在于針對(duì)上述已有技術(shù)的不足,提出基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,用于解決現(xiàn)有跨模態(tài)哈希檢索方法中存在的檢索精度低的技術(shù)問題。
[0005] 為實(shí)現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案包括如下步驟:
[0006] (1)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
[0007] 確定兩種模態(tài)的數(shù)據(jù):圖像數(shù)據(jù)和文本數(shù)據(jù),提取文本數(shù)據(jù)的Bag-of-words特征,保留圖像數(shù)據(jù)的原始像素特征,并將圖像數(shù)據(jù)分成圖像訓(xùn)練數(shù)據(jù)和圖像查詢數(shù)據(jù),將文本數(shù)據(jù)分成文本訓(xùn)練數(shù)據(jù)和文本查詢數(shù)據(jù);
[0008] (2)獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼:
[0009] 將文本訓(xùn)練數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本訓(xùn)練數(shù)據(jù)哈希碼,同時(shí)將圖像訓(xùn)練數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像訓(xùn)練數(shù)據(jù)哈希碼;
[0010] (3)采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù)J:
[0011] (3a)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像文本模態(tài)間的三元組損失函數(shù)J1;
[0012] (3b)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本圖像模態(tài)間的三元組損失函數(shù)J2;
[0013] (3c)將圖像文本模態(tài)間的三元組損失函數(shù)J1與文本圖像模態(tài)間的三元組損失函數(shù)J2相加,得到模態(tài)間的三元組損失函數(shù)Jinter;
[0014] (3d)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像模態(tài)內(nèi)的三元組損失函數(shù)J3;
[0015] (3f)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本模態(tài)內(nèi)的三元組損失函數(shù)J4;
[0016] (3g)將圖像模態(tài)內(nèi)的三元組損失函數(shù)J3與文本模態(tài)內(nèi)的三元組損失函數(shù)J4相加,得到模態(tài)內(nèi)的三元組損失函數(shù)Jintra;
[0017] (3h)利用步驟(2)得到的圖像訓(xùn)練數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼計(jì)算圖正則化損失函數(shù)Jre,并將圖正則化損失函數(shù)Jre與模態(tài)間的三元組損失函數(shù)Jinter和模態(tài)內(nèi)的三元組損失函數(shù)Jintra相加,得到目標(biāo)損失函數(shù)J;
[0018] (4)對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
[0019] 對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化,得到文本深度網(wǎng)絡(luò)參數(shù)wx、圖像深度網(wǎng)絡(luò)參數(shù)wy和圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B;
[0020] (5)計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;
[0021] (5a)將文本查詢數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本查詢數(shù)據(jù)哈希碼
[0022]
[0023] 其中,xq表示一個(gè)文本查詢數(shù)據(jù),wx表示文本深度網(wǎng)絡(luò)參數(shù);
[0024] (5b)將圖像查詢數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像查詢數(shù)據(jù)哈希碼
[0025]
[0026] 其中,yq表示一個(gè)圖像查詢數(shù)據(jù),wy表示圖像深度網(wǎng)絡(luò)參數(shù);
[0027] (6)獲取查詢數(shù)據(jù)檢索結(jié)果:
[0028] 計(jì)算圖像查詢數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θyx,同時(shí)計(jì)算文本查詢數(shù)據(jù)哈希碼和圖像訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θxy,并按照由小到大的順序?qū)Ζ葃x和θxy分別進(jìn)行排序,得到多個(gè)與查詢數(shù)據(jù)距離較小的訓(xùn)練數(shù)據(jù)作為檢索結(jié)果。
[0029] 本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn):
[0030] 本發(fā)明使用一個(gè)端對(duì)端的深度網(wǎng)絡(luò)將特征提取過程和哈希碼學(xué)習(xí)過程結(jié)合在同一個(gè)框架中,實(shí)現(xiàn)兩個(gè)過程的兼容,提出使用三元組監(jiān)督信息構(gòu)建目標(biāo)損失函數(shù),描述三個(gè)數(shù)據(jù)之間的相互關(guān)系以保留更豐富的語義信息,同時(shí)加入模態(tài)內(nèi)的損失函數(shù),增加目標(biāo)損失函數(shù)的判別性,明顯提高了跨模態(tài)哈希檢索的精度。附圖說明
[0031] 圖1為本發(fā)明的實(shí)現(xiàn)流程圖
[0032] 圖2為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在MIRFlicker25k數(shù)據(jù)庫下的準(zhǔn)確率-召回率實(shí)驗(yàn)結(jié)果曲線對(duì)比圖,其中,圖2(a)為編碼長度取16位的圖像查詢文本準(zhǔn)確率-召回率曲線圖,圖2(b)為編碼長度為16位的文本查詢圖像準(zhǔn)確率-召回率曲線圖;
[0033] 圖3為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在MIRFlickr25k數(shù)據(jù)庫下的準(zhǔn)確率實(shí)驗(yàn)結(jié)果曲線對(duì)比圖,其中,圖3(a)為編碼長度取32位的圖像查詢文本準(zhǔn)確率曲線圖,圖3(b)為編碼長度取32位的文本查詢圖像準(zhǔn)確率曲線圖;
[0034] 圖4為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在NUSWIDE數(shù)據(jù)庫下的準(zhǔn)確率-召回率實(shí)驗(yàn)結(jié)果曲線對(duì)比圖,其中,圖4(a)為編碼長度取16位的圖像查詢文本準(zhǔn)確率-召回率曲線圖,圖4(b)為編碼長度取16位的文本查詢圖像準(zhǔn)確率-召回率曲線圖;
[0035] 圖5為本發(fā)明與現(xiàn)有跨模態(tài)哈希檢索方法在NUSWIDE數(shù)據(jù)庫下的準(zhǔn)確率實(shí)驗(yàn)結(jié)果曲線對(duì)比圖,其中,圖5(a)為編碼長度取32位的圖像查詢文本準(zhǔn)確率曲線圖,圖5(b)為編碼長度取32位的文本查詢圖像準(zhǔn)確率曲線圖。

具體實(shí)施方式

[0036] 下面結(jié)合附圖和具體實(shí)施例,對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述,
[0037] 參照?qǐng)D1,本發(fā)明包括如下步驟:
[0038] 步驟1)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
[0039] 確定兩種模態(tài)的數(shù)據(jù):圖像數(shù)據(jù)和文本數(shù)據(jù),使用word2vec方法提取文本數(shù)據(jù)的Bag-of-words特征將文本表示成向量形式便于計(jì)算機(jī)處理,提取圖像數(shù)據(jù)的原始像素特征保留圖像的原始信息;并將80%的圖像數(shù)據(jù)作為圖像訓(xùn)練數(shù)據(jù),其余作為圖像查詢數(shù)據(jù);將與圖像訓(xùn)練數(shù)據(jù)相對(duì)應(yīng)的文本數(shù)據(jù)作為文本訓(xùn)練數(shù)據(jù),其余作為文本查詢數(shù)據(jù);
[0040] 步驟2)獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼:
[0041] 將文本訓(xùn)練數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本訓(xùn)練數(shù)據(jù)哈希碼,同時(shí)將圖像訓(xùn)練數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像訓(xùn)練數(shù)據(jù)哈希碼;
[0042] 步驟3)采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù)J。三元組監(jiān)督信息描述錨點(diǎn)數(shù)據(jù),正例數(shù)據(jù)和負(fù)例數(shù)據(jù)三個(gè)數(shù)據(jù) 之間的相互關(guān)系,其中錨點(diǎn)數(shù)據(jù)與正例數(shù)據(jù)之間具有相同的類標(biāo),錨點(diǎn)數(shù)據(jù)與負(fù)例數(shù)據(jù)之間具有不同的類標(biāo),我們利用三元組對(duì)數(shù)似然函數(shù)增加錨點(diǎn)數(shù)據(jù)與正例數(shù)據(jù)之間的相似性同時(shí)減少錨點(diǎn)數(shù)據(jù)與負(fù)例數(shù)據(jù)之間的相似性:
[0043] 步驟3a)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像文本模態(tài)間的三元組損失函數(shù)J1,其表達(dá)式為:
[0044]
[0045] 其中,x表示文本模態(tài);y表示圖像模態(tài); 表示三元組;qm,pm,nm分別表示錨點(diǎn)數(shù)據(jù),正例數(shù)據(jù)和負(fù)例數(shù)據(jù); 表示圖像深度網(wǎng)絡(luò)輸出的圖像訓(xùn)練數(shù)據(jù)哈希碼;表示文本深度網(wǎng)絡(luò)輸出的文本訓(xùn)練數(shù)據(jù)哈希碼;k表示哈希碼長度;N表示數(shù)據(jù)個(gè)數(shù);M表示三元組個(gè)數(shù); 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間
的漢明距離; 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距
離;σ(x)表示sigmoid函數(shù) 超參數(shù)α表示一個(gè)閾值參數(shù);
其中wx和wy分別表示文本深度網(wǎng)絡(luò)參數(shù)和圖像深度網(wǎng)絡(luò)
的網(wǎng)絡(luò)參數(shù)。
[0046] 步驟3b)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本圖像模態(tài)間的三元組損失函數(shù)J2,其表達(dá)式為:
[0047]
[0048] 其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
[0049] 步驟3c)將圖像文本模態(tài)間的三元組損失函數(shù)J1與文本圖像模態(tài)間的三元組損失函數(shù)J2相加,得到模態(tài)間的三元組損失函數(shù)Jinter;
[0050] 步驟3d)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像模態(tài)內(nèi)的三元組損失函數(shù)J3,其表達(dá)式為:
[0051]
[0052] 其中, 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
[0053] 步驟3f)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本模態(tài)內(nèi)的三元組損失函數(shù)J4,其表達(dá)式為:
[0054]
[0055] 其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
[0056] 步驟3g)將圖像模態(tài)內(nèi)的三元組損失函數(shù)J3與文本模態(tài)內(nèi)的三元組損失函數(shù)J4相加,得到模態(tài)內(nèi)的三元組損失函數(shù)Jintra;
[0057] 步驟3h)利用步驟(2)得到的圖像訓(xùn)練數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼計(jì)算圖正則化損失函數(shù)Jre,其表達(dá)式為:
[0058]
[0059] 其中,S表示相似矩陣; 表示統(tǒng)一的哈希碼;L表示拉普拉斯矩陣;Bx表示文本訓(xùn)練數(shù)據(jù)哈希碼;By表示圖像訓(xùn)練數(shù)據(jù)哈希碼;γ,η和β表示平衡參數(shù);Z表示元素全為1的矩陣; 表示矩陣的F范數(shù);tr(·)表示矩陣的跡;將圖正則化損失函數(shù)Jre與模態(tài)間的三元組損失函數(shù)Jinter和模態(tài)內(nèi)的三元組損失函數(shù)Jintra相加,得到目標(biāo)損失函數(shù)J;
[0060] 步驟4)對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
[0061] 對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化,得到文本深度網(wǎng)絡(luò)參數(shù)wx、圖像深度網(wǎng)絡(luò)參數(shù)wy和圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B;
[0062] 步驟4a)固定目標(biāo)損失函數(shù)J中的文本深度網(wǎng)絡(luò)參數(shù)wx和圖像深度網(wǎng)絡(luò)參數(shù)wy,并令 得到圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B:
[0063]
[0064] 其中,I表示單位矩陣;
[0065] 步驟4b)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和圖像深度網(wǎng)絡(luò)參數(shù)wy,對(duì)第i個(gè)文本訓(xùn)練數(shù)據(jù)的哈希碼G*i求偏導(dǎo)可得:
[0066]
[0067] 使用后向傳播方法學(xué)習(xí)文本深度網(wǎng)絡(luò)參數(shù)wx,其中, 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
[0068] 步驟4c)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和文本深度網(wǎng)絡(luò)參數(shù)wx,對(duì)第i個(gè)圖像訓(xùn)練數(shù)據(jù)的哈希碼F*i求導(dǎo)可得:
[0069]
[0070] 使用后向傳播方法學(xué)習(xí)圖像深度網(wǎng)絡(luò)參數(shù)wy,其中, 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
[0071] 步驟4d)令迭代次數(shù)加一,返回步驟4a)繼續(xù)迭代直至最大迭代次數(shù)或目標(biāo)損失函數(shù)J小于預(yù)先設(shè)置的損失常數(shù)。
[0072] 步驟5)計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;
[0073] 步驟5a)將文本查詢數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本查詢數(shù)據(jù)哈希碼
[0074]
[0075] 其中,xq表示一個(gè)文本查詢數(shù)據(jù);
[0076] 步驟5b)將圖像查詢數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像查詢數(shù)據(jù)哈希碼
[0077]
[0078] 其中,yq表示一個(gè)圖像查詢數(shù)據(jù);
[0079] 步驟6)獲取查詢數(shù)據(jù)檢索結(jié)果:
[0080] 計(jì)算圖像查詢數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θyx,同時(shí)計(jì)算文本查詢數(shù)據(jù)哈希碼和圖像訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θxy,并按照有小到大的順序?qū)Ζ葃x和θxy分別進(jìn)行排序,得到多個(gè)與查詢數(shù)據(jù)距離較小的訓(xùn)練數(shù)據(jù)作為檢索結(jié)果。
[0081] 以下結(jié)合仿真實(shí)驗(yàn),對(duì)本發(fā)明的技術(shù)效果作進(jìn)一步說明。
[0082] 1.仿真條件和內(nèi)容:
[0083] 本發(fā)明的仿真是在NVIDIA?GTX?TITAN?X?GPU服務(wù)器上,運(yùn)用開源的深度學(xué)習(xí)工具箱MatConvNet進(jìn)行的實(shí)驗(yàn)仿真。仿真實(shí)驗(yàn)中的參數(shù)為:閾值參數(shù)α等于編碼長度的一半;平衡參數(shù)γ=100,η=50,β=1。
[0084] 對(duì)本發(fā)明與現(xiàn)有的深度跨模態(tài)哈希(Deep?Cross-Modal?Hashing,DCMH)進(jìn)行仿真對(duì)比。
[0085] 仿真1:在編碼長度取16位時(shí),對(duì)MIRFlickr25k數(shù)據(jù)庫畫出準(zhǔn)確率-召回率曲線,如圖2所示;在編碼長度取32位時(shí),對(duì)MIRFlickr25k數(shù)據(jù)庫畫出準(zhǔn)確率曲線,如圖3所示。
[0086] 仿真2:在編碼長度取16位時(shí),對(duì)NUSWIDE數(shù)據(jù)庫畫出準(zhǔn)確率-召回率曲線,如圖4所示;在編碼長度取32位時(shí),對(duì)NUSWIDE數(shù)據(jù)庫畫出準(zhǔn)確率曲線,如圖5所示。
[0087] 2.仿真結(jié)果分析:
[0088] 圖2(a)為在MIRFlickr25k數(shù)據(jù)庫下編碼長度取16位的圖像查詢文本的準(zhǔn)確率-召回率曲線圖,橫軸表示召回率,縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明結(jié)果曲線與坐標(biāo)軸所圍的面積比DCMH方法大,表示在編碼長度取16位時(shí),本發(fā)明的圖像檢索文本性能良好。
[0089] 圖2(b)為在MIRFlickr25k數(shù)據(jù)庫下編碼長度取16位的文本查詢圖像的準(zhǔn)確率-召回率曲線圖,橫軸表示召回率,縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明結(jié)果曲線與坐標(biāo)軸所圍的面積比DCMH方法大,表示在編碼長度取16位時(shí),本發(fā)明的文本檢索圖像性能良好。
[0090] 圖3(a)為在MIRFlickr25k數(shù)據(jù)庫下編碼長度取32位的圖像查詢文本的準(zhǔn)確率曲線圖,橫軸表示返回的檢索數(shù)據(jù)的個(gè)數(shù),縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明的圖像查詢文本的準(zhǔn)確率完全高于DCMH方法,表示在編碼長度取32位時(shí),本發(fā)明的圖像檢索文本性能良好。
[0091] 圖3(b)為在MIRFlickr25k數(shù)據(jù)庫下編碼長度取32位的文本查詢圖像的準(zhǔn)確率曲線圖,橫軸表示返回的檢索數(shù)據(jù)的個(gè)數(shù),縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明的文本查詢圖像的準(zhǔn)確率和DCMH方法基本持平,表示在編碼長度取32位時(shí),兩者的文本檢索圖像性能差不多。
[0092] 圖4(a)為在NUSWIDE數(shù)據(jù)庫下編碼長度取16位的圖像查詢文本的準(zhǔn)確率-召回率曲線圖,橫軸表示召回率,縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明結(jié)果曲線與坐標(biāo)軸所圍的面積比DCMH方法大,表示在編碼長度取16位時(shí),本發(fā)明的圖像檢索文本性能良好。
[0093] 圖4(b)為在NUSWIDE數(shù)據(jù)庫下編碼長度取16位的文本查詢圖像的準(zhǔn)確率-召回率曲線圖,橫軸表示召回率,縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明結(jié)果曲線與坐標(biāo)軸所圍的面積比DCMH方法大,表示在哈希碼長度取16位時(shí),本發(fā)明的文本檢索圖像性能良好。
[0094] 圖5(a)為在NUSWIDE數(shù)據(jù)庫下編碼長度取32位的圖像查詢文本的準(zhǔn)確率曲線圖,橫軸表示返回的檢索數(shù)據(jù)的個(gè)數(shù),縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明的圖像查詢文本的準(zhǔn)確率完全高于DCMH方法,表示在編碼長度取32位時(shí),本發(fā)明的圖像檢索文本性能良好。
[0095] 圖5(b)為在NUSWIDE數(shù)據(jù)庫下編碼長度取32位的文本查詢圖像的準(zhǔn)確率曲線圖,橫軸表示返回的檢索數(shù)據(jù)的個(gè)數(shù),縱軸表示準(zhǔn)確率。圖中可見,本發(fā)明的文本查詢圖像的準(zhǔn)確率完全高于DCMH方法,表示在編碼長度取32位時(shí),本發(fā)明的文本檢索圖像性能良好。
[0096] 從以上的仿真結(jié)果可見,采用本發(fā)明進(jìn)行跨模態(tài)檢索的精度高于現(xiàn)有方法進(jìn)行跨模態(tài)檢索的精度。所以,與現(xiàn)有技術(shù)相比,本發(fā)明能夠有效利用三元組深度網(wǎng)絡(luò)提高跨模態(tài)檢索的精度。
高效檢索全球?qū)@?/div>

專利匯是專利免費(fèi)檢索,專利查詢,專利分析-國家發(fā)明專利查詢檢索分析平臺(tái),是提供專利分析,專利查詢,專利檢索等數(shù)據(jù)服務(wù)功能的知識(shí)產(chǎn)權(quán)數(shù)據(jù)服務(wù)商。

我們的產(chǎn)品包含105個(gè)國家的1.26億組數(shù)據(jù),免費(fèi)查、免費(fèi)專利分析。

申請(qǐng)?jiān)囉?/a>

QQ群二維碼
意見反饋