專利匯可以提供基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法專利檢索,專利查詢,專利分析的服務(wù)。并且本 發(fā)明 提出了一種基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,用于解決現(xiàn)有跨模態(tài)哈希檢索方法中存在的檢索精率低的技術(shù)問題。實(shí)現(xiàn)步驟為:對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將數(shù)據(jù)分成 訓(xùn)練數(shù)據(jù) 和查詢數(shù)據(jù);獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼;采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù);對(duì)目標(biāo)損失函數(shù)進(jìn)行順序 迭代 優(yōu)化;計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;獲取查詢數(shù)據(jù)的檢索結(jié)果。本發(fā)明提供的方案采用三元組信息構(gòu)建目標(biāo)損失函數(shù),增加語義信息,同時(shí)加入模態(tài)內(nèi)的損失函數(shù),增加方法的判別性,能夠有效地提高跨模態(tài)檢索的 精度 。本發(fā)明可用于 物聯(lián)網(wǎng) 信息檢索 、 電子 商務(wù)以及移動(dòng)設(shè)備等的圖片與文本互搜索服務(wù)。,下面是基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法專利的具體信息內(nèi)容。
1.一種基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,其特征在于,包括如下步驟:
(1)對(duì)數(shù)據(jù)進(jìn)行預(yù)處理:
確定兩種模態(tài)的數(shù)據(jù):圖像數(shù)據(jù)和文本數(shù)據(jù),提取文本數(shù)據(jù)的Bag-of-words特征,保留圖像數(shù)據(jù)的原始像素特征,并將圖像數(shù)據(jù)分成圖像訓(xùn)練數(shù)據(jù)和圖像查詢數(shù)據(jù),將文本數(shù)據(jù)分成文本訓(xùn)練數(shù)據(jù)和文本查詢數(shù)據(jù);
(2)獲取圖像訓(xùn)練數(shù)據(jù)和文本訓(xùn)練數(shù)據(jù)的哈希碼:
將文本訓(xùn)練數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本訓(xùn)練數(shù)據(jù)哈希碼,同時(shí)將圖像訓(xùn)練數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像訓(xùn)練數(shù)據(jù)哈希碼;
(3)采用三元組監(jiān)督信息建立目標(biāo)損失函數(shù)J:
(3a)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像文本模態(tài)間的三元組損失函數(shù)J1:
其中,x表示文本模態(tài);y表示圖像模態(tài); 表示三元組;qm,pm,nm分別表示錨點(diǎn)數(shù)據(jù),正例數(shù)據(jù)和負(fù)例數(shù)據(jù); 表示圖像深度網(wǎng)絡(luò)輸出的圖像訓(xùn)練數(shù)據(jù)哈希碼; 表示文本深度網(wǎng)絡(luò)輸出的文本訓(xùn)練數(shù)據(jù)哈希碼;k表示哈希碼長度;N表示數(shù)據(jù)個(gè)數(shù);M表示三元組個(gè)數(shù); 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;σ(x)表示sigmoid函數(shù) 超參數(shù)α表示一個(gè)閾值參數(shù);
其中wx和wy分別表示文本深度網(wǎng)絡(luò)參數(shù)和圖像深度網(wǎng)絡(luò)
的網(wǎng)絡(luò)參數(shù);
(3b)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本圖像模態(tài)間的三元組損失函數(shù)J2:
其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3c)將圖像文本模態(tài)間的三元組損失函數(shù)J1與文本圖像模態(tài)間的三元組損失函數(shù)J2相加,得到模態(tài)間的三元組損失函數(shù)Jinter;
(3d)隨機(jī)選擇部分圖像訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的圖像訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立圖像模態(tài)內(nèi)的三元組損失函數(shù)J3:
其中, 表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示圖像錨點(diǎn)訓(xùn)練數(shù)據(jù)和圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3f)隨機(jī)選擇部分文本訓(xùn)練數(shù)據(jù)哈希碼作為三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼,并將與三元組監(jiān)督信息中錨點(diǎn)數(shù)據(jù)哈希碼相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為正例數(shù)據(jù)哈希碼,不相似的文本訓(xùn)練數(shù)據(jù)哈希碼作為負(fù)例數(shù)據(jù)哈希碼,采用錨點(diǎn)數(shù)據(jù)哈希碼與正例數(shù)據(jù)哈希碼和負(fù)例數(shù)據(jù)哈希碼,分別計(jì)算錨點(diǎn)數(shù)據(jù)和正例數(shù)據(jù)之間的漢明距離 和錨點(diǎn)數(shù)據(jù)和負(fù)例數(shù)據(jù)之間的漢明距離 并利用 和 建立文本模態(tài)內(nèi)的三元組損失函數(shù)J4:
其中, 表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示文本錨點(diǎn)訓(xùn)練數(shù)據(jù)和文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(3g)將圖像模態(tài)內(nèi)的三元組損失函數(shù)J3與文本模態(tài)內(nèi)的三元組損失函數(shù)J4相加,得到模態(tài)內(nèi)的三元組損失函數(shù)Jintra;
(3h)利用步驟(2)得到的圖像訓(xùn)練數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼計(jì)算圖正則化損失函數(shù)Jre,并將圖正則化損失函數(shù)Jre與模態(tài)間的三元組損失函數(shù)Jinter和模態(tài)內(nèi)的三元組損失函數(shù)Jintra相加,得到目標(biāo)損失函數(shù)J,其中,Jre的表達(dá)式為:
s.t.B=Bx=By∈{-1,1}k×N
其中,S表示相似矩陣; 表示統(tǒng)一的哈希碼;L表示拉普拉斯矩陣;Bx表示文本訓(xùn)練數(shù)據(jù)哈希碼;By表示圖像訓(xùn)練數(shù)據(jù)哈希碼;γ,η和β表示平衡參數(shù);Z表示元素全為1的矩陣; 表示矩陣的F范數(shù);tr(·)表示矩陣的跡;
(4)對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化,得到文本深度網(wǎng)絡(luò)參數(shù)wx、圖像深度網(wǎng)絡(luò)參數(shù)wy和圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B;
(5)計(jì)算圖像查詢數(shù)據(jù)和文本查詢數(shù)據(jù)的哈希碼;
(5a)將文本查詢數(shù)據(jù)的Bag-of-words特征輸入文本深度網(wǎng)絡(luò),得到文本查詢數(shù)據(jù)哈希碼
其中,xq表示一個(gè)文本查詢數(shù)據(jù);
(5b)將圖像查詢數(shù)據(jù)的原始像素特征輸入圖像深度網(wǎng)絡(luò),得到圖像查詢數(shù)據(jù)哈希碼其中,yq表示一個(gè)圖像查詢數(shù)據(jù);
(6)獲取查詢數(shù)據(jù)檢索結(jié)果:
計(jì)算圖像查詢數(shù)據(jù)哈希碼和文本訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θyx,同時(shí)計(jì)算文本查詢數(shù)據(jù)哈希碼和圖像訓(xùn)練數(shù)據(jù)哈希碼之間的漢明距離θxy,并按照由小到大的順序?qū)Ζ葃x和θxy分別進(jìn)行排序,得到多個(gè)與查詢數(shù)據(jù)距離較小的訓(xùn)練數(shù)據(jù)作為檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于三元組深度網(wǎng)絡(luò)的跨模態(tài)哈希檢索方法,其特征在于,步驟(4)所述的對(duì)目標(biāo)損失函數(shù)J進(jìn)行順序迭代優(yōu)化:
(4a)固定目標(biāo)損失函數(shù)J中的文本深度網(wǎng)絡(luò)參數(shù)wx和圖像深度網(wǎng)絡(luò)參數(shù)wy,并令得到圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B:
其中, 表示圖像深度網(wǎng)絡(luò)輸出的圖像訓(xùn)練數(shù)據(jù)哈希碼; 表示文本深度
網(wǎng)絡(luò)輸出的文本訓(xùn)練數(shù)據(jù)哈希碼;L表示拉普拉斯矩陣;I表示單位矩陣;β和γ表示平衡參數(shù);
(4b)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和圖像深度網(wǎng)絡(luò)參數(shù)wy,使用后向傳播方法學(xué)習(xí)文本深度網(wǎng)絡(luò)參數(shù)wx;對(duì)第i個(gè)文本訓(xùn)練數(shù)據(jù)的哈希碼G*i求偏導(dǎo)可得:
其中,M表示三元組個(gè)數(shù);σ(x)表示sigmoid函數(shù) 表示第i個(gè)文本訓(xùn)練
數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離;
表示第i個(gè)文本訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;超參數(shù)α表示一個(gè)閾值;
表示統(tǒng)一的哈希碼;γ和η表示平衡參數(shù);Z表示元素全為1的矩陣;
(4c)固定圖正則化損失函數(shù)Jre中訓(xùn)練數(shù)據(jù)的統(tǒng)一哈希碼B和文本深度網(wǎng)絡(luò)參數(shù)wx,使用后向傳播法方學(xué)習(xí)圖像深度網(wǎng)絡(luò)參數(shù)wy;對(duì)第i個(gè)圖像訓(xùn)練數(shù)據(jù)的哈希碼F*i求導(dǎo)可得:
其中, 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與文本負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像正例訓(xùn)練數(shù)據(jù)之間的漢明距離; 表示第i個(gè)圖像訓(xùn)練數(shù)據(jù)與圖像負(fù)例訓(xùn)練數(shù)據(jù)之間的漢明距離;
(4d)令迭代次數(shù)加一,返回步驟(4a)繼續(xù)迭代直至最大迭代次數(shù)或目標(biāo)損失函數(shù)J小于預(yù)先設(shè)置的損失常數(shù)。
標(biāo)題 | 發(fā)布/更新時(shí)間 | 閱讀量 |
---|---|---|
一種基于神經(jīng)網(wǎng)絡(luò)協(xié)同訓(xùn)練的遙感圖像變化信息檢索方法 | 2020-05-08 | 683 |
語音信息檢索方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) | 2020-05-08 | 907 |
一種大學(xué)學(xué)生受體化考核方法 | 2020-05-11 | 906 |
一種基于云計(jì)算的醫(yī)療物聯(lián)網(wǎng)遠(yuǎn)程服務(wù)系統(tǒng) | 2020-05-08 | 759 |
模組信息存儲(chǔ)方法、模組信息檢索方法、模組信息存儲(chǔ)裝置和測(cè)試設(shè)備 | 2020-05-11 | 653 |
一種混合信息檢索方法及裝置 | 2020-05-11 | 444 |
一種基于視窗的實(shí)現(xiàn)動(dòng)態(tài)視頻監(jiān)控的二維云臺(tái)裝置及方法 | 2020-05-11 | 726 |
基于人工智能的在線教育課程分配平臺(tái) | 2020-05-08 | 106 |
一種基于大數(shù)據(jù)應(yīng)用的短文本信息檢索系統(tǒng) | 2020-05-08 | 179 |
基于Lucene全文檢索的配電網(wǎng)數(shù)據(jù)處理方法、裝置 | 2020-05-11 | 377 |
高效檢索全球?qū)@?/div>專利匯是專利免費(fèi)檢索,專利查詢,專利分析-國家發(fā)明專利查詢檢索分析平臺(tái),是提供專利分析,專利查詢,專利檢索等數(shù)據(jù)服務(wù)功能的知識(shí)產(chǎn)權(quán)數(shù)據(jù)服務(wù)商。
我們的產(chǎn)品包含105個(gè)國家的1.26億組數(shù)據(jù),免費(fèi)查、免費(fèi)專利分析。
分析報(bào)告專利匯分析報(bào)告產(chǎn)品可以對(duì)行業(yè)情報(bào)數(shù)據(jù)進(jìn)行梳理分析,涉及維度包括行業(yè)專利基本狀況分析、地域分析、技術(shù)分析、發(fā)明人分析、申請(qǐng)人分析、專利權(quán)人分析、失效分析、核心專利分析、法律分析、研發(fā)重點(diǎn)分析、企業(yè)專利處境分析、技術(shù)處境分析、專利壽命分析、企業(yè)定位分析、引證分析等超過60個(gè)分析角度,系統(tǒng)通過AI智能系統(tǒng)對(duì)圖表進(jìn)行解讀,只需1分鐘,一鍵生成行業(yè)專利分析報(bào)告。
信息檢索熱門專利