白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

首頁 / 專利庫 / 軟件 / 通配符 / 一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)

一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)

閱讀:167發(fā)布:2020-05-08

專利匯可以提供一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)專利檢索,專利查詢,專利分析的服務(wù)。并且本 發(fā)明 公開了一種基于審計(jì) 風(fēng) 險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng),通過提取檢索式中關(guān)鍵詞,據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù),將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶;能夠優(yōu)化規(guī)范審計(jì)風(fēng)險(xiǎn)庫的組織結(jié)構(gòu),提高審計(jì)數(shù)據(jù)搜索的效率,能夠有效地提高第三方 接口 的讀取速度,方便了用戶的查找體驗(yàn),并提升了檢索的準(zhǔn)確性。,下面是一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)專利的具體信息內(nèi)容。

1.一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,所述方法包括以下步驟:
步驟1,接收用戶的檢索式;
步驟2,提取檢索式中關(guān)鍵詞;
步驟3,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
步驟4,根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
步驟5,將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
2.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟1中,所述檢索式包括檢索詞、邏輯算符、通配符,檢索式以句子為單位。
3.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟2中,提取關(guān)鍵詞的方法為TF-IDF、TextRank、LSA/LSI/LDA中任意一種關(guān)鍵詞提取方法。
4.根據(jù)權(quán)利要求1所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度的方法包括以下步驟:
步驟3.1,計(jì)算關(guān)鍵詞的交叉熵值:令關(guān)鍵詞為先驗(yàn)條件W,審計(jì)風(fēng)險(xiǎn)庫的每個(gè)類別中的各個(gè)關(guān)鍵詞W與類別Ci,類別為文本數(shù)據(jù)類別,關(guān)鍵詞W的期望交叉熵為:
其中,p(Ci)表示屬于類別Ci的審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)占所有消息數(shù)目的比重,p(W)表示包含關(guān)鍵詞W的文本數(shù)據(jù)占所有文本數(shù)據(jù)數(shù)目的比重,p(Ci|W)表示在包含關(guān)鍵詞W的消息中屬于類別Ci的消息所占的比重,n為審計(jì)風(fēng)險(xiǎn)庫中文本數(shù)據(jù)類別的總數(shù)量;
步驟3.2,計(jì)算卡方值:在檢索式與審計(jì)風(fēng)險(xiǎn)庫中由關(guān)鍵詞和審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù)出現(xiàn)關(guān)鍵詞的頻數(shù)構(gòu)成卡方頻數(shù)矩陣,令Or,c表示檢索式在審計(jì)風(fēng)險(xiǎn)庫中出現(xiàn)的卡方頻數(shù)矩陣中第r行第c列的值,第r行的和記為nr,第c列的和記為nc,所有元素的和記為n,計(jì)算矩陣中的每一個(gè)元素的期望值Er,c,
其中,消息包括檢索式與審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù);
步驟3.3,計(jì)算檢索式與審計(jì)風(fēng)險(xiǎn)庫中的各文本數(shù)據(jù)的近似度Si:
其中TFi是交叉熵值大于交叉閾值的消息i中出現(xiàn)的次數(shù),DFi是卡方值χ2大于卡方閾值的消息i中出現(xiàn)的次數(shù),i取值范圍為1到N,N是審計(jì)風(fēng)險(xiǎn)庫中所有消息的總數(shù)。
5.根據(jù)權(quán)利要求4所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,審計(jì)風(fēng)險(xiǎn)庫包括數(shù)據(jù)庫數(shù)據(jù)和文本數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)是經(jīng)過篩選處理的結(jié)構(gòu)化數(shù)據(jù),文本數(shù)據(jù)類別包括問題基本數(shù)據(jù)類別、法律法規(guī)數(shù)據(jù)類別、審計(jì)意見或建議類別、責(zé)任及整改情況數(shù)據(jù)類別、審計(jì)方法數(shù)據(jù)類別、審計(jì)項(xiàng)目數(shù)據(jù)類別。
6.根據(jù)權(quán)利要求5所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟3中,問題基本數(shù)據(jù)類別包括:業(yè)務(wù)領(lǐng)域、管理環(huán)節(jié)、問題名稱、關(guān)鍵詞、問題及表現(xiàn)形式、問題成因、問題后果、風(fēng)險(xiǎn)等級;法律法規(guī)數(shù)據(jù)類別包括:法律制度名稱、法規(guī)制度條款依據(jù)、文號、發(fā)文單位、發(fā)文年份、生效日期、作廢日期;審計(jì)意見或建議類包括:審計(jì)意見或建議;責(zé)任及整改情況數(shù)據(jù)類別包括:責(zé)任部、涉及部門、整改措施;審計(jì)方法數(shù)據(jù)類別包括:審計(jì)方法、審計(jì)程序、所需審計(jì)資料、工作底稿;審計(jì)項(xiàng)目數(shù)據(jù)類別包括:專項(xiàng)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)、經(jīng)營管理審計(jì)、工程審計(jì)、營銷審計(jì)、審計(jì)調(diào)查、竣工決算審計(jì)。
7.根據(jù)權(quán)利要求6所述的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,其特征在于,在步驟5中,檢索結(jié)果為近似度最大的N個(gè)文本數(shù)據(jù)按照近似度的大小進(jìn)行降序排列。
8.一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng),其特征在于,所述系統(tǒng)包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序運(yùn)行在以下系統(tǒng)的單元中:
檢索式讀取單元,用于接收用戶的檢索式;
關(guān)鍵詞提取單元,用于提取檢索式中關(guān)鍵詞;
近似度計(jì)算單元,用于計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
風(fēng)險(xiǎn)庫讀取單元,用于根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
結(jié)果輸出單元,用于將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。

說明書全文

一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)

技術(shù)領(lǐng)域

[0001] 本公開涉及大數(shù)據(jù)、審計(jì)數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng)。

背景技術(shù)

[0002] 審計(jì)風(fēng)險(xiǎn)庫是基于對公司審計(jì)與風(fēng)險(xiǎn)的深入考察和了解,建立的詳細(xì)、準(zhǔn)確和全面的公司審計(jì)與風(fēng)險(xiǎn)研究專業(yè)數(shù)據(jù)庫。審計(jì)風(fēng)險(xiǎn)庫涵蓋了對上市公司的審計(jì)意見與收取的審計(jì)費(fèi)用等信息,還包括與公司的經(jīng)營風(fēng)險(xiǎn)和財(cái)務(wù)風(fēng)險(xiǎn)相關(guān)的信息等,所謂審計(jì)風(fēng)險(xiǎn)是指會計(jì)報(bào)表存在重大錯(cuò)誤或漏報(bào),而審計(jì)后發(fā)表不恰當(dāng)審計(jì)意見的可能性。
[0003] 審計(jì)風(fēng)險(xiǎn)庫中包括有審計(jì)數(shù)據(jù),具體包括數(shù)據(jù)庫數(shù)據(jù)和文本數(shù)據(jù),其中的數(shù)據(jù)庫數(shù)據(jù)是經(jīng)過篩選處理的結(jié)構(gòu)化數(shù)據(jù)。而實(shí)際上審計(jì)數(shù)據(jù)更多的是文本數(shù)據(jù),如審計(jì)報(bào)告、審計(jì)意見、審計(jì)案例和法規(guī)制度等等都屬于文本數(shù)據(jù)的范疇。兩種數(shù)據(jù)的區(qū)別是,文本數(shù)據(jù)具有數(shù)量大、種類多等特點(diǎn)。
[0004] 現(xiàn)有的數(shù)據(jù)搜索技術(shù)對于海量的審計(jì)文本數(shù)據(jù)處理效果不能令人滿意,審計(jì)風(fēng)險(xiǎn)庫的文本數(shù)據(jù)中的審計(jì)經(jīng)驗(yàn)、數(shù)據(jù)價(jià)值的獲取往往是人工整理、提煉得到,或者通過開放平臺由相關(guān)人員自主新增和修改相關(guān)規(guī)則。這樣做容易造成審計(jì)風(fēng)險(xiǎn)庫的組織結(jié)構(gòu)混亂和不規(guī)范,拖慢檢索分析的效率,對數(shù)據(jù)搜索的效率很低。發(fā)明內(nèi)容
[0005] 本公開提供一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng),通過提取檢索式中關(guān)鍵詞,據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù),將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
[0006] 為了實(shí)現(xiàn)上述目的,根據(jù)本公開的一方面,提供一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,所述方法包括以下步驟:
[0007] 步驟1,接收用戶的檢索式;
[0008] 步驟2,提取檢索式中關(guān)鍵詞;
[0009] 步驟3,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
[0010] 步驟4,根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
[0011] 步驟5,將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
[0012] 其中,N為大于等于1的整數(shù)。
[0013] 進(jìn)一步地,在步驟1中,所述檢索式包括檢索詞、邏輯算符、通配符,檢索式以句子為單位。
[0014] 進(jìn)一步地,在步驟2中,提取關(guān)鍵詞的方法為TF-IDF、TextRank、LSA/LSI/LDA中任意一種關(guān)鍵詞提取方法。
[0015] 進(jìn)一步地,在步驟3中,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度的方法包括以下步驟:
[0016] 步驟3.1,計(jì)算關(guān)鍵詞的交叉熵值:令關(guān)鍵詞為先驗(yàn)條件W,審計(jì)風(fēng)險(xiǎn)庫的每個(gè)類別中的各個(gè)關(guān)鍵詞W與類別Ci,類別為文本數(shù)據(jù)類別,關(guān)鍵詞W的期望交叉熵為:
[0017]
[0018] 其中,p(Ci)表示屬于類別Ci的審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)占所有消息數(shù)目的比重,p(W)表示包含關(guān)鍵詞W的文本數(shù)據(jù)占所有文本數(shù)據(jù)數(shù)目的比重,p(Ci|W)表示在包含關(guān)鍵詞W的消息中屬于類別Ci的消息所占的比重,n為審計(jì)風(fēng)險(xiǎn)庫中文本數(shù)據(jù)類別的總數(shù)量;
[0019] 步驟3.2,計(jì)算卡方值:在檢索式與審計(jì)風(fēng)險(xiǎn)庫中由關(guān)鍵詞和審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù)出現(xiàn)關(guān)鍵詞的頻數(shù)構(gòu)成卡方頻數(shù)矩陣,令Or,c表示檢索式在審計(jì)風(fēng)險(xiǎn)庫中出現(xiàn)的卡方頻數(shù)矩陣中第r行第c列的值,第r行的和記為nr,第c列的和記為nc,所有元素的和記為n,計(jì)算矩陣中的每一個(gè)元素的期望值Er,c,
[0020]
[0021] 其中,消息包括檢索式與審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù);
[0022] 步驟3.3,計(jì)算檢索式與審計(jì)風(fēng)險(xiǎn)庫中的各文本數(shù)據(jù)的近似度Si:
[0023]
[0024] 其中TFi是交叉熵值大于交叉閾值的消息i中出現(xiàn)的次數(shù),DFi是卡方值χ2大于卡方閾值的消息i中出現(xiàn)的次數(shù),i取值范圍為1到N,N是審計(jì)風(fēng)險(xiǎn)庫中所有消息的總數(shù)。
[0025] 進(jìn)一步地,在步驟3中,審計(jì)風(fēng)險(xiǎn)庫包括數(shù)據(jù)庫數(shù)據(jù)和文本數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)是經(jīng)過篩選處理的結(jié)構(gòu)化數(shù)據(jù),文本數(shù)據(jù)類別包括問題基本數(shù)據(jù)類別、法律法規(guī)數(shù)據(jù)類別、審計(jì)意見或建議類別、責(zé)任及整改情況數(shù)據(jù)類別、審計(jì)方法數(shù)據(jù)類別、審計(jì)項(xiàng)目數(shù)據(jù)類別。
[0026] 進(jìn)一步地,在步驟3中,問題基本數(shù)據(jù)類別包括:業(yè)務(wù)領(lǐng)域、管理環(huán)節(jié)、問題名稱、關(guān)鍵詞、問題及表現(xiàn)形式、問題成因、問題后果、風(fēng)險(xiǎn)等級;法律法規(guī)數(shù)據(jù)類別包括:法律制度名稱、法規(guī)制度條款依據(jù)、文號、發(fā)文單位、發(fā)文年份、生效日期、作廢日期;審計(jì)意見或建議類包括:審計(jì)意見或建議;責(zé)任及整改情況數(shù)據(jù)類別包括:責(zé)任部、涉及部門、整改措施;審計(jì)方法數(shù)據(jù)類別包括:審計(jì)方法、審計(jì)程序、所需審計(jì)資料、工作底稿;審計(jì)項(xiàng)目數(shù)據(jù)類別包括:專項(xiàng)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)、經(jīng)營管理審計(jì)、工程審計(jì)、營銷審計(jì)、審計(jì)調(diào)查、竣工決算審計(jì)。
[0027] 進(jìn)一步地,在步驟5中,檢索結(jié)果為近似度最大的N個(gè)文本數(shù)據(jù)按照近似度的大小進(jìn)行降序排列。
[0028] 本發(fā)明還提供了一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng),所述系統(tǒng)包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序運(yùn)行在以下系統(tǒng)的單元中:
[0029] 檢索式讀取單元,用于接收用戶的檢索式;
[0030] 關(guān)鍵詞提取單元,用于提取檢索式中關(guān)鍵詞;
[0031] 近似度計(jì)算單元,用于計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
[0032] 風(fēng)險(xiǎn)庫讀取單元,用于根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
[0033] 結(jié)果輸出單元,用于將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
[0034] 本公開的有益效果為:本發(fā)明提供一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法及系統(tǒng),能夠優(yōu)化規(guī)范審計(jì)風(fēng)險(xiǎn)庫的組織結(jié)構(gòu),提高審計(jì)數(shù)據(jù)搜索的效率,能夠有效地提高第三方接口的讀取速度,方便了用戶的查找體驗(yàn),并提升了檢索的準(zhǔn)確性。附圖說明
[0035] 通過對結(jié)合附圖所示出的實(shí)施方式進(jìn)行詳細(xì)說明,本公開的上述以及其他特征將更加明顯,本公開附圖中相同的參考標(biāo)號表示相同或相似的元素,顯而易見地,下面描述中的附圖僅僅是本公開的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖,在附圖中:
[0036] 圖1所示為一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法的流程圖;
[0037] 圖2所示為一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)結(jié)構(gòu)圖。

具體實(shí)施方式

[0038] 以下將結(jié)合實(shí)施例和附圖對本公開的構(gòu)思、具體結(jié)構(gòu)及產(chǎn)生的技術(shù)效果進(jìn)行清楚、完整的描述,以充分地理解本公開的目的、方案和效果。需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0039] 如圖1所示為根據(jù)本公開的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法的流程圖,下面結(jié)合圖1來闡述根據(jù)本公開的實(shí)施方式的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法。
[0040] 本公開提出一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索方法,具體包括以下步驟:
[0041] 步驟1,接收用戶的檢索式;
[0042] 步驟2,提取檢索式中關(guān)鍵詞;
[0043] 步驟3,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
[0044] 步驟4,根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
[0045] 步驟5,將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
[0046] 其中,N為大于等于1的整數(shù)。
[0047] 進(jìn)一步地,在步驟1中,所述檢索式包括檢索詞、邏輯算符、通配符,檢索式以句子為單位。
[0048] 進(jìn)一步地,在步驟2中,提取關(guān)鍵詞的方法為TF-IDF、TextRank、LSA/LSI/LDA中任意一種關(guān)鍵詞提取方法。
[0049] 進(jìn)一步地,在步驟3中,計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度的方法包括以下步驟:
[0050] 步驟3.1,計(jì)算關(guān)鍵詞的交叉熵值:令關(guān)鍵詞為先驗(yàn)條件W,審計(jì)風(fēng)險(xiǎn)庫的每個(gè)類別中的各個(gè)關(guān)鍵詞W與類別Ci,類別為文本數(shù)據(jù)類別,關(guān)鍵詞W的期望交叉熵為:
[0051]
[0052] 其中,p(Ci)表示屬于類別Ci的審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)占所有消息數(shù)目的比重,p(W)表示包含關(guān)鍵詞W的文本數(shù)據(jù)占所有文本數(shù)據(jù)數(shù)目的比重,p(Ci|W)表示在包含關(guān)鍵詞W的消息中屬于類別Ci的消息所占的比重,n為審計(jì)風(fēng)險(xiǎn)庫中文本數(shù)據(jù)類別的總數(shù)量;
[0053] 步驟3.2,計(jì)算卡方值:在檢索式與審計(jì)風(fēng)險(xiǎn)庫中由關(guān)鍵詞和審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù)出現(xiàn)關(guān)鍵詞的頻數(shù)構(gòu)成卡方頻數(shù)矩陣,令Or,c表示檢索式在審計(jì)風(fēng)險(xiǎn)庫中出現(xiàn)的卡方頻數(shù)矩陣中第r行第c列的值,第r行的和記為nr,第c列的和記為nc,所有元素的和記為n,計(jì)算矩陣中的每一個(gè)元素的期望值Er,c,
[0054]
[0055]
[0056] 其中,所述消息包括檢索式與審計(jì)風(fēng)險(xiǎn)庫中的文本數(shù)據(jù);
[0057] 步驟3.3,計(jì)算檢索式與審計(jì)風(fēng)險(xiǎn)庫中的各文本數(shù)據(jù)的近似度Si:
[0058]
[0059] 其中TFi是交叉熵值大于交叉閾值的消息i中出現(xiàn)的次數(shù),DFi是卡方值χ2大于卡方閾值的消息i中出現(xiàn)的次數(shù),i取值范圍為1到N,N是審計(jì)風(fēng)險(xiǎn)庫中所有消息的總數(shù)。
[0060] 進(jìn)一步地,在步驟3中,審計(jì)風(fēng)險(xiǎn)庫包括數(shù)據(jù)庫數(shù)據(jù)和文本數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)是經(jīng)過篩選處理的結(jié)構(gòu)化數(shù)據(jù),文本數(shù)據(jù)類別包括問題基本數(shù)據(jù)類別、法律法規(guī)數(shù)據(jù)類別、審計(jì)意見或建議類別、責(zé)任及整改情況數(shù)據(jù)類別、審計(jì)方法數(shù)據(jù)類別、審計(jì)項(xiàng)目數(shù)據(jù)類別。
[0061] 進(jìn)一步地,在步驟3中,問題基本數(shù)據(jù)類別包括:業(yè)務(wù)領(lǐng)域、管理環(huán)節(jié)、問題名稱、關(guān)鍵詞、問題及表現(xiàn)形式、問題成因、問題后果、風(fēng)險(xiǎn)等級;法律法規(guī)數(shù)據(jù)類別包括:法律制度名稱、法規(guī)制度條款依據(jù)、文號、發(fā)文單位、發(fā)文年份、生效日期、作廢日期;審計(jì)意見或建議類包括:審計(jì)意見或建議;責(zé)任及整改情況數(shù)據(jù)類別包括:責(zé)任部門、涉及部門、整改措施;審計(jì)方法數(shù)據(jù)類別包括:審計(jì)方法、審計(jì)程序、所需審計(jì)資料、工作底稿;審計(jì)項(xiàng)目數(shù)據(jù)類別包括:專項(xiàng)審計(jì)、經(jīng)濟(jì)責(zé)任審計(jì)、經(jīng)營管理審計(jì)、工程審計(jì)、營銷審計(jì)、審計(jì)調(diào)查、竣工決算審計(jì)。
[0062] 進(jìn)一步地,在步驟5中,檢索結(jié)果為近似度最大的N個(gè)文本數(shù)據(jù)按照近似度的大小進(jìn)行降序排列。
[0063] 本公開的實(shí)施例提供的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng),如圖2所示為本公開的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)結(jié)構(gòu)圖,該實(shí)施例的一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)包括:處理器、存儲器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)實(shí)施例中的步驟。
[0064] 所述系統(tǒng)包括:存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序運(yùn)行在以下系統(tǒng)的單元中:
[0065] 檢索式讀取單元,用于接收用戶的檢索式;
[0066] 關(guān)鍵詞提取單元,用于提取檢索式中關(guān)鍵詞;
[0067] 近似度計(jì)算單元,用于計(jì)算關(guān)鍵詞與審計(jì)風(fēng)險(xiǎn)庫中的各個(gè)文本數(shù)據(jù)的近似度;
[0068] 風(fēng)險(xiǎn)庫讀取單元,用于根據(jù)各個(gè)文本數(shù)據(jù)的近似度讀取審計(jì)風(fēng)險(xiǎn)庫中近似度最大的N個(gè)文本數(shù)據(jù);
[0069] 結(jié)果輸出單元,用于將近似度最大的N個(gè)文本數(shù)據(jù)作為檢索結(jié)果輸出到用戶。
[0070] 所述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)可以運(yùn)行于桌上型計(jì)算機(jī)、筆記本、掌上電腦及服務(wù)器等計(jì)算設(shè)備中。所述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng),可運(yùn)行的系統(tǒng)可包括,但不僅限于,處理器、存儲器。本領(lǐng)域技術(shù)人員可以理解,所述例子僅僅是一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)的示例,并不構(gòu)成對一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)的限定,可以包括比例子更多或更少的部件,或者組合某些部件,或者不同的部件,例如所述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)還可以包括輸入輸出設(shè)備、網(wǎng)絡(luò)接入設(shè)備、總線等。
[0071] 所稱處理器可以是中央處理單元(Central?Processing?Unit,CPU),還可以是其他通用處理器、數(shù)字信號處理器(Digital?Signal?Processor,DSP)、專用集成電路(Application?Specific?Integrated?Circuit,ASIC)、現(xiàn)場可編程門陣列(Field-Programmable?Gate?Array,F(xiàn)PGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等,所述處理器是所述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)運(yùn)行系統(tǒng)的控制中心,利用各種接口和線路連接整個(gè)一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)可運(yùn)行系統(tǒng)的各個(gè)部分。
[0072] 所述存儲器可用于存儲所述計(jì)算機(jī)程序和/或模,所述處理器通過運(yùn)行或執(zhí)行存儲在所述存儲器內(nèi)的計(jì)算機(jī)程序和/或模塊,以及調(diào)用存儲在存儲器內(nèi)的數(shù)據(jù),實(shí)現(xiàn)所述一種基于審計(jì)風(fēng)險(xiǎn)庫的數(shù)據(jù)搜索系統(tǒng)的各種功能。所述存儲器可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)手機(jī)的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如硬盤、內(nèi)存、插接式硬盤,智能存儲卡(Smart?Media?Card,SMC),安全數(shù)字(Secure?Digital,SD)卡,閃存卡(Flash?Card)、至少一個(gè)磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。
[0073] 盡管本公開的描述已經(jīng)相當(dāng)詳盡且特別對幾個(gè)所述實(shí)施例進(jìn)行了描述,但其并非旨在局限于任何這些細(xì)節(jié)或?qū)嵤├蛉魏翁厥鈱?shí)施例,而是應(yīng)當(dāng)將其視作是通過參考所附權(quán)利要求考慮到現(xiàn)有技術(shù)為這些權(quán)利要求提供廣義的可能性解釋,從而有效地涵蓋本公開的預(yù)定范圍。此外,上文以發(fā)明人可預(yù)見的實(shí)施例對本公開進(jìn)行描述,其目的是為了提供有用的描述,而那些目前尚未預(yù)見的對本公開的非實(shí)質(zhì)性改動仍可代表本公開的等效改動。
高效檢索全球?qū)@?/div>

專利匯是專利免費(fèi)檢索,專利查詢,專利分析-國家發(fā)明專利查詢檢索分析平臺,是提供專利分析,專利查詢,專利檢索等數(shù)據(jù)服務(wù)功能的知識產(chǎn)權(quán)數(shù)據(jù)服務(wù)商。

我們的產(chǎn)品包含105個(gè)國家的1.26億組數(shù)據(jù),免費(fèi)查、免費(fèi)專利分析。

申請?jiān)囉?/a>

QQ群二維碼
意見反饋