白丝美女被狂躁免费视频网站,500av导航大全精品,yw.193.cnc爆乳尤物未满,97se亚洲综合色区,аⅴ天堂中文在线网官网

首頁(yè) / 專利分類庫(kù) / 樂(lè)器;聲學(xué) / 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;語(yǔ)音或聲音處理;語(yǔ)音或音頻編碼或解碼
序號(hào) 專利名 申請(qǐng)?zhí)?/th> 申請(qǐng)日 公開(kāi)(公告)號(hào) 公開(kāi)(公告)日 發(fā)明人
1 電子設(shè)備及其控制方法 CN202380067570.X 2023-09-15 CN119908010A 2025-04-29 崔成子
公開(kāi)了一種電子裝置。所述電子裝置包括通信接口、存儲(chǔ)至少一個(gè)指令的存儲(chǔ)器、以及一個(gè)或更多個(gè)處理器,所述一個(gè)或更多個(gè)處理器被配置為通過(guò)運(yùn)行所述至少一個(gè)指令來(lái)基于通過(guò)所述通信接口接收的對(duì)話內(nèi)容生成響應(yīng)信息:確認(rèn)所述對(duì)話內(nèi)容內(nèi)的用戶的當(dāng)前請(qǐng)求和先前請(qǐng)求以識(shí)別用戶的請(qǐng)求;基于接收的所述對(duì)話內(nèi)容來(lái)識(shí)別用戶的請(qǐng)求是多輪請(qǐng)求還是單輪請(qǐng)求;如果用戶的請(qǐng)求是單輪請(qǐng)求,則生成用于確認(rèn)估計(jì)的用戶請(qǐng)求的確認(rèn)請(qǐng)求;以及如果用戶的請(qǐng)求是多輪請(qǐng)求,則生成包括與估計(jì)的用戶的請(qǐng)求相應(yīng)的信息的響應(yīng)并省略所述確認(rèn)請(qǐng)求的生成。
2 利用射頻感測(cè)輔助的語(yǔ)音用戶接口 CN202380065423.9 2023-08-10 CN119908009A 2025-04-29 B·拉馬薩米; J·菲洛斯; E·C·帕克; 張小欣
提供了用于由射頻(RF)感測(cè)輔助的語(yǔ)音識(shí)別的系統(tǒng)和技術(shù)。例如,用于由射頻(RF)感測(cè)輔助的語(yǔ)音識(shí)別的處理可以包括:在語(yǔ)音用戶接口(UI)設(shè)備處獲得包括來(lái)自說(shuō)話實(shí)體的語(yǔ)音命令的音頻數(shù)據(jù);獲得對(duì)應(yīng)于所述音頻數(shù)據(jù)的RF感測(cè)數(shù)據(jù);處理所述音頻數(shù)據(jù)以確定音頻語(yǔ)音命令輸出;處理所述RF感測(cè)數(shù)據(jù)以確定RF感測(cè)語(yǔ)音命令輸出;基于所述音頻語(yǔ)音命令輸出和所述RF感測(cè)語(yǔ)音命令輸出,來(lái)確定所述語(yǔ)音命令;以及在所述語(yǔ)音UI設(shè)備處基于所述語(yǔ)音命令執(zhí)行操作。
3 投影系統(tǒng)、投影裝置及其控制方法 CN202311408914.7 2023-10-27 CN119906805A 2025-04-29 鐘至怡; 陳思名; 賴歆雅; 蔡文瑋
發(fā)明提出一種投影系統(tǒng)、投影裝置及其控制方法。投影裝置的控制方法包括步驟如下:借由終端裝置發(fā)送第一原始指令;響應(yīng)于第一原始指令與投影裝置的畫面校正操作相對(duì)應(yīng),借由投影裝置投射調(diào)整畫面,其中調(diào)整畫面包括至少一圖案陣列及至少一調(diào)整基準(zhǔn)點(diǎn);借由終端裝置發(fā)送第二原始指令;以及響應(yīng)于第二原始指令與調(diào)整調(diào)整畫面中的至少一調(diào)整基準(zhǔn)點(diǎn)的位置相對(duì)應(yīng),借由投影裝置調(diào)整調(diào)整畫面中的至少一調(diào)整基準(zhǔn)點(diǎn)的位置,其中至少一調(diào)整基準(zhǔn)點(diǎn)位于對(duì)應(yīng)的至少一圖案陣列中。本發(fā)明提供的投影系統(tǒng)、投影裝置及其控制方法可實(shí)現(xiàn)校正投影畫面的功能。
4 課程文件的生成方法、裝置、終端設(shè)備和存儲(chǔ)介質(zhì) CN202311416081.9 2023-10-27 CN119906796A 2025-04-29 郭慶偉
申請(qǐng)提供了一種課程文件的生成方法、課程文件的生成裝置、終端設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),涉及計(jì)算機(jī)技術(shù)領(lǐng)域。該方法包括:獲取終端設(shè)備中麥克風(fēng)采集的音頻數(shù)據(jù)與終端設(shè)備中播放視頻的音頻數(shù)據(jù)和圖像數(shù)據(jù);將麥克風(fēng)采集的音頻數(shù)據(jù)和播放視頻的音頻數(shù)據(jù)進(jìn)行混音處理,得到混音數(shù)據(jù),其中,混音處理用于對(duì)麥克風(fēng)采集的音頻數(shù)據(jù)和播放視頻的音頻數(shù)據(jù)進(jìn)行整合,混音數(shù)據(jù)中包括麥克風(fēng)采集的音頻數(shù)據(jù)和播放視頻的音頻數(shù)據(jù);對(duì)混音數(shù)據(jù)和圖像數(shù)據(jù)進(jìn)行錄制,得到課程視頻;對(duì)麥克風(fēng)采集的音頻數(shù)據(jù)進(jìn)行識(shí)別處理,得到課程文本;根據(jù)課程視頻和課程文本,生成課程文件。基于本方案,能夠提高微課視頻中字幕的準(zhǔn)確性。
5 一種AI通信信息識(shí)別系統(tǒng) CN202510057686.6 2025-01-14 CN119906566A 2025-04-29 趙先明; 向陽(yáng); 林昀
發(fā)明公開(kāi)了一種AI通信信息識(shí)別系統(tǒng),涉及人工智能與通信技術(shù)領(lǐng)域,其技術(shù)方案是:包括AI通信管理平臺(tái)模,AI通信管理平臺(tái)模塊包括數(shù)據(jù)管理模塊、算法模型庫(kù)模塊、用戶交互模塊和安全控制模塊,安全控制模塊包括安全隱私保護(hù)模塊和實(shí)時(shí)監(jiān)控報(bào)警模塊,安全控制模塊連接端分別設(shè)有安全架構(gòu)模塊、AI輔助安全模塊和應(yīng)急響應(yīng)模塊,安全隱私保護(hù)模塊包括數(shù)據(jù)加密模塊、隱私保護(hù)模塊和訪問(wèn)控制模塊,發(fā)明有益效果是:實(shí)現(xiàn)對(duì)通信信息的自動(dòng)、高效、準(zhǔn)確識(shí)別,顯著提升識(shí)別效率和準(zhǔn)確率,具備自我學(xué)習(xí)和優(yōu)化能,能夠隨著數(shù)據(jù)量的增加和環(huán)境的變化不斷提升識(shí)別性能,有效識(shí)別并攔截惡意信息,保護(hù)通信網(wǎng)絡(luò)的安全性和用戶隱私,安全性能提升。
6 一種基于多模態(tài)的情緒反饋系統(tǒng)及其方法 CN202510062734.0 2025-01-15 CN119905114A 2025-04-29 楊桂紅; 倪天依; 冒海燕; 唐輝
發(fā)明涉及情緒識(shí)別技術(shù)領(lǐng)域,具體是一種基于多模態(tài)的情緒反饋系統(tǒng)及其方法,所述情緒反饋方法包括:步驟S1、識(shí)別當(dāng)前場(chǎng)景中的特征因素;步驟S2、提取目標(biāo)反饋記錄所對(duì)應(yīng)的場(chǎng)景,將其作為參考場(chǎng)景;步驟S3、識(shí)別參考場(chǎng)景中所包含的影響因素;步驟S4、計(jì)算影響因素與特征因素之間的相似度,根據(jù)相似度篩選出特征因素中的目標(biāo)因素,并計(jì)算當(dāng)前場(chǎng)景對(duì)用戶情緒的影響值,輸出推薦結(jié)果。本發(fā)明通過(guò)識(shí)別當(dāng)前場(chǎng)景的場(chǎng)景特征,計(jì)算當(dāng)前場(chǎng)景對(duì)用戶情緒的影響值,從而可提前預(yù)測(cè)用戶在當(dāng)前場(chǎng)景下出現(xiàn)情緒變化的可能性,進(jìn)而可發(fā)出提示,實(shí)現(xiàn)了提前預(yù)測(cè)用戶情緒變化的目的,及時(shí)采取有效措施來(lái)調(diào)節(jié)用戶的情緒,使得用戶可保持平穩(wěn)的狀態(tài)。
7 一種兒科院內(nèi)護(hù)理的信息跟蹤記錄系統(tǒng) CN202510364659.3 2025-03-26 CN119905111A 2025-04-29 左智惠; 潘媛; 黃玉婷
發(fā)明涉及醫(yī)療數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種兒科院內(nèi)護(hù)理的信息跟蹤記錄系統(tǒng),該系統(tǒng)包括:獲取模,用于獲取聲音曲線信息;確定模塊,用于確定采集器的當(dāng)前的聲音分析窗口中目標(biāo)用戶未發(fā)聲的可能性;確定模塊,還用于確定待確定聲音分析窗口;確定模塊,還用于確定聲音信號(hào)是否為噪音信號(hào);擬合模塊,用于將各采集器的噪音信號(hào)進(jìn)行擬合,得到未發(fā)聲時(shí)段的噪音信號(hào)曲線;修正模塊,用于對(duì)目標(biāo)用戶在各個(gè)時(shí)刻的平均聲音曲線信息進(jìn)行修正,得到修正聲音曲線;識(shí)別模塊,用于將修正聲音曲線輸入至識(shí)別模型中識(shí)別目標(biāo)用戶的生理需求。如此,本發(fā)明提高了患兒聲音降噪效果,精準(zhǔn)有效地識(shí)別患兒生理需求。
8 音頻識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì) CN202510076220.0 2025-01-17 CN119905108A 2025-04-29 鄭福超; 楊芳; 吳長(zhǎng)章
申請(qǐng)涉及一種音頻識(shí)別方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì),涉及車輛技術(shù)領(lǐng)域。方法包括:響應(yīng)于檢測(cè)到異響音頻,根據(jù)異響音頻確定異響區(qū)域。在檢測(cè)到故障碼的情況下,根據(jù)故障碼確定故障碼對(duì)應(yīng)的故障部件。在故障部件所在的區(qū)域與異響區(qū)域相同的情況下,確定異響音頻為故障部件發(fā)出的音頻。用于提高車輛運(yùn)行音頻識(shí)別的準(zhǔn)確度。
9 一種美聲共鳴特征提取方法 CN202411897630.3 2024-12-23 CN119905106A 2025-04-29 張凱; 初琦; 李冰; 高淑芝
發(fā)明一種美聲共鳴特征提取方法,涉及一種美聲唱法識(shí)別方法,該方法首先分別采集標(biāo)準(zhǔn)與非標(biāo)準(zhǔn)美聲高音發(fā)聲樣本,并對(duì)聲音信號(hào)預(yù)加重、分加窗;其次,通過(guò)離散傅里葉變換將時(shí)域信號(hào)轉(zhuǎn)換到頻域中并保留幅度譜,使用若干個(gè)由三形帶通濾波器組成Mel濾波器,將線性頻率轉(zhuǎn)換為非線性分布的Mel頻率,計(jì)算每個(gè)濾波器組輸出的對(duì)數(shù)能量,對(duì)得到梅爾頻率倒譜系數(shù)使用ReliefF算法進(jìn)行降維;然后,使用支持向量機(jī)進(jìn)行特征分類。本發(fā)明通過(guò)對(duì)比美聲教師與美聲初學(xué)者的發(fā)聲信號(hào),有效的區(qū)分科學(xué)發(fā)聲與錯(cuò)誤發(fā)聲,提高系統(tǒng)的識(shí)別性能,對(duì)美聲發(fā)聲訓(xùn)練起到輔助教學(xué)作用。
10 結(jié)合深度學(xué)習(xí)和聲學(xué)參量陣的信號(hào)處理方法及裝置 CN202510398974.8 2025-04-01 CN119905104A 2025-04-29 方義; 黃敏燕; 馬力; 黃瓊?cè)? 張婷婷; 張學(xué)平; 王惠軍
申請(qǐng)提供一種結(jié)合深度學(xué)習(xí)和聲學(xué)參量陣的信號(hào)處理方法及裝置。該方法在獲取待處理的音頻信號(hào)后,采用訓(xùn)練好的預(yù)處理模型,對(duì)待處理的音頻信號(hào)進(jìn)行預(yù)處理,輸出相應(yīng)的超聲信號(hào);采集輸出的超聲信號(hào)通過(guò)配置的超聲參量陣揚(yáng)聲器后的自解調(diào)音頻信號(hào),該信號(hào)為逼近實(shí)際音頻信號(hào)的自解調(diào)音頻信號(hào)。該方法通過(guò)神經(jīng)網(wǎng)絡(luò)端到端可反推得出預(yù)處理模型的信號(hào)預(yù)處理算法,從而能夠改善超聲參量陣揚(yáng)聲器的音質(zhì)問(wèn)題。
11 一種風(fēng)機(jī)葉片聲紋識(shí)別檢測(cè)方法 CN202510077845.9 2025-01-17 CN119905103A 2025-04-29 竇才; 李若輝; 付善喜; 李立國(guó); 彭廣輝; 張國(guó)輝; 李添匯; 董占江; 廖力達(dá); 孫希瑾
發(fā)明涉及一種風(fēng)機(jī)葉片聲紋識(shí)別檢測(cè)方法,包括:采集待檢測(cè)風(fēng)力機(jī)葉片的初始聲音信號(hào)并進(jìn)行預(yù)處理,獲取聲音信號(hào),對(duì)聲音信號(hào)進(jìn)行時(shí)頻域分解,獲取時(shí)頻域分解結(jié)果;對(duì)時(shí)頻域分解結(jié)果進(jìn)行特征向量提取和融合,獲取綜合特征向量;將綜合特征向量輸入葉片狀態(tài)診斷模型,輸出待檢測(cè)風(fēng)力機(jī)葉片狀態(tài),其中,葉片狀態(tài)診斷模型通過(guò)目標(biāo)訓(xùn)練集對(duì)已有葉片狀態(tài)診斷模型訓(xùn)練獲得,已有葉片狀態(tài)診斷模型通過(guò)大規(guī)模訓(xùn)練集訓(xùn)練獲得,目標(biāo)訓(xùn)練集為與待檢測(cè)風(fēng)力機(jī)相同型號(hào)的歷史聲音信號(hào)及對(duì)應(yīng)的狀態(tài)標(biāo)簽,大規(guī)模訓(xùn)練集為不同型號(hào)葉片的歷史聲音信號(hào)及對(duì)應(yīng)的狀態(tài)標(biāo)簽。本發(fā)明提高了葉片狀態(tài)監(jiān)測(cè)的準(zhǔn)確性和效率。
12 一種聲音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì) CN202311412215.X 2023-10-27 CN119905099A 2025-04-29 胡寶俊; 賈永濤; 劉娟町; 李肖陽(yáng); 程銳; 王林章
本公開(kāi)是關(guān)于一種聲音信號(hào)處理方法、裝置及存儲(chǔ)介質(zhì)。聲音信號(hào)處理方法,包括:獲取原始聲音信號(hào),并對(duì)原始聲音信號(hào)進(jìn)行風(fēng)噪檢測(cè),得到頻率分界值;基于頻率分界值確定第一信號(hào)和第二信號(hào),其中,第一信號(hào)用于表示被風(fēng)噪干擾的聲音信號(hào),第一信號(hào)的頻率值小于頻率分界值,第二信號(hào)用于表示未被風(fēng)噪干擾的聲音信號(hào),第二信號(hào)的頻率值大于或等于頻率分界值;對(duì)第二信號(hào)進(jìn)行頻帶拓展,得到第一全頻帶信號(hào),第一全頻帶信號(hào)為與第二信號(hào)對(duì)應(yīng)的全頻帶信號(hào);基于第一全頻帶信號(hào),重構(gòu)第一信號(hào);基于重構(gòu)的第一信號(hào)以及第二信號(hào),得到目標(biāo)聲音信號(hào)。通過(guò)本公開(kāi),將被風(fēng)噪干擾的聲音信號(hào)進(jìn)行頻帶拓展,得到重構(gòu)的聲音信號(hào)。
13 一種音頻編碼方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及產(chǎn)品 CN202411972328.X 2024-12-30 CN119905097A 2025-04-29 魏善義
申請(qǐng)實(shí)施例提供了一種音頻編碼方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及產(chǎn)品。本申請(qǐng)實(shí)施例提供的技術(shù)方案通過(guò)從待編碼語(yǔ)音中提取預(yù)設(shè)時(shí)間長(zhǎng)度的檢測(cè)語(yǔ)音特征,根據(jù)檢測(cè)語(yǔ)音特征在語(yǔ)音特征庫(kù)中進(jìn)行語(yǔ)音特征匹配,并根據(jù)匹配結(jié)果確定目標(biāo)語(yǔ)音特征,將目標(biāo)語(yǔ)音特征加入到訓(xùn)練完成的編碼網(wǎng)絡(luò),通過(guò)編碼網(wǎng)絡(luò)根據(jù)待編碼語(yǔ)音和目標(biāo)語(yǔ)音特征進(jìn)行語(yǔ)音編碼處理,得到目標(biāo)音頻特征,對(duì)目標(biāo)音頻特征進(jìn)行殘差矢量量化處理得到目標(biāo)編碼結(jié)果,通過(guò)將檢測(cè)語(yǔ)音特征或歷史語(yǔ)音特征作為目標(biāo)語(yǔ)音特征與待編碼語(yǔ)音進(jìn)行語(yǔ)音編碼處理,結(jié)合與待編碼語(yǔ)音相關(guān)的語(yǔ)音特征進(jìn)行音頻編碼,可在提高對(duì)音頻的壓縮率的同時(shí),提高語(yǔ)音保真度,提高音頻編碼質(zhì)量。
14 語(yǔ)音識(shí)別方法、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì) CN202311376389.5 2023-10-20 CN119905096A 2025-04-29 王滿洪; 孫玉濤
申請(qǐng)提供語(yǔ)音識(shí)別方法、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。在該方法中,電子設(shè)備可以在錄制音頻的同時(shí)識(shí)別音頻中的說(shuō)話內(nèi)容。并且,無(wú)論電子設(shè)備中是否預(yù)先存儲(chǔ)有說(shuō)話人的音頻特征,電子設(shè)備都可以對(duì)每句說(shuō)話內(nèi)容對(duì)應(yīng)的說(shuō)話人進(jìn)行區(qū)分。這樣在一些說(shuō)話場(chǎng)景中,用戶無(wú)需手動(dòng)記錄就可以通過(guò)電子設(shè)備獲得說(shuō)話內(nèi)容及其說(shuō)話人的文本記錄,從而提高用戶的工作效率。
15 一種語(yǔ)音活動(dòng)檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì) CN202510009826.2 2025-01-03 CN119905095A 2025-04-29 宋大偉
申請(qǐng)實(shí)施例涉及語(yǔ)音信號(hào)處理技術(shù)領(lǐng)域,公開(kāi)了一種語(yǔ)音活動(dòng)檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。語(yǔ)音活動(dòng)檢測(cè)方法,包括:獲取麥克風(fēng)信號(hào)和骨聲紋信號(hào),其中,所述麥克風(fēng)信號(hào)和所述骨聲紋信號(hào)為針對(duì)同一場(chǎng)景同時(shí)通過(guò)麥克風(fēng)和骨聲紋傳感器采集到的信號(hào);對(duì)所述麥克風(fēng)信號(hào)和所述骨聲紋信號(hào)分別進(jìn)行特征提?。粚?duì)提取得到的麥克風(fēng)特征和骨聲紋特征進(jìn)行拼接,得到輸入特征;利用預(yù)先訓(xùn)練好的模型處理所述輸入特征,得到語(yǔ)音活動(dòng)的檢測(cè)結(jié)果,其中,所述模型為通過(guò)對(duì)同一場(chǎng)景同時(shí)通過(guò)麥克風(fēng)和骨聲紋傳感器采集到的信號(hào)進(jìn)行特征提取和特征拼接得到的訓(xùn)練數(shù)據(jù)訓(xùn)練得到。至少有利于提高語(yǔ)音活動(dòng)檢測(cè)的準(zhǔn)確性。
16 一種3D數(shù)字人的實(shí)時(shí)交互方法及裝置 CN202411719290.5 2024-11-27 CN119905093A 2025-04-29 盧歡; 魏勛
發(fā)明涉及3D數(shù)字人技術(shù)領(lǐng)域,公開(kāi)了一種3D數(shù)字人的實(shí)時(shí)交互方法及裝置,本發(fā)明對(duì)目標(biāo)用戶發(fā)起的第一對(duì)話數(shù)據(jù),依次經(jīng)過(guò)語(yǔ)音識(shí)別單元轉(zhuǎn)換為第一對(duì)話文本,再輸入語(yǔ)言識(shí)別模型識(shí)別出應(yīng)答文本,再合成為應(yīng)答語(yǔ)音后經(jīng)過(guò)唇語(yǔ)生成器生成目標(biāo)唇語(yǔ)數(shù)據(jù),最后驅(qū)動(dòng)3D數(shù)字人作出語(yǔ)音應(yīng)答,可以保證目標(biāo)用戶得到準(zhǔn)確、自然、真實(shí)的反饋。并且通過(guò)語(yǔ)音對(duì)話的方式進(jìn)行交互,簡(jiǎn)單便捷,能夠展現(xiàn)出高度逼真的對(duì)話情景,增強(qiáng)了目標(biāo)用戶的交互體驗(yàn)。
17 語(yǔ)音控制方法、第一服務(wù)器、第二服務(wù)器和語(yǔ)音控制系統(tǒng) CN202510027337.X 2025-01-08 CN119905091A 2025-04-29 肖晨; 李紹斌; 唐杰; 潘曉飛; 劉洋
發(fā)明實(shí)施例涉及通信交互技術(shù)領(lǐng)域,特別涉及一種語(yǔ)音控制方法、第一服務(wù)器、第二服務(wù)器和語(yǔ)音控制系統(tǒng),方法應(yīng)用于第三方服務(wù)平臺(tái)中的第一服務(wù)器,包括:接收第三方服務(wù)平臺(tái)中語(yǔ)音設(shè)備采集的語(yǔ)音控制數(shù)據(jù);解析語(yǔ)音控制數(shù)據(jù),確定語(yǔ)音控制數(shù)據(jù)所要控制的目標(biāo)設(shè)備所屬的目標(biāo)服務(wù)平臺(tái);將語(yǔ)音控制數(shù)據(jù)轉(zhuǎn)發(fā)至目標(biāo)服務(wù)平臺(tái)中的第二服務(wù)器,以使第二服務(wù)器基于對(duì)語(yǔ)音控制數(shù)據(jù)進(jìn)行自然語(yǔ)言處理后得到的設(shè)備指令對(duì)目標(biāo)設(shè)備進(jìn)行控制。本申請(qǐng)利用了第二服務(wù)器自有的自然語(yǔ)言處理技術(shù)來(lái)將語(yǔ)音控制數(shù)據(jù)轉(zhuǎn)化為設(shè)備“聽(tīng)得懂”的設(shè)備指令,從而省去了傳統(tǒng)控制中的協(xié)議轉(zhuǎn)換方式,無(wú)需為每個(gè)第三方服務(wù)平臺(tái)單獨(dú)實(shí)現(xiàn)復(fù)雜的協(xié)議轉(zhuǎn)換邏輯。
18 車內(nèi)語(yǔ)音的識(shí)別處理方法、裝置、電子設(shè)備及介質(zhì) CN202411967891.8 2024-12-30 CN119905090A 2025-04-29 李明全; 朱宏海; 封培
申請(qǐng)涉及一種車內(nèi)語(yǔ)音的識(shí)別處理方法、裝置、電子設(shè)備及介質(zhì),通過(guò)獲取車載系統(tǒng)采集到的混合音頻信息和視頻信息,對(duì)混合音頻信息進(jìn)行語(yǔ)音分離,得到至少一個(gè)子音頻信息,以確定每一個(gè)子音頻信息對(duì)應(yīng)的目標(biāo)用戶,并基于目標(biāo)用戶,結(jié)合視頻信息進(jìn)行用戶匹配,得到目標(biāo)用戶對(duì)應(yīng)的圖像狀態(tài)信息,隨后依據(jù)圖像狀態(tài)信息,結(jié)合目標(biāo)用戶對(duì)應(yīng)的子音頻信息,生成車載系統(tǒng)對(duì)應(yīng)的用戶交流畫面,并依據(jù)用戶交流畫面進(jìn)行輸出;從而可以通過(guò)用戶交流畫面實(shí)時(shí)且準(zhǔn)確地為用戶展示車內(nèi)交流情況,進(jìn)而有效提高車內(nèi)用戶交流的體驗(yàn),解決了現(xiàn)有相關(guān)技術(shù)因用戶無(wú)法準(zhǔn)確獲取車內(nèi)交流內(nèi)容所導(dǎo)致的車內(nèi)用戶交流體驗(yàn)差的問(wèn)題。
19 基于領(lǐng)域大模型的語(yǔ)義解析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì) CN202411684053.X 2024-11-22 CN119905089A 2025-04-29 朱宇光
申請(qǐng)公開(kāi)一種基于領(lǐng)域大模型的語(yǔ)義解析方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),包括:獲取待質(zhì)檢的語(yǔ)音數(shù)據(jù);將所述語(yǔ)音數(shù)據(jù)傳輸至多Agent節(jié)點(diǎn)的領(lǐng)域大模型;其中,所述領(lǐng)域大模型配置了多個(gè)Agent節(jié)點(diǎn),每個(gè)Agent節(jié)點(diǎn)表示一個(gè)語(yǔ)義質(zhì)檢模型;所述領(lǐng)域大模型關(guān)聯(lián)有預(yù)設(shè)領(lǐng)域的領(lǐng)域知識(shí)庫(kù);調(diào)用所述領(lǐng)域大模型的至少一個(gè)語(yǔ)義Agent節(jié)點(diǎn)對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ)義分析,獲得初步語(yǔ)義質(zhì)檢結(jié)果;調(diào)用所述領(lǐng)域大模型的至少兩個(gè)點(diǎn)評(píng)Agent節(jié)點(diǎn)對(duì)所述初步語(yǔ)義質(zhì)檢結(jié)果進(jìn)行點(diǎn)評(píng),獲得每個(gè)點(diǎn)評(píng)Agent節(jié)點(diǎn)的語(yǔ)義點(diǎn)評(píng)結(jié)果;根據(jù)所述語(yǔ)義點(diǎn)評(píng)結(jié)果生成所述語(yǔ)音數(shù)據(jù)的語(yǔ)義解析結(jié)果。利用多個(gè)專業(yè)領(lǐng)域的語(yǔ)義質(zhì)檢模型和點(diǎn)評(píng)模型的協(xié)作,提高了語(yǔ)義分析的準(zhǔn)確性和可靠性。
20 面向類人表達(dá)的方言語(yǔ)音合成方法、裝置、設(shè)備及介質(zhì) CN202510095120.2 2025-01-21 CN119905084A 2025-04-29 孫奧蘭; 王健宗; 程寧
發(fā)明涉及語(yǔ)音合成及醫(yī)療健康領(lǐng)域,公開(kāi)了一種面向類人表達(dá)的方言語(yǔ)音合成方法、裝置、設(shè)備及介質(zhì),包括:對(duì)預(yù)先獲取的訓(xùn)練文本進(jìn)行文本特征提取以及文本特征標(biāo)記,得到標(biāo)記文本特征;對(duì)預(yù)先獲取的訓(xùn)練語(yǔ)音進(jìn)行語(yǔ)音特征提取以及語(yǔ)音特征標(biāo)記,得到標(biāo)記語(yǔ)音特征;利用所述標(biāo)記文本特征對(duì)所述標(biāo)記語(yǔ)音特征進(jìn)行標(biāo)記對(duì)齊,得到對(duì)齊訓(xùn)練數(shù)據(jù)集;利用所述對(duì)齊訓(xùn)練數(shù)據(jù)集對(duì)預(yù)設(shè)的語(yǔ)音合成模型進(jìn)行模型訓(xùn)練,得到初級(jí)語(yǔ)音模型;利用所述對(duì)齊訓(xùn)練數(shù)據(jù)集對(duì)所述初級(jí)語(yǔ)音模型進(jìn)行交叉注意擴(kuò)散,得到方言語(yǔ)音模型;獲取醫(yī)療診斷回復(fù)文本,利用所述方言語(yǔ)音模型生成所述醫(yī)療診斷回復(fù)文本對(duì)應(yīng)的回復(fù)音頻。本發(fā)明能夠提升合成方言語(yǔ)音的效率。
QQ群二維碼
意見(jiàn)反饋