武漢理工大學(xué)數(shù)字傳播工程有限公司(武漢理工大學(xué)數(shù)字傳播工程研究中心)
本文源自:金融界金融界2025年8月8日消息,武漢武漢國(guó)家知識(shí)產(chǎn)權(quán)局信息顯示,理工理工武漢理工數(shù)字傳播工程有限公司申請(qǐng)一項(xiàng)名為“一種基于偏好優(yōu)化的大學(xué)大學(xué)音頻生成方法”的專(zhuān)利,公開(kāi)號(hào)CN120452413A,數(shù)字?jǐn)?shù)字申請(qǐng)日期為2025年05月。傳播傳播
專(zhuān)利摘要顯示,工程公司工程本發(fā)明公開(kāi)了一種基于偏好優(yōu)化的有限研究音頻生成方法,屬于人工智能與音頻生成技術(shù)領(lǐng)域,中心其包括如下步驟:S1、武漢武漢輸入音頻:采用音頻VAE把任一音頻變?yōu)橐纛l特征;S2、理工理工輸入文本描述:采用預(yù)訓(xùn)練模型提取文本特征;S3、大學(xué)大學(xué)特征拼接:將音頻特征和文本特征拼接后輸入大模型,數(shù)字?jǐn)?shù)字并訓(xùn)練,傳播傳播生成第一階段訓(xùn)練的工程公司工程音頻大模型;S4、候選音頻生成:輸入音樂(lè)類(lèi)的有限研究文本描述,經(jīng)過(guò)第一階段訓(xùn)練的音頻大模型,生成N個(gè)音頻;S5、相似度對(duì)比;S6、模型迭代;S7、音頻生成。
本發(fā)明通過(guò)兩階段訓(xùn)練框架,本發(fā)明在預(yù)訓(xùn)練階段利用大規(guī)模公開(kāi)數(shù)據(jù)學(xué)習(xí)音頻生成基礎(chǔ)能力,在微調(diào)階段通過(guò)強(qiáng)化學(xué)習(xí)直接優(yōu)化人類(lèi)偏好指標(biāo)天眼查資料顯示,武漢理工數(shù)字傳播工程有限公司,成立于2014年,位于武漢市,是一家以從事新聞和出版業(yè)為主的企業(yè)。
企業(yè)注冊(cè)資本6318.923716萬(wàn)人民幣通過(guò)天眼查大數(shù)據(jù)分析,武漢理工數(shù)字傳播工程有限公司共對(duì)外投資了16家企業(yè),參與招投標(biāo)項(xiàng)目30次,財(cái)產(chǎn)線索方面有商標(biāo)信息120條,專(zhuān)利信息75條,此外企業(yè)還擁有行政許可5個(gè)。