結合詞向量和統計特征的專利相似度測量方法

俞琰; 陳磊; 姜金德; 趙乃瑄 南京工業大學信息服務部; 南京210009; 東南大學成賢學院計算機工程系; 南京211816; 南京曉莊學院經濟與管理學院; 南京210028

關鍵詞:專利相似度 詞向量 統計特征 

摘要:【目的】針對傳統專利相似度測量忽略詞語語義關系的問題,提出一種新的專利相似度測量方法,以提高專利相似度測量的準確度。【方法】引入基于神經網絡的詞向量模型,獲得專利文本中詞的語義信息;計算詞統計特征信息,度量不同詞在專利文本中的重要程度;最后結合詞向量和統計特征,形成專利文本表示,測量專利相似度。【結果】本文所提結合詞向量和統計特征的專利相似度測量方法比傳統的空間向量方法表示專利文本相似度方法準確率提高了13.92%。【局限】輔助專利文本集的選取策略有待進一步研究。【結論】使用空間向量方法表示專利文本結合詞向量和統計特征能夠顯著提高專利相似度測量的準確度。

數據分析與知識發現雜志要求:

{1}所有作者的作者簡介(姓名、工作單位、職稱、研究方向);通訊作者請再提供電子郵箱。

{2}稿件文責自負。編輯部有權對來稿進行文字和技術性刪改,對實質性內容的修改,則應征求作者同意。

{3}標題序號:可按四級小標題的格式寫:一、(一)、1、(1);一級、二級標題另起段,正文另起段;三級、四級小標題另起段,但正文接排;正文內序號用①……②……等。

{4}參考文獻:(1)正文格式:作者,發表年(多版次文獻請同時提供第 1 版的發表時間),頁碼,外加圓括號。(2)文末格式:中、外文獻分開,各按音序排列。

{5}摘要應反映論文的目的、方法及主要結果、結論,并充分反映論文的創新點,表達簡明、語義確切,以100 ~300 字為宜。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

數據分析與知識發現

CSSCI南大期刊
1-3個月下單

關注 8人評論|1人關注
相關期刊
服務與支付
国产精品视频线观看26uuu,免费av网站在线观看,免费一级a四片久久精品网,国产成人无码精品久久久露脸
亚洲人成亚洲人成在线观看 | 日韩综合一区二区 | 亚洲欧美精品综合一区 | 日韩亚洲一区二 | 亚洲аv电影在线观看 | 亚洲无线观看国产高 |