基于聯合學習的跨領域法律文書中文分詞方法

江明奇; 嚴倩; 李壽山 蘇州大學計算機科學與技術學院; 江蘇蘇州215006

關鍵詞:中文分詞 法律文書 聯合學習 

摘要:中文分詞任務是自然語言處理的一項基本任務。但基于統計的中文分詞方法需要大規模的訓練樣本,且擁有較差的領域適應性。然而,法律文書涉及眾多領域,對大量的語料進行標注需要耗費大量的人力、物力。針對該問題,該文提出了一種基于聯合學習的跨領域中文分詞方法,該方法通過聯合學習將大量的源領域樣本輔助目標領域的分詞,從而提升分詞性能。實驗結果表明,在目標領域標注樣本較少的條件下,該文方法的中文分詞性能明顯優于傳統方法。

中文信息學報雜志要求:

{1}本刊對刊發的文章擁有版權,不得擅自轉載、改編。凡轉載、改編務經我刊同意,違者必究。

{2}作者簡介包括:姓名、性別、出生年月、畢業學校及所學專業、工作單位、職務職稱、現從事的研究工作情況。

{3}來稿若屬國家自然科學基金項目或省部基金項目,請在文稿中標明其基金來源和編號,我刊可以優先審核發表。

{4}正文內連續敘述中的序號采用①……;②……;③……。分級超過3級后用網括號如:“①”,“②”表示,并采用連排。

{5}附注請一律使用當頁腳注的形式,以帶圈①……⑩的方式編號,使用每頁重新編號的方式。

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

中文信息學報

北大期刊
1-3個月下單

關注 16人評論|0人關注
相關期刊
服務與支付
国产精品视频线观看26uuu,免费av网站在线观看,免费一级a四片久久精品网,国产成人无码精品久久久露脸
香蕉香蕉永久免费看 | 色色综合久久久久久久综合 | 热久久这里只有精品 | 综合久久资源一本 | 亚洲精品中文字幕乱码无线 | 亚洲人成网站高清观看 |