關(guān)鍵詞:端到端指代消解 結(jié)構(gòu)化嵌入 詞性 成分句法樹(shù) 文檔句法壓縮樹(shù)
摘要:在LEE等人提出的端到端指代消解模型基礎(chǔ)上,考慮中文行文特點(diǎn),提出一種融合結(jié)構(gòu)化信息的中文指代消解模型。壓縮文檔中所進(jìn)行有句子對(duì)應(yīng)的成分句法樹(shù)并獲取文檔壓縮樹(shù)葉節(jié)點(diǎn)深度,采用成分句法樹(shù)的結(jié)構(gòu)化嵌入(SECT)方法將結(jié)構(gòu)信息進(jìn)行向量化處理,將詞性、文檔壓縮樹(shù)葉節(jié)點(diǎn)深度與SECT信息作為3個(gè)特征向量引入模型中進(jìn)行中文指代消解。在CoNLL2012數(shù)據(jù)集中的測(cè)試結(jié)果表明,通過(guò)結(jié)合上述3個(gè)特征,可使該模型的中文指代消解性能得到有效提高,其平均F1值可達(dá)62.33%,較基準(zhǔn)模型提升5.28%。
計(jì)算機(jī)工程雜志要求:
{1}文獻(xiàn)按作者姓氏的第一個(gè)字母依A-Z順序分中、英文兩部分排列,中文文獻(xiàn)在前,英文文獻(xiàn)在后。引文中的英文書名及期刊名用斜體,論文題目寫入“”號(hào)內(nèi)。
{2}來(lái)稿應(yīng)是未以任何形式公開(kāi)發(fā)表過(guò)的論文,亦不接受一稿多投的文章。稿件寄出1個(gè)月未接到本刊通知即可自行處理。
{3}本刊已許可中國(guó)知網(wǎng)以數(shù)字化方式復(fù)制、匯編、發(fā)行、信息網(wǎng)絡(luò)傳播本刊全文。如有異議,請(qǐng)?jiān)谕陡鍟r(shí)說(shuō)明,本刊將按作者說(shuō)明處理。
{4}標(biāo)題之下如“(1)(2)”和“①②”序數(shù)不分行顯示。
{5}作者簡(jiǎn)介:第一作者姓名(出生年月),性別,畢業(yè)院校及學(xué)位,職稱,研究方向。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社