關鍵詞:兼類詞消歧 兼類詞詞典 兼類詞語料庫 語言特征 條件隨機場模型
摘要:兼類詞歧義直接影響詞性標注的準確率。本文針對越南語兼類詞歧義問題提出一種融合語言特性的越南語兼類詞消歧方法。通過構建越南語兼類詞詞典和兼類詞語料庫,分析越南語的語言特征和兼類詞特點,選取有效的特征集;然后利用條件隨機場能添加任意特征等優點,在使用詞和詞性上下文信息的同時,引入句法成分和指示詞特征,得到消歧模型。最后在兼類詞語料上實驗,準確率達到了87.23%。實驗表明本文所提出的越南語兼類詞消歧方法有效可行,可以提高詞性標注正確率。
數據采集與處理雜志要求:
{1}基金項目:如果論文是項目成果,請按“項目名稱(項目號)”的形式寫出。項目名稱與項目號兩者都要有。
{2}稿件應具有科學性、創新性和實用性,論點明確、論據可靠、數據準確、邏輯嚴謹、文字通順。
{3}文中圖表或插圖請附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對論文中某一特定內容的解釋或補充說明,用帶圈數字注于當頁頁腳。
{5}稿件文字、標點、年代、數字等書寫方式均以國家有關規定為準。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社