結合半監(jiān)督學習和規(guī)則校正的中文學術論文問題實體識別研究
摘要:為快速定位和識別學術論文中的研究問題,針對中文學術論文提出一種結合半監(jiān)督學習和規(guī)則校正的問題實體識別方法。首先以條件隨機場模型為基礎框架,構建詞性、指示詞等有監(jiān)督特征和相似度、重要度等無監(jiān)督特征,然后對比不同特征組合下的模型識別效果,結合領域語言學規(guī)則對識別結果進行校對處理,最后以“共享經(jīng)濟”和“船舶建造”主題領域為例進行實證研究。(剩余15637字)