歡迎來到 常識詞典網 , 一個專業(yè)的常識知識學習網站!
[ Ctrl + D 鍵 ]收藏本站
答案 1:
一般工具使用的都是條件隨機場CRF的模型,主要的區(qū)別會在訓練層面上。答案 2:
我們做的LJParser,在業(yè)界用的非常好。很高的評價,建議試用!并提出寶貴意見:lingjoin/download...答案 3:
我提供一個笨但卻在實際中可以生效的思路。其實很簡單,就是把文檔集合里的文檔兩兩比較,找出來共同的字串,這樣很快就可以建立一個詞匯備選集合。再對該集合作適當的處理,如去除停用詞,等等。 這個備選集合可以成為下一步工作的起點,后面應該有很多方法可以采納。答案 4:
學術上研究用CRF,然后著重在特征選擇上下功夫,取得的效果還不錯。很久沒看相關-了,不知道是否有更好的模型或者方法? 實際應用當中,主要應該采用的是挖掘querylog 和用戶點擊的方法更為實用,目前微博很火,很多新詞都來自微博,基于微博的新詞發(fā)現也是一個不錯的方法。下一篇:知乎每天會產生多少問題呢? 下一篇 【方向鍵 ( → )下一篇】
上一篇:王功權和王琴的私奔,能得到朋友們的祝福嗎? 上一篇 【方向鍵 ( ← )上一篇】
快搜