蜜桃无码视频,国产精品 17c,5g-天天看天天奭免费入口,乱亲女H秽乱长久久久

歡迎來到 常識(shí)詞典網(wǎng) , 一個(gè)專業(yè)的常識(shí)知識(shí)學(xué)習(xí)網(wǎng)站!

[ Ctrl + D 鍵 ]收藏本站

您所在的位置:首頁 > 教育學(xué)習(xí) > 百科

百科

淘寶、阿里巴巴等電商平臺(tái)的站內(nèi)搜索中其詞庫估計(jì)都是如何建設(shè)的?

分類: 百科 常識(shí)詞典 編輯 : 常識(shí) 發(fā)布 : 09-07

閱讀 :373

淘寶、阿里巴巴等電商平臺(tái)的站內(nèi)搜索中其詞庫估計(jì)都是如何建設(shè)的?1、類似淘寶、阿里巴巴(包括中英文)、亞馬遜、ebay等電子商務(wù)平臺(tái),其站內(nèi)搜索中,詞庫建設(shè)中估計(jì)都有哪些要點(diǎn),估計(jì)都是大致怎么樣的方案?會(huì)有同義詞、上位詞、下位詞、集中詞、分散詞、隱藏詞等等概念么?2、另外這些電子商務(wù)平臺(tái)的詞庫基本上都是名詞為主的詞庫,這個(gè)和通用搜索引擎的詞庫存在比較大的差別,針對(duì)這一情況,需要有些與通過搜索引擎詞庫怎樣不同的設(shè)計(jì)?4 個(gè)答案

答案 1:

因?yàn)椴辉跇I(yè)務(wù)前線,我只能說說通用的詞庫大致怎么來的。針對(duì)不同的類別,用規(guī)則定向去某些特定網(wǎng)頁或某種特定模式挖掘,從文本中抽取,并加上統(tǒng)計(jì)信息和規(guī)則過濾。這里的類別指的是產(chǎn)品名稱 電影名稱這樣的。抽取的結(jié)果和中文基本詞庫合并,就是詞典的base版本新詞挖掘是另一件事,用戶查詢?nèi)罩竞途W(wǎng)頁中的詞頻等都是很重要的信息,最后是用機(jī)器學(xué)習(xí)的分類來做的,crf用于新詞發(fā)現(xiàn)也不錯(cuò),但真正要結(jié)果好用,過濾要花不少工夫。-的新詞就基于crf同義上下位都有做。 集中分散?你是說統(tǒng)稱和具體名稱么,這個(gè)也有。 隱藏詞因?yàn)殡娚虣z索很在乎召回率,是重點(diǎn)做過的。

答案 2:

感謝邀請,但我不適合回答這個(gè)問題,因?yàn)槲覜]去過,所以不了解。詞庫建設(shè)是個(gè)持續(xù)過程,需要有新詞和未登陸詞發(fā)現(xiàn)解決方案。記得在z-i-u上看到有阿里的人說他們第一個(gè)把CRF用于分詞商業(yè)化了。一般來說,新詞和未登陸詞發(fā)現(xiàn)都采用統(tǒng)計(jì)方案,CRF是其中很好的工具。

答案 3:

概念性的東西我看你也了解了,最重要的是通過用戶行為(熱門搜索)補(bǔ)充詞庫。

答案 4:

淘寶、亞馬遜這樣的電子商務(wù)網(wǎng)站,他們的搜索應(yīng)該更加側(cè)重于商品名,詞庫的建設(shè)應(yīng)該主要著重點(diǎn)在商品名詞表的建設(shè)當(dāng)中吧,我覺得對(duì)于電子商務(wù)網(wǎng)站來說,數(shù)據(jù)都是格式化的或者就直接存在數(shù)據(jù)庫里面,想要獲取他們的商品名等各種信息還是比較容易的。無需用到CRF來做分詞或新詞發(fā)現(xiàn)吧?

下一篇:你熟知多少瘋言瘋語? 下一篇 【方向鍵 ( → )下一篇】

上一篇:思科還可以稱霸多少年? 上一篇 【方向鍵 ( ← )上一篇】

亚洲综合色在线观看一区二区三区 | 日韩在线观看TV| 99国产精品成人观看| 精品亚洲国产国拍| 国产精品久久久污污污| 99re国产在线| 51无人区码一码二码三码区别| 日日摸夜夜添欧美一区| 亚洲欧美日韩v在线观看不卡| 91精品国产一区二区三区免费| 宁阳县| 欧美精品黄网站在线观看| 蜜桃人妻| 高中国产开嫩苞实拍视频在线观| 乳在线| 久久国产热播视频| 欧美色图亚洲另类| 真人毛片最多人播放| 国产精品久久久久久久久久性按摩| 欧亚性爱激恃情片| 亚洲AV线| 久久蜜桃91| 久久网 国产| 人妻无码熟妇乱又伦精品| av男人天堂网| 熟女欧美一区| AV日韩一区| 亚洲中文二三区| 九色五月婷婷丁香| 亚洲日韩欧洲无码av夜夜| 午夜精品久久久久久久综合| 国产在线看片无码人精品| 国产在线观看黄色| 无码视频在线不卡观看| 抽插爽片免费看| 欧美精品丝袜久久久| 亚洲天堂性爱视屏| 日韩精品一级二级三级| 熟妇人妻av| 人妻午夜精品| 久久久亚洲一二三区|