為何我搜尋"高山症"
出來的文章亂七八糟
連里港趙壽山豬腳那篇都列名第二
搜尋"下載"
還自動去除"下"字
我有選"搜尋符合以上所有關鍵字的資料"
搜尋出問題
-
- 訪客
Re: 搜尋出問題
phpbb中文搜尋蠻弱的,不是因為資料庫亂的關係。
以”高山症”為例,搜尋時候是以字,而非以詞來搜尋,因此是找資料庫裡有"高","山","症"這三個字的組合,而非”高山症”這一個詞,因此會有很多找出來的文章是”牛頭不對馬嘴”的,如果您能夠有第二個條件再進去篩選的話,就能夠更精準一些。意思是第一輪找出來的東西,可以繼續下第二個條件去搜尋。
此外,也因為是以字來搜尋的,因此常用的字會被排除掉,譬如”的”幾乎每篇文章都有就沒辦法當條件來搜尋;還有好像必須三個字以上才會進行搜尋,兩個字太少了,系統不接受。
既然中文搜尋很弱,有沒有想要去改進,確實有,但是,沒有別人實驗證明確實有明顯的進步以前,我們不敢使用非官方的搜尋方法,因為,我們的資料庫已經相當龐大了,重新索引重建可能要伺服器日以繼夜花掉好幾天的時間才能完成。
以上簡單說明,請指教。
以”高山症”為例,搜尋時候是以字,而非以詞來搜尋,因此是找資料庫裡有"高","山","症"這三個字的組合,而非”高山症”這一個詞,因此會有很多找出來的文章是”牛頭不對馬嘴”的,如果您能夠有第二個條件再進去篩選的話,就能夠更精準一些。意思是第一輪找出來的東西,可以繼續下第二個條件去搜尋。
此外,也因為是以字來搜尋的,因此常用的字會被排除掉,譬如”的”幾乎每篇文章都有就沒辦法當條件來搜尋;還有好像必須三個字以上才會進行搜尋,兩個字太少了,系統不接受。
既然中文搜尋很弱,有沒有想要去改進,確實有,但是,沒有別人實驗證明確實有明顯的進步以前,我們不敢使用非官方的搜尋方法,因為,我們的資料庫已經相當龐大了,重新索引重建可能要伺服器日以繼夜花掉好幾天的時間才能完成。
以上簡單說明,請指教。