第 1 頁 (共 1 頁)
搜尋功能
發表於 : 週六 1月 05, 2008 9:41 pm
由 小太陽
(催眠) (催眠) (催眠)
論壇更版後 . 我都不知道如何搜尋
要怎樣下條件. 字才不會拆開呢
(鼻青臉腫) (鼻青臉腫) (倒地)
Re: 搜尋功能
發表於 : 週五 1月 18, 2008 3:22 pm
由 訪客C
有沒有大大可以解決這個問題?
(想入非非)
Re: 搜尋功能
發表於 : 週日 1月 27, 2008 7:57 pm
由 tomi
這真是一個大問題....希望能快快改善~!! (眼汪汪)
Re: 搜尋功能
發表於 : 週一 1月 28, 2008 12:09 am
由 董事008
使用關鍵字再加上發表人的話,可以更精確地搜尋出您要的文章。
論壇的搜尋功能確實不是非常裡想,如果有更好的解決辦法,我們會採用,也請會員能夠提供相關資訊。
不過,索引重建很費時喔,第一次就花了將近9個小時的時間 (印堂發黑)
Re: 搜尋功能
發表於 : 週一 1月 28, 2008 4:58 pm
由 董事008
這是竹貓上面一篇關於搜尋的討論,有興趣的人可以參考一下 (微笑)
http://phpbb-tw.net/phpbb/posting.php?m ... 6&p=259302
michaelchain 寫:以前的做法搜索什么語言都沒問題, 但是對資源消耗太大, 才出現今天的 分詞+索引 方式.
這種方式能極大的降低搜索的時間復雜度. 將搜索時產生的時間消耗轉移到匯入資料階段. 因此使用這種方式的搜索模組都會帶一個很大的索引庫(算法不好的話可能比你的資料還大). 也許對一些空間很小但是cpu很快的人有點不方便. 但這是科技的方向..
中文搜索一向是一個難題. 首先中文的分詞就有很多學問, 微軟亞洲研究院還專門成立一個group研究自然語言, 其中研究最多的就是語言的分詞, 因為這對于語音合成/識別非常重要. 但是中文這么高深的東西, 雖然現在有很多理論, 但是最好的成績也就是97~98%, 100%是做不到的, 因為還有不少必須結合語境才能進行分詞的情況.
每個中文搜索引擎都有自己的一套分詞算法, 這是核心技術之一. 在這方面百度一直比google好一點.
話題回到phpbb上來. 因為phpbb并不是特別為中文開發的軟體, 所以并不帶分詞算法, 對于中文來講, phpbb實際上就是將搜索詞分成一串漢字, 每個漢字作為一個單詞存在索引中, 閾值就是避免檢索出現過于頻繁的字. 如果閾值設為30%, 那么如果你的數據庫中所有文章包含了10,000個漢字, 而"的"字出現了3,001次, 重建索引后這個"的"字就會被從檢索條目中刪掉.
再來看看其他論壇軟體的搜索做法.
DZ我比較清楚, 版本5.5也還在用那種老土的%xx%方式來搜索, 只不過在上面優化再優化, 盡量避免各種可能避免的搜索動作, 或者進行時間限制等等. 如果你同時用1000個機器人, 每個機器人抱一本辭海亂序去搜, 論壇一定會翹翹.
vbb一直讓中文用戶不滿意的地方也是搜索. 以至于有人專門為vbb開發了一個中文搜索插件. 這我沒有仔細研究過, 如果里面已經有做初步的中文分詞, 那么我們可以借鑒過來用在phpbb上.
其他的論壇沒有接觸過, 沒有發言權.
如果大家有興趣, 可以去研究一下搜索算法, 分詞算法, 這些資料文檔在google上可以找到很多. 如果有PHP方面的中文分詞開源軟體, 也不妨推薦一下, 說不定就能做成一個中文搜索的MOD
Re: 搜尋功能
發表於 : 週一 1月 28, 2008 8:13 pm
由 MK
園丁008 寫:這是竹貓上面一篇關於搜尋的討論,有興趣的人可以參考一下 (微笑)
http://phpbb-tw.net/phpbb/posting.php?m ... 6&p=259302
michaelchain 寫:以前的做法搜索什么語言都沒問題, 但是對資源消耗太大, 才出現今天的 分詞+索引 方式.
這種方式能極大的降低搜索的時間復雜度. 將搜索時產生的時間消耗轉移到匯入資料階段. 因此使用這種方式的搜索模組都會帶一個很大的索引庫(算法不好的話可能比你的資料還大). 也許對一些空間很小但是cpu很快的人有點不方便. 但這是科技的方向..
中文搜索一向是一個難題. 首先中文的分詞就有很多學問, 微軟亞洲研究院還專門成立一個group研究自然語言, 其中研究最多的就是語言的分詞, 因為這對于語音合成/識別非常重要. 但是中文這么高深的東西, 雖然現在有很多理論, 但是最好的成績也就是97~98%, 100%是做不到的, 因為還有不少必須結合語境才能進行分詞的情況.
每個中文搜索引擎都有自己的一套分詞算法, 這是核心技術之一. 在這方面百度一直比google好一點.
話題回到phpbb上來. 因為phpbb并不是特別為中文開發的軟體, 所以并不帶分詞算法, 對于中文來講, phpbb實際上就是將搜索詞分成一串漢字, 每個漢字作為一個單詞存在索引中, 閾值就是避免檢索出現過于頻繁的字. 如果閾值設為30%, 那么如果你的數據庫中所有文章包含了10,000個漢字, 而"的"字出現了3,001次, 重建索引后這個"的"字就會被從檢索條目中刪掉.
再來看看其他論壇軟體的搜索做法.
DZ我比較清楚, 版本5.5也還在用那種老土的%xx%方式來搜索, 只不過在上面優化再優化, 盡量避免各種可能避免的搜索動作, 或者進行時間限制等等. 如果你同時用1000個機器人, 每個機器人抱一本辭海亂序去搜, 論壇一定會翹翹.
vbb一直讓中文用戶不滿意的地方也是搜索. 以至于有人專門為vbb開發了一個中文搜索插件. 這我沒有仔細研究過, 如果里面已經有做初步的中文分詞, 那么我們可以借鑒過來用在phpbb上.
其他的論壇沒有接觸過, 沒有發言權.
如果大家有興趣, 可以去研究一下搜索算法, 分詞算法, 這些資料文檔在google上可以找到很多. 如果有PHP方面的中文分詞開源軟體, 也不妨推薦一下, 說不定就能做成一個中文搜索的MOD
嘿嘿...
我發現一個可以讓論壇死當的可能方法了... (完美計劃)
不過要是論壇掛了...
我晚上會很無聊...
還是不要玩好了...
Re: 搜尋功能
發表於 : 週一 1月 28, 2008 10:32 pm
由 desktop
對了,兩次搜尋的最小間隔時間還沒設限,搜尋還蠻浪費CPU時間的
Re: 搜尋功能
發表於 : 週二 1月 29, 2008 12:50 am
由 董事008
desktop 寫:對了,兩次搜尋的最小間隔時間還沒設限,搜尋還蠻浪費CPU時間的
感謝desktop大哥的提醒
謝謝您 (三八萌)
Re: 搜尋功能
發表於 : 週二 2月 05, 2008 7:19 pm
由 鳴人
奇怪?現在2008-02-05 PM19:20,搜尋系統不能用了?
Re: 搜尋功能
發表於 : 週二 2月 05, 2008 7:30 pm
由 董事008
鳴人 寫:奇怪?現在2008-02-05 PM19:20,搜尋系統不能用了?
因為MK老大說已經知道怎樣要”攻擊”我們的論壇 (冷吱吱)
Desktop老大提醒我們要限制連續的搜尋,我們已經限制密集連續的搜尋
所以,我猜鳴人老大您太密集搜尋了,所以,系統就不給您服務囉
間隔一下時間就OK了啦
Re: 搜尋功能
發表於 : 週二 2月 05, 2008 8:44 pm
由 鳴人
喔...我知道了,謝謝啦!
Re: 搜尋功能
發表於 : 週一 4月 14, 2008 2:00 am
由 小太陽
http://forum.doctorvoice.org/search.php ... rds=memory
搜尋功能變精準了
(水草舞) (水草舞) (水草舞)
謝謝園丁辛勞
memory
Midnight, not a sound from the pavement
Has the moon lost her memory
She is smiling alone
In the lamplight
The withered leaves collect at my feet
And the wind begins to moan
Memory, all alone in the moonlight
I can smile at the old days
It was beautiful then
I remember the time I knew what happiness was
Let the memory live again
Every street lamp seems to beat a fatalistic warning
Someone mutters
And the street lamp gutters
And soon it will be morning
Daylight, I must wait for the sunrise
I must think of a new life
And I mustn't give in
When the dawn comes
Tonight will be a memory, too
And a new day will begin
Burnt out ends of smoky days
The stale, cold smell of morning
The street lamp dies
Another night is over
Another day is dawning
Touch me, it's so easy to leave me
All alone with the memory of my days in the sun
If you touch me
You'll understand what happiness is
Look! A new day has begun
看啊!新的一天已經開始
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 11:21 am
由 superdog
請教各位老大;中文搜尋 OK 嗎 ?
小弟在查<"蝦紅素”>或<蝦紅素>時會找到12筆,都只是含:蝦:
小弟在查<"花青素”>或<花青素>時會找到102筆,沒看完,看到的都不含:花青素.
是中文搜尋在論壇內不能用,還是只有小弟的系統哩? 會員控制台應該沒什麼特殊設定.
現在是用 Google 關鍵字 + doctorvoice ,就是不知道花園內查不查得到. 感恩!
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 12:14 pm
由 小紅
superdog 寫:請教各位老大;中文搜尋 OK 嗎 ?
小弟在查<"蝦紅素”>或<蝦紅素>時會找到12筆,都只是含:蝦:
小弟在查<"花青素”>或<花青素>時會找到102筆,沒看完,看到的都不含:花青素.
是中文搜尋在論壇內不能用,還是只有小弟的系統哩? 會員控制台應該沒什麼特殊設定.
現在是用 Google 關鍵字 + doctorvoice ,就是不知道花園內查不查得到. 感恩!
報告大大
只有您提到 "花青素"
http://forum.doctorvoice.org/search.php ... C%E5%B0%8B
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 12:16 pm
由 小紅
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 6:37 pm
由 superdog
小紅 寫:..只有您提到 "花青素"
....
大大不敢當 !
抱歉沒說清楚, 就是: 明明沒有的關鍵字, 也跑出 12 or 120篇. 不管有沒有加上 <"">.
不是應該找到"0篇" ?
另外, 小紅大您的 " +論人歸戶+ " 我待會再玩玩 "+"號用法.
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 6:58 pm
由 董事008
phpbb論壇的中文搜尋功能並不是很好,但是堪用。
搜尋的方式是以”字”搜尋,而非”詞”;因此,論人歸戶是把所有文章內容裡有”論”、”人”、”歸”、”戶”這四個字的都抓出來,當然”論人歸戶”也會被搜尋到。
但是,有些字太常用的,就會被排除,譬如”人”或”的”,我們設定只要出現頻率超過30%的,一律忽略,不然的話,每一篇都會中獎,就失去了搜尋的意義了。
請注意,可以在搜尋的結果中作進一步的搜尋,如箭頭處可以繼續鍵入關鍵字作搜尋。
有些論壇使用內建的google搜尋引擎,曾經想嘗試,但是,因為擔心花園會不會因此大門洞開,所以把想法吞回去了。
Re: 搜尋功能
發表於 : 週三 7月 23, 2008 9:01 pm
由 superdog
我先承認 : 剛剛才看清楚 搜尋版面左邊小字體有關 "+" "|" "*" 的說明 ..
感謝各位解說, 所以. 如果 搜尋關鍵字有找到--> 搜尋結果畫面有黃色反白顯示
如果沒有黃色反白, 即使 102篇也沒有.
不開放 Google 是好的啦