搜尋功能

對本論壇的各項批評、建議與指教都歡迎提出,我們必定虛心檢討改進。論壇使用問題可以在此提出。
回覆文章
小太陽
R1
R1
文章: 155
註冊時間: 週一 12月 17, 2007 5:24 pm

搜尋功能

文章 小太陽 »

(催眠) (催眠) (催眠)

論壇更版後 . 我都不知道如何搜尋
要怎樣下條件. 字才不會拆開呢

(鼻青臉腫) (鼻青臉腫) (倒地)
訪客C
訪客

Re: 搜尋功能

文章 訪客C »

有沒有大大可以解決這個問題?
(想入非非)
頭像
tomi
R3
R3
文章: 360
註冊時間: 週日 10月 14, 2007 1:45 pm
來自: 打狗城

Re: 搜尋功能

文章 tomi »

這真是一個大問題....希望能快快改善~!! (眼汪汪)
董事008
訪客

Re: 搜尋功能

文章 董事008 »

使用關鍵字再加上發表人的話,可以更精確地搜尋出您要的文章。
論壇的搜尋功能確實不是非常裡想,如果有更好的解決辦法,我們會採用,也請會員能夠提供相關資訊。
不過,索引重建很費時喔,第一次就花了將近9個小時的時間 (印堂發黑)
董事008
訪客

Re: 搜尋功能

文章 董事008 »

這是竹貓上面一篇關於搜尋的討論,有興趣的人可以參考一下 (微笑)

http://phpbb-tw.net/phpbb/posting.php?m ... 6&p=259302
michaelchain 寫:以前的做法搜索什么語言都沒問題, 但是對資源消耗太大, 才出現今天的 分詞+索引 方式.
這種方式能極大的降低搜索的時間復雜度. 將搜索時產生的時間消耗轉移到匯入資料階段. 因此使用這種方式的搜索模組都會帶一個很大的索引庫(算法不好的話可能比你的資料還大). 也許對一些空間很小但是cpu很快的人有點不方便. 但這是科技的方向..

中文搜索一向是一個難題. 首先中文的分詞就有很多學問, 微軟亞洲研究院還專門成立一個group研究自然語言, 其中研究最多的就是語言的分詞, 因為這對于語音合成/識別非常重要. 但是中文這么高深的東西, 雖然現在有很多理論, 但是最好的成績也就是97~98%, 100%是做不到的, 因為還有不少必須結合語境才能進行分詞的情況.
每個中文搜索引擎都有自己的一套分詞算法, 這是核心技術之一. 在這方面百度一直比google好一點.

話題回到phpbb上來. 因為phpbb并不是特別為中文開發的軟體, 所以并不帶分詞算法, 對于中文來講, phpbb實際上就是將搜索詞分成一串漢字, 每個漢字作為一個單詞存在索引中, 閾值就是避免檢索出現過于頻繁的字. 如果閾值設為30%, 那么如果你的數據庫中所有文章包含了10,000個漢字, 而"的"字出現了3,001次, 重建索引后這個"的"字就會被從檢索條目中刪掉.

再來看看其他論壇軟體的搜索做法.
DZ我比較清楚, 版本5.5也還在用那種老土的%xx%方式來搜索, 只不過在上面優化再優化, 盡量避免各種可能避免的搜索動作, 或者進行時間限制等等. 如果你同時用1000個機器人, 每個機器人抱一本辭海亂序去搜, 論壇一定會翹翹.

vbb一直讓中文用戶不滿意的地方也是搜索. 以至于有人專門為vbb開發了一個中文搜索插件. 這我沒有仔細研究過, 如果里面已經有做初步的中文分詞, 那么我們可以借鑒過來用在phpbb上.

其他的論壇沒有接觸過, 沒有發言權.

如果大家有興趣, 可以去研究一下搜索算法, 分詞算法, 這些資料文檔在google上可以找到很多. 如果有PHP方面的中文分詞開源軟體, 也不妨推薦一下, 說不定就能做成一個中文搜索的MOD
頭像
MK
院長級
院長級
文章: 21966
註冊時間: 週三 9月 26, 2007 1:47 pm
來自: HPLP部
擁有感謝: 1 次

Re: 搜尋功能

文章 MK »

園丁008 寫:這是竹貓上面一篇關於搜尋的討論,有興趣的人可以參考一下 (微笑)

http://phpbb-tw.net/phpbb/posting.php?m ... 6&p=259302
michaelchain 寫:以前的做法搜索什么語言都沒問題, 但是對資源消耗太大, 才出現今天的 分詞+索引 方式.
這種方式能極大的降低搜索的時間復雜度. 將搜索時產生的時間消耗轉移到匯入資料階段. 因此使用這種方式的搜索模組都會帶一個很大的索引庫(算法不好的話可能比你的資料還大). 也許對一些空間很小但是cpu很快的人有點不方便. 但這是科技的方向..

中文搜索一向是一個難題. 首先中文的分詞就有很多學問, 微軟亞洲研究院還專門成立一個group研究自然語言, 其中研究最多的就是語言的分詞, 因為這對于語音合成/識別非常重要. 但是中文這么高深的東西, 雖然現在有很多理論, 但是最好的成績也就是97~98%, 100%是做不到的, 因為還有不少必須結合語境才能進行分詞的情況.
每個中文搜索引擎都有自己的一套分詞算法, 這是核心技術之一. 在這方面百度一直比google好一點.

話題回到phpbb上來. 因為phpbb并不是特別為中文開發的軟體, 所以并不帶分詞算法, 對于中文來講, phpbb實際上就是將搜索詞分成一串漢字, 每個漢字作為一個單詞存在索引中, 閾值就是避免檢索出現過于頻繁的字. 如果閾值設為30%, 那么如果你的數據庫中所有文章包含了10,000個漢字, 而"的"字出現了3,001次, 重建索引后這個"的"字就會被從檢索條目中刪掉.

再來看看其他論壇軟體的搜索做法.
DZ我比較清楚, 版本5.5也還在用那種老土的%xx%方式來搜索, 只不過在上面優化再優化, 盡量避免各種可能避免的搜索動作, 或者進行時間限制等等. 如果你同時用1000個機器人, 每個機器人抱一本辭海亂序去搜, 論壇一定會翹翹.

vbb一直讓中文用戶不滿意的地方也是搜索. 以至于有人專門為vbb開發了一個中文搜索插件. 這我沒有仔細研究過, 如果里面已經有做初步的中文分詞, 那么我們可以借鑒過來用在phpbb上.

其他的論壇沒有接觸過, 沒有發言權.

如果大家有興趣, 可以去研究一下搜索算法, 分詞算法, 這些資料文檔在google上可以找到很多. 如果有PHP方面的中文分詞開源軟體, 也不妨推薦一下, 說不定就能做成一個中文搜索的MOD
嘿嘿...

我發現一個可以讓論壇死當的可能方法了... (完美計劃)

不過要是論壇掛了...

我晚上會很無聊...

還是不要玩好了...
desktop
榮譽院長級
榮譽院長級
文章: 31718
註冊時間: 週一 11月 20, 2006 5:19 pm
來自: 歡婆鄉

Re: 搜尋功能

文章 desktop »

對了,兩次搜尋的最小間隔時間還沒設限,搜尋還蠻浪費CPU時間的
台灣是個寶島
董事008
訪客

Re: 搜尋功能

文章 董事008 »

desktop 寫:對了,兩次搜尋的最小間隔時間還沒設限,搜尋還蠻浪費CPU時間的
感謝desktop大哥的提醒

謝謝您 (三八萌)
頭像
鳴人
院長級
院長級
文章: 23366
註冊時間: 週四 1月 11, 2007 10:04 am
來自: 木葉忍者村
擁有感謝: 1 次

Re: 搜尋功能

文章 鳴人 »

奇怪?現在2008-02-05 PM19:20,搜尋系統不能用了?
卡卡西老師說:
果然是意外性第一的忍者啊!
董事008
訪客

Re: 搜尋功能

文章 董事008 »

鳴人 寫:奇怪?現在2008-02-05 PM19:20,搜尋系統不能用了?
因為MK老大說已經知道怎樣要”攻擊”我們的論壇 (冷吱吱)

Desktop老大提醒我們要限制連續的搜尋,我們已經限制密集連續的搜尋

所以,我猜鳴人老大您太密集搜尋了,所以,系統就不給您服務囉

間隔一下時間就OK了啦
頭像
鳴人
院長級
院長級
文章: 23366
註冊時間: 週四 1月 11, 2007 10:04 am
來自: 木葉忍者村
擁有感謝: 1 次

Re: 搜尋功能

文章 鳴人 »

喔...我知道了,謝謝啦!
卡卡西老師說:
果然是意外性第一的忍者啊!
小太陽
R1
R1
文章: 155
註冊時間: 週一 12月 17, 2007 5:24 pm

Re: 搜尋功能

文章 小太陽 »

http://forum.doctorvoice.org/search.php ... rds=memory

搜尋功能變精準了

(水草舞) (水草舞) (水草舞)

謝謝園丁辛勞

memory

Midnight, not a sound from the pavement
Has the moon lost her memory
She is smiling alone
In the lamplight
The withered leaves collect at my feet
And the wind begins to moan

Memory, all alone in the moonlight
I can smile at the old days
It was beautiful then
I remember the time I knew what happiness was
Let the memory live again

Every street lamp seems to beat a fatalistic warning
Someone mutters
And the street lamp gutters
And soon it will be morning

Daylight, I must wait for the sunrise
I must think of a new life
And I mustn't give in
When the dawn comes
Tonight will be a memory, too
And a new day will begin

Burnt out ends of smoky days
The stale, cold smell of morning
The street lamp dies
Another night is over
Another day is dawning

Touch me, it's so easy to leave me
All alone with the memory of my days in the sun
If you touch me
You'll understand what happiness is
Look! A new day has begun

看啊!新的一天已經開始
superdog
部長級
部長級
文章: 7401
註冊時間: 週三 7月 26, 2006 6:55 pm
表達感謝: 7 次

Re: 搜尋功能

文章 superdog »

請教各位老大;中文搜尋 OK 嗎 ?

小弟在查<"蝦紅素”>或<蝦紅素>時會找到12筆,都只是含:蝦:
小弟在查<"花青素”>或<花青素>時會找到102筆,沒看完,看到的都不含:花青素.

是中文搜尋在論壇內不能用,還是只有小弟的系統哩? 會員控制台應該沒什麼特殊設定.

現在是用 Google 關鍵字 + doctorvoice ,就是不知道花園內查不查得到. 感恩!
小紅
CR
CR
文章: 533
註冊時間: 週四 4月 24, 2008 12:27 pm

Re: 搜尋功能

文章 小紅 »

superdog 寫:請教各位老大;中文搜尋 OK 嗎 ?

小弟在查<"蝦紅素”>或<蝦紅素>時會找到12筆,都只是含:蝦:
小弟在查<"花青素”>或<花青素>時會找到102筆,沒看完,看到的都不含:花青素.

是中文搜尋在論壇內不能用,還是只有小弟的系統哩? 會員控制台應該沒什麼特殊設定.

現在是用 Google 關鍵字 + doctorvoice ,就是不知道花園內查不查得到. 感恩!

報告大大

只有您提到 "花青素"

http://forum.doctorvoice.org/search.php ... C%E5%B0%8B
小紅
CR
CR
文章: 533
註冊時間: 週四 4月 24, 2008 12:27 pm

Re: 搜尋功能

文章 小紅 »

露一手給您看

搜尋
+論人歸戶+


http://forum.doctorvoice.org/search.php ... C%E5%B0%8B
superdog
部長級
部長級
文章: 7401
註冊時間: 週三 7月 26, 2006 6:55 pm
表達感謝: 7 次

Re: 搜尋功能

文章 superdog »

小紅 寫:..只有您提到 "花青素"
....
大大不敢當 !
抱歉沒說清楚, 就是: 明明沒有的關鍵字, 也跑出 12 or 120篇. 不管有沒有加上 <"">.
不是應該找到"0篇" ?

另外, 小紅大您的 " +論人歸戶+ " 我待會再玩玩 "+"號用法.
董事008
訪客

Re: 搜尋功能

文章 董事008 »

phpbb論壇的中文搜尋功能並不是很好,但是堪用。

搜尋的方式是以”字”搜尋,而非”詞”;因此,論人歸戶是把所有文章內容裡有”論”、”人”、”歸”、”戶”這四個字的都抓出來,當然”論人歸戶”也會被搜尋到。
但是,有些字太常用的,就會被排除,譬如”人”或”的”,我們設定只要出現頻率超過30%的,一律忽略,不然的話,每一篇都會中獎,就失去了搜尋的意義了。

圖檔

請注意,可以在搜尋的結果中作進一步的搜尋,如箭頭處可以繼續鍵入關鍵字作搜尋。

有些論壇使用內建的google搜尋引擎,曾經想嘗試,但是,因為擔心花園會不會因此大門洞開,所以把想法吞回去了。
superdog
部長級
部長級
文章: 7401
註冊時間: 週三 7月 26, 2006 6:55 pm
表達感謝: 7 次

Re: 搜尋功能

文章 superdog »

我先承認 : 剛剛才看清楚 搜尋版面左邊小字體有關 "+" "|" "*" 的說明 ..

感謝各位解說, 所以. 如果 搜尋關鍵字有找到--> 搜尋結果畫面有黃色反白顯示
如果沒有黃色反白, 即使 102篇也沒有.

不開放 Google 是好的啦
回覆文章

回到「★意見反應與求助」