October 28, 2008
thstarshine
在天空部落發表於09:05:24 |
未分類
新發現-原來搜尋可以這樣用!不可思議的最佳應用:
若圖片看不清楚,請直接點選放大
在這個資訊爆炸,網路文章每日以等比程度暴增的情況下,要用搜尋引擎來尋找自己想要的資料,已經不是那麼容易的事。根據IDC(國際數位資訊)的調查指出,光是2007一整年,全球所產生的資料量就高達255 EB(Exa-byte, 1 EB = 1024 PB, 1 PB = 1024 TB, 1 TB = 1024 GB),估計到了2010年,網路總資料量將會成長到988 EB!
龐大的垃圾資料充斥,導致我們使用Google、Yahoo!等搜尋引擎時,除了要輸入多個關鍵字組合來模擬自己真正的需求,多半也只會瀏覽搜尋結果的前幾頁。然而因為搜尋的精確度無法有效提昇,使得許多「搜尋資料」的時間,都被浪費在「過濾資料」這個行為上。
換個角度想,既然網路工具無法幫我們作有效的訊息過濾,那若是我們自己來作呢?假設平日已經有了一個自己信賴、資料量又豐富的專業網站,也許我們要搜尋相關資料時,便可以直接利用該網站的站內搜尋,來獲得自己想要的訊息。但這樣子的作法又嫌太不彈性,如果網站沒有搜尋功能怎麼辦?如果我們有五、六個想同時搜尋的網站該如何?如果有五、六十個呢?
龍捲風TS 5.0知識檢索系統,就有辦法解決這樣的情況!讓我們在無所不包的網路資訊海中,準確又快速地取得我們想要的資料!
對於喜愛旅遊的人來說,網路上豐富的旅遊筆記與心得,絕對是出遊前必備的參考資料之一,尤其是愛走郊山、古道的朋友,對於《Tony的自然人文旅記》,想必並不陌生。其他諸如《壹蘋果》的旅遊報導、《CTIN台灣旅遊聯盟》、《背包客棧》以及政府的《Taiwan觀光資訊網》,都提供了豐富的旅遊資訊。然而當我們在Google輸入像是「瑞芳」、「南方澳」之類的景點時,跑出來的結果卻可能充斥著漁會、車站、工業區甚至是電影官方宣傳網等等我們不甚感興趣、或是與旅遊主題毫無關聯的網站。此時,利用TS 5.0可以對遠端網頁作索引的強大功能,我們只需分別選擇數個著名的旅遊網站建立索引,之後就可以輕輕鬆鬆地在自家電腦的索引庫中作搜尋,並且準確地得到想要的旅遊資訊了!
用Google搜尋「瑞芳」,發現從第5筆開始都不是我們要的旅遊資料:

如果用TS 5.0搜尋我們先選好的資料庫,搜尋結果全部都是符合需求的網頁:

同樣的道理,我們可以挑選數個專門介紹硬體的網站作索引,這樣搜尋自己想要的產品評比資料時,就不會看到滿坑滿谷的拍賣網頁;對自己喜愛並信任的軟體城網站作索引,就不怕搜尋結果被大陸的惡意連結塞爆;甚至想要對幾個賣場作快速的比價,透過類似的方法也是可以辦到的。
使用Yahoo!、Pchome、燦坤三個網路商家做資料庫索引,可以建構出一個3C商品搜尋器:

強大的進階搜尋功能,還可以用網頁標題來二次過濾索引庫內的資料。舉例來說,現今一般的網路賣場,均會在販售物品頁面的標題上標示出該商品的品名,我們在搜尋特定商品時,只需在標題上輸入關鍵字,就可以避免掉許多無意義的結果。例如:在標題輸入「冰箱」,則我們找到的都會是冰箱的商品頁面,但若是在一般關鍵字輸入,則可能會找到許多包含有「冰箱」宣傳字樣的其他商品頁面。
若是較為注重資料的即時性,也可以使用排程功能,設定索引的自動更新,不論是要每隔一週、一天、一小時,都可以透過簡單的設定迅速完成。讓TS 5.0來負擔檢查與擷取檔案內容的工作,我們只要知道自己「想要什麼資料」就可以了!
使用排程,輕鬆自動更新索引庫:

另外,由於每個索引庫各自獨立,我們得以方便地選擇想要搜尋的範圍,而不用苦惱需要用哪些關鍵字來過濾掉不符合要求的網頁。要找什麼,就選什麼!
那麼,除了強大的遠端網頁索引功能,TS 5.0在本機上可以有什麼厲害的應用呢?
對於研究人員來說,pdf格式的論文散落桌面和其他各資料夾,並不是一件新鮮事,往往研究到一半,想找重要相關的論文來參考,卻找了半天都找不到。TS 5.0可以搜尋doc/docx、xls/xlsx、ppt/pptx以及pdf等檔案的內文,只要輸入關鍵字,需要的檔案立刻就無所遁形!這對於習慣把同一份工作的相關資料到處亂擺的人來說,不啻是一大福音。
同樣的內文搜尋,可以應用到搜尋程式碼/註解,方便程式開發者維護龐大的資料庫或網站程式集。一般使用者則可以利用這個功能來搜尋與朋友的對話紀錄(MSN、GTalk…)、工作筆記、日記等等,也都是不錯的應用。
當然,Google Desktop也有類似的本機搜尋功能,但是在進階搜尋的選擇上,TS 5.0顯然比Google Desktop強大許多,不僅可以針對標題、作者、檔案大小等欄位進行過濾,還可以選擇日期區間。相較之下,Google Desktop的進階搜尋就顯得陽春且不便許多了。當然更不用提TS 5.0還具備了概念延伸詞的貼心功能,甚至可以選擇要搜尋的索引庫,讓搜索本機的資料也更有彈性。
搜尋出來的結果,TS 5.0還可以讓它依照檔案大小、日期等屬性重新排序。「對於數個不同版本文件散亂各處的情形,要如何判別何者才是最後修改的檔案?」相信應該很多人會有這樣的需求。
TS 5.0的進階搜尋,可以過濾標題、檔案大小、和日期區間等許多屬性:

綜合而論,不管是對IT專業人員,或是一般電腦使用者,TS 5.0的搜尋功能都有辦法讓蒐集資料變得更方便且迅速。其實,閱讀資料就已經是件很耗費心神的事情,假如能省去一些搜尋資料的苦工,相信在工作或生活上都能變得更有效率,何樂而不為?若是平日就常常依賴大量(網路)資料的人,一定得要試試看「龍捲風TS 5.0知識檢索系統」。
喜歡的功能:
在搜尋結果後面,會列出與搜尋關鍵字相關度的數字。我覺得這個設計讓使用者看列表時可以一目了然,很清楚地知道這則內容與我要查的字詞有多少關聯。此外,日期、作者、檔案大小等資訊,也標示地相當清楚。
關鍵字在網頁中出現的數目一目了然:

不喜歡的功能:
概念延伸詞的設計我覺得很不錯,但是在同義詞的部份,好像會把中英互譯也直接顯示出來,有時候會產生很多沒有意義的翻譯詞,我覺得比較沒有必要。在同音詞的欄位中,有時候也會出現蠻無關的詞彙,例如輸入「礁溪」會跑出「嬌妻」,我想這部份應該還有改進的空間。
同義詞的中英直譯詞過多:

其他建議:
在測試之後發現,TS 5.0似乎無法搜尋zip Archive內的文件內容。由於不少使用者習慣將大量文件檔壓縮存放,也許可以考慮增加搜尋壓縮檔內文件的功能,應該會更具實用價值。另外也建議支援搜尋JPG等圖檔的EXIF、MP3檔案的TAG、以及php、asp、cpp、html等檔案的內文(不然以現在只能搜尋txt的限制,搜尋程式碼是有點麻煩),相信對多媒體使用漸增的電腦族群及程式設計師都會有所幫助。



