July 6, 2007
[前言]通常許多事物的關係有三種方面, 一個是內容,
一個是使用狀態, 一個是地位與交互.
*1
最近除了部落格觀察外, 有兩個計劃同時進行,
一個是 hook, 一個是 door, 而事實上我真正想執行
的是 moon, 一個幫人記錄, 觀察, 分析, 預測, 建
議行為狀態與週期的事情.
但先來說 door 的計劃好了, 這是一個關鍵字分
析計劃, 雖然主體架構出來了, 但排行榜完全不能看,
主要是關聯性的字詞太多了, 例如星光幫的寫法有數
十種, 但概念上只有幾個, 只是因為量大結果前 20
名說不定有 15 個都是星光幫, 此時排行就失效了.
所以一定要經過某種整併的動作才會產生有意義
的內容與排行, 此時就要祭起類似 Semantic Web 語
意網路的建構計劃了, 而在此時目的是為了整併關鍵
字, 因此概念上只有以關係度做為依據.
10 相同的字意與字面, 只是因為拼錯, 空白, 破音,
等等的關係產生差別
如: 游錫? 與 游錫方方土
9 完全相同的字意, 通常是因為縮寫, 翻譯的不同,
所產生的差異
如: 交大 與 交通大學
8 概念上相同, 只是再次強調與精確, 或者是加入
前後字詞強調其概念
如: youtube 與 youtube網站
7 概念類似, 但經過放大與縮小集合的概念
如: MSN 與 MSN下載
6 概念上有相當的重合, 但事實上是不同的字意,
或者有隸屬或延伸的關係
如: 蕭敬騰 與 蕭敬騰mp3
5 集合上的關係
如: 星光幫 與 楊宗緯
4 兩個字詞隸屬於一個更大的一層關係的相同集合
如: 花蓮 與 台東
3 兩個字詞因為其子集合交集在一起
如: 美國地圖 與 大阪地圖
2 兩個字詞講的是同一個方向的事情
如: 蘇花高 與 交通規劃
1 有交集, 但是兩個不同的集合
如: 統一獅 與 夢工場
0 當然是沒有明顯的關係
這個只是我的定義, 但更希望有人能夠給我方向
或已經有人在這方面已經想過或執行過了, 當然我知
道很多搜尋引擎可能在這方面都有相當的經驗, 但我
也在想如何建立一個公開且可以實用的資料庫.
所以在想這個關係是有下面幾種可能性:
1. 延伸, 可以在還沒有關係之前有某種繼承的概念
2. 回饋, 因為各個字的關係產生新的關係
3. 共筆, 許多人建立自己的觀點來同步
當然這個是三種內容關係的一種, (內容, 使用,
地位), 而更希望有更多的使用與地位的關係能夠更去
讓字詞的關係更精確, 也能夠讓大家所用, 也由大家
來共同建立.
*2
[連結]
1. 林宥嘉/楊宗緯/蕭敬騰 到底有多熱?
http://geneoralspeaking.blogspot.com/2007/06/blog-post_06.html
2. 12項W2O.urs.tw計劃
http://blog.yam.com/genehong/article/6734619
3. 部落格半年經驗與W2O
http://blog.roodo.com/genehong/archives/2210874.html
[TAG]urs.tw, 部落格觀察, Semantic Web,
**********************************************
*1
2007/7/3 下午 02:07:59, 平常常在停的位子標
上從 7/4 到 7/10 要挖馬路, 不知為甚麼會挖這麼
久的時間, 到地下停車場居然也暴滿, 大概是外面在
開單的關係.
*2
2007/7/3 下午 02:48:53, 先寫到這邊了.




















