香港新浪網 MySinaBlog
軒爸 | 15th May 2007 | Blog 事 | (1250 Reads)
那些「博駁博」 難題真的很難, 難到想逃避. 逃避有一個辨法, 就是把範圍縮小, 小至一個BSP - Mysinablog. 如此, 那三個難題就暫不用回答, 因為, 只要看見Domain是mysinablog.com, 抓取就行了, 不必在乎它是不是blog, 是不是繁體字, 是不是香港Blog. 因為他們肯定都是.

 (閱讀全文)

軒爸 | 9th May 2007 | Blog 事 | (1128 Reads)
好了, Google Blog Search雖不濟事, 但Google的Search Engine仍是最強的. 他們的強, 主要是靠無敵的電腦叢集運算. 但「無氈無扇, 神仙難變」, 任Google的運算力再強, 沒有龐大的網頁資料來源, 也得物無所用.

可是, 網頁來源從何而來呢? Google(或其他大型Search Engine)的網頁來源主要是靠一個人在電腦面前按連結. 他先由一個網頁開始, 把該網頁存檔, 然後從該網頁中的其他連結, 找出其他網頁. 最後, 一連十, 十連百, 整個互聯網, 就這樣被揪出來了.

當然, 上面提到的那位人兄, 不是真的是一個人, 而是一個機械人(即Robot, 或簡稱bot, 又或網絡蜘蛛Web-Spider, 又或網絡爬虫Web-Crawler). 如果那真的一個人的話, 無論他如何做好呢份工, 網海之大, 夠他做幾生幾世了.

話說回來. Blog本來就是網頁, 而在未有BSP, 只有公海的年代, 不靠Blogroll/留言, 是無法給人找上門的. 那些Blog, 是公海中斷六親的孤島. 換言之, 在那個時候的Blogosphere裡, 肯定是博博相連的. 所以, 若以Robot抓取的話, 一定能把所有Blog都找回來. 此方法, 我暫戲稱為「博駁博」吧. 雖然到了今時今日, BSP大行其道, 有推介有排行榜, 但blogosphere的基本生態還是得靠連結來維持的.

 (閱讀全文)

軒爸 | 7th May 2007 | Blog 事 | (1184 Reads)
好了, 上回靠估, 今回靠搵. 我試用Search Engine找答案.

Google的Fans都知道, Google甚麼千奇百怪的application也有. 關於blog的, 有兩個. 一個叫Blogger(blogger.com / blogspot.com), 另一個叫Google Blog Search.

我 用的方法如下. 首先, 假設Google Blog Search是涵括了所有blog. 再假設沒有blog是不用「的」字的. 若假設都成立, 我以「的」去Search, 我想應該可以把所有blog找出來. 在開始之前, 先要注意一點, 就是Google Blog Search的選擇範圍, 只能以語言區分, 不能以地區區分. 所以, 無論最終「搜」到甚麼結果, 我們並不能靠Google Blog Search來分辨香港或台灣Blog. 不過, 這是後話, 先試驗一下再說.

 (閱讀全文)

軒爸 | 2nd May 2007 | Blog 事 | (1674 Reads)
「香港的Blogosphere有多大?」
一個非常簡單的問題, 答案卻並不易找.

在Blogosphere裡, 討論Blog影響力的文章, 俯拾皆是.
奇怪是, 在討論之前, 我們從來都弄不清楚Blogosphere究竟有多大.
不清楚有多大, 就不知力量有多少, 更惶論影響力.

再者, 也有說, 現今Blog的發展到了一個樽頸位置.
我覺得其中一個原因, 就是沒有把這個問題弄清楚.
所以, 我好想把這個問題解決掉.

到底, 「香港的Blogosphere有多大?」

 (閱讀全文)


Google 廣告
最新留言
網誌統計
文章總數:45
留言總數:300
引用總數:14
閱讀總數:247243
總瀏覽數:383920
MySinaBlog 精選文章