嗯.. 很抱歉這篇文章寫得短短的,
在這篇裡面,我只提跟自己專題相關的事件與文章,
是對第一篇的想法的實做驗證;
文中放了一些相關的連結,方便大家點閱。
那麼,就請繼續閱讀吧。
筆者在前面提到了,人們有意無意放上網路的資料,一旦被機器索引起來之後可能產生的「資訊滲透壓」。
在 2006 年底,當時筆者只是為了好玩,想要知道「要經過多少人,才會碰到我認識的人」,與「兩個我認識,但在不同生活圈的人之間,是不是有什麼連線關係」,而開始著手進行程式的撰寫,起初只是很單純的抓出好友清單,轉換成方便瀏覽的網頁以方便點閱,但不久後便發現反向連結可能可以提供更多資訊,進而加入了資料庫,並做出了簡單的反向連結功能;在 2007 年的 HappyWeb4 中,第一次與網路先進們做了簡單的討論*1。
隨著資料量增加,筆者發現了隱私滲透的現象 (在此筆者定義的「隱私資料」是指「能以此識別某人的資料」),並實做了簡單的排序系統,以 IR 常用的演算法對描述句進行了排序;意即,越相關的資訊將會被提到清單的上層,最後的輸出如圖所示。
而在資料蒐集期間,剛好遇上了無名小站發生了相簿外流事件,及星光幫相關的新聞事件,而既存在網路上的網路描述,看得到的資訊有時多於新聞,筆者就此與幾位先進討論*2。在 2007 年的駭客年會上,XDite 探討了這個議題*3,而陳存暘先生在駭客年會後,為此議題做了較深入的研究與統計*4,筆者節錄摘要中敘述:「..在我們蒐集到的樣本中,有30% 使用者的全名以及 72% 使用者的名字(不包括姓)可以從本篇論文所提出的演算法推測而得..」,種種的跡象顯示這股滲透壓正慢慢成型;也就是說,生活在網路時代的我們,在某種程度上是不具隱私的。
未經處理的資訊能有多大的壓力,滲透出來的資料又有多精確,或許到現在還未有定論,但可以確定的是,在不久的將來,以「人際網路」為對象的搜尋引擎將會出現*5;該如何適切地描述他人,又該如何確保自己的隱私資料,將是未來服務提供者與網路使用者必須研究琢磨的課題之一。
那麼,這篇讓我寫到失眠又頭痛的正經文章,就到這裡結束了。
感謝在 HappyWeb 中認識的獨孤木、Qing、XDite,
及中研院多媒體網路與系統研究室的陳存暘先生 :)
*1 相關網頁:
獨孤木: HappyWeb
*2 相關網頁:
Qing: 網路是人類集體的記憶
XDite: 從無名好友到樂多好友,它們都能拿來看朋友?
*3 相關網頁:
iThome: 台灣駭客年會 (「網站資訊全都露」段落)
*4 相關網頁:
無名小站中真實姓名洩露的危機
*5 事實上,已經有這樣的搜尋引擎了: Paterva Maltego
在〈Web 2.0 時代的隱私滲透現象 (2)〉中有 1 則留言
[…] 接著又過了一段不長不短的懶得動期間, 等到想到的時候,又試著加了一些東西上去, 用了比較簡單的方式實做 ranking,結果類似這篇的截圖。 […]