Web 2.0 時代的隱私滲透現象 (2)

嗯.. 很抱歉這篇文章寫得短短的，
在這篇裡面，我只提跟自己專題相關的事件與文章，
是對第一篇的想法的實做驗證；
文中放了一些相關的連結，方便大家點閱。

那麼，就請繼續閱讀吧。

筆者在前面提到了，人們有意無意放上網路的資料，一旦被機器索引起來之後可能產生的「資訊滲透壓」。

在 2006 年底，當時筆者只是為了好玩，想要知道「要經過多少人，才會碰到我認識的人」，與「兩個我認識，但在不同生活圈的人之間，是不是有什麼連線關係」，而開始著手進行程式的撰寫，起初只是很單純的抓出好友清單，轉換成方便瀏覽的網頁以方便點閱，但不久後便發現反向連結可能可以提供更多資訊，進而加入了資料庫，並做出了簡單的反向連結功能；在 2007 年的 HappyWeb4 中，第一次與網路先進們做了簡單的討論^*1。

隨著資料量增加，筆者發現了隱私滲透的現象 (在此筆者定義的「隱私資料」是指「能以此識別某人的資料」)，並實做了簡單的排序系統，以 IR 常用的演算法對描述句進行了排序；意即，越相關的資訊將會被提到清單的上層，最後的輸出如圖所示。

[▲ 這張圖對象是誰就請不要追究了，總之是個存在的人]

[▲ 對於名人，這樣的描述或許就較不具可信度了]

而在資料蒐集期間，剛好遇上了無名小站發生了相簿外流事件，及星光幫相關的新聞事件，而既存在網路上的網路描述，看得到的資訊有時多於新聞，筆者就此與幾位先進討論^*2。在 2007 年的駭客年會上，XDite 探討了這個議題^*3，而陳存暘先生在駭客年會後，為此議題做了較深入的研究與統計^*4，筆者節錄摘要中敘述：「..在我們蒐集到的樣本中，有30% 使用者的全名以及 72% 使用者的名字（不包括姓）可以從本篇論文所提出的演算法推測而得..」，種種的跡象顯示這股滲透壓正慢慢成型；也就是說，生活在網路時代的我們，在某種程度上是不具隱私的。

未經處理的資訊能有多大的壓力，滲透出來的資料又有多精確，或許到現在還未有定論，但可以確定的是，在不久的將來，以「人際網路」為對象的搜尋引擎將會出現^*5；該如何適切地描述他人，又該如何確保自己的隱私資料，將是未來服務提供者與網路使用者必須研究琢磨的課題之一。

那麼，這篇讓我寫到失眠又頭痛的正經文章，就到這裡結束了。

感謝在 HappyWeb 中認識的獨孤木、Qing、XDite，
及中研院多媒體網路與系統研究室的陳存暘先生 :)

*1 相關網頁:
獨孤木: HappyWeb

*3 相關網頁:
iThome: 台灣駭客年會 (「網站資訊全都露」段落)

*4 相關網頁:
無名小站中真實姓名洩露的危機

*5 事實上，已經有這樣的搜尋引擎了: Paterva Maltego

在〈Web 2.0 時代的隱私滲透現象 (2)〉中有 1 則留言

發表迴響取消回覆