[ Tech Doc 技術文章 ] [ Contact Us 連絡我們 ] [ 關於工廠 ] [ Home 回首頁 ]

談垃圾信件的防堵技術 - 廠長

       垃圾郵件問題,到目前為止都還沒有一個好的解決方法,其問題的癥結點在於 - 不確定性。我們沒有辦法把垃圾郵件的判別原則說的很清楚,原因是垃圾郵件的判別特徵並不精確,這樣的不確定性與病毒有點相似,但也不同。雖然病毒可能也會以各種型式出現,但是它的特徵卻很明顯,例如 : 某些病毒會去修改 registry,我們便可以用會去修改特定 registry 為特徵,就可以抓到這個病毒,並且正常的程式不會去修改這個 registry,所以不會有太大的問題。而垃圾郵件呢﹖我們只能用信件上面的特定關鍵字作為特徵去判斷,但問題是,這些特定關鍵字可能出現在垃圾郵件中,也可能出現在正常的郵件中。舉個例子,如果我們用 Viagra 做為關鍵字,想必可以抓出許多賣威爾鋼的垃圾信,但如果假設一個狀況,藥局要跟廠商進貨,就在信件中寫 「Viagra 進貨一盒」,結果當場發生誤判。

        從這樣的情形看來,判斷垃圾郵件傾向用機率的方法來判斷,廣範被使用的就是貝式定理,我們沒有辦法 100% 的確定一封信是否是垃圾郵件,我們只能說這封信傾向垃圾信的機率是多少,如果機率很高或者超過一半,我們就判斷為垃圾郵件,這是垃圾郵件防制的基本原理。因此,防堵垃圾郵件的軟體或是硬體,應該都須要一段學習的時間。我有時很擔心某些防垃圾郵件的軟體,它們將產品包裝的很像完全不須要修正就可以 100% 命中,開玩笑的說如果我把所有的信件都丟到垃圾筒,我的辨識率不就是 100% 嗎﹖。郵件既然不能 100% 肯定為垃圾郵件,就不應該去刪除任何一封郵件,許多軟體或硬體,都也犯了這個毛病。但是如果不刪除任何一封信所有的信都還是收到,這樣不就還是回到原點,關於這點,我認為最完美的方式是 Mail client 配合 Mail server 一起工作的解決方案,有一些 Mail Server 上的解決方法,是將垃圾郵件改變主旨,讓收信的軟體能夠自己建立規則去處理這些信件,這是很正確的方法。

        市面上占有不小比例的反廣告信軟體,並不完全用自動學習為基礎,他們傾向先用手動建立 Keyword Database,然後用類似 try and error 的方法,去實驗這些預設的 Keyword ,然後系統開始用這些 Keyword 去計算權重進而去判斷垃圾郵件。這樣的系統 Keyword 是手動的,並且需要一位工程師,不斷的去調整參數或 Keyword ,這種方法我並不喜歡。Keyword 其實是不容易定訂的,這是這個方法最大的缺點。我們應該建立一種能全自動回饋學習的系統,而不是手動的系統。

        如果垃圾郵件不採取刪除的方法,那麼所謂垃圾郵件在網路上的資源浪費應該怎麼去解決,我認為我們不該把這樣的資源視為浪費,因為垃圾郵件的行為仍是網路的行為之一,舉個例子來看這個論點,假設我們的郵局,被利用來寄送許多廣告郵件,而且廣告郵件的數量可能大於正常郵件,我們會說應該阻止這個資源浪費的行為嗎﹖我想不會。我們會認為這是郵政系統服務中的一部份,因為郵政系統是要處理任何信件的系統。所以網路上垃圾郵件,應該也視為網路的資源之一,他們的行為應該是合理的。如果真的要以資源的問題來討論的話,我認為應該以資訊安全的角度來看,瞬間大量的信件發送,應該屬於一種攻擊的行為,這樣的行為可以被偵測且被阻止,這才是我們應該探討的問題。

        垃圾郵件的解決仍需要許多時間,才能找到較好的解決方法,許多專家學者也都在這個問題上面努力著,而也許這個問題,會如同病毒問題般的永遠存在,這樣的情形下,就會產生了垃圾郵件的市場,也會有專門協助處理這個問題的組織或公司陸續誕生,對一般使用者來說,這都是好的,有了更多的專家加入這個問題的解決,就能讓我們困擾的問題得到改善。

對本篇文章有任何看法 Mail Me

 

 
 
 

softworking.com 2005