對付垃圾郵件新武器：貓狗模式識別

更新 2007-06-17 12:42 PM

【大紀元6月17日訊】（大紀元記者翁玲綜合編譯報導）Captcha是英文Completely Automated Public Turing Test to Tell Computers and Humans Apart（完全自動杜林測試以區分電腦和人類）的字母縮寫，它指的是由一串扭曲的單字和數字所組成的網路測試謎題，許多在網絡購物、登陸網站、申請帳號等情形中都會踫到。它於2000被卡內基美隆大學(Carnegie Mellon University)學者們創造出來，主要是用來辨識電腦使用者是否為人類。

因為電腦軟體不易辨識Captcha，而人類易於讀出Captcha並重新打上，因此大部份網際網路公司利用Captcha來防止發垃圾郵件自動電腦程式的入侵。為了方便視障人士的使用，業者甚至開發音響裝置，電腦直接朗誦一串單字和數字來進行測試。

然而，當線上淘氣的製造者設計更好的方式來擊敗Captcha，網路公司以加深謎題難度來回應。他們把字母變形，背景扭曲，加入令人困惑的萬花筒顏色，有時連人類都很難辨識這些Captcha。

戈登‧韋克利姆（Gordon Weakliem），一位電腦程式兼部落格設計師說：「他們設計的測試連健康的成人都沒辦法通過。」貝寶（PayPal，eBay集團分支）的資訊安全總監，邁可‧巴瑞特（Michael Barrett）表示：「你絕對可以設計出電腦無法辨識的Captcha，但在另一方面，卻讓人類可辨識的測試變成智力測驗。」

25歲的阿力克斯‧克魯佩浮（Aleksey Kolupaev）在烏克蘭基輔一家網路公司工作，他與朋友利用週末時間開發與銷售可破解captcha的軟體，每個專案依captcha難度索價100到5000美元。克魯佩浮表示，每個系統都有它的弱點，沒有無法解破的captcha，他甚至在他的網站（ocr-research.org.ua）替各種captcha效率排名。

網路公司設計更加複雜的captcha來回應。以YouTube 為例，captcha的字母和數字浮動在崎嶇的彩色網格上。在Slashdot網站上，利用隨機彎曲的線橫越字母與數字。這些設計主要為了掩飾字元的邊界，讓軟體無法辨識。然而，captcha的複雜性使人類都很難破解。雅各‧漢森（Jacob Hanson），鹽湖城一家職業介紹所的技術總監說，四次嚐試Ticketmaster網站的captcha，就有一次解答錯誤。

因此，大家正努力尋找對人類容易但對電腦困難的謎題。許多研究者將重心放在26位字母與 9個數字以外的測試。微軟開發另類的captcha，要求網路使用者先看九張寵物照片，然後選出貓或是狗。微軟研究員約翰‧杜瑟荷說：「對軟體是相當困難的。電腦會因各種角度，不同光線、背景和各種不同姿勢的動物照片造成誤判。」

此計劃稱為 Asirra（Animal Species Image Recognition for Restricting Access，限制進入之動物影像辨識），所使用的動物照片來自一個替無家可歸寵物尋找家庭的網站（Petfinder.com），它的資料庫中有超過200萬張影像。貝寶公司巴瑞特表示，新的captcha可能類似簡單的影像識別謎題，例如要求使用者先看萵苣、樹、鯨魚的照片，之後選出蔬菜。他說：「Captchas越變越好，它們可能慢慢會被另一種技術取代，卻達到一樣的效果。」

並非每個人都認為傳統captcha時代結束了。卡內基美隆大學教授，同時也是發明captcha團隊的成員之一，路易斯‧豐安（ Luis von Ahn）最近發表一項新成果「ReCaptcha」，除了協助減少垃圾郵件，同時讓使用者將圖書數位化。

豐安的計劃是把軟體無法辨識的那些掃瞄書中的單字，例如頁面泛黃或是字母有污點等變成captcha當中的一部份。當這些謎題被解破後，回饋到這本書的數位拷貝中。他說：「聽說全球每天有6000萬個captcha被解破，起先讓我自鳴得意，但隨後卻很悲傷。一個captcha需要10秒解決，這表示全人類花了數千小時解開它們。我寧願用那些時間替全人類做有意義的事。」
(http://www.dajiyuan.com)