對付垃圾郵件新武器:貓狗模式識別

【大紀元6月17日訊】(大紀元記者翁玲綜合編譯報導)Captcha是英文Completely Automated Public Turing Test to Tell Computers and Humans Apart(完全自動杜林測試以區分電腦和人類)的字母縮寫,它指的是由一串扭曲的單字和數字所組成的網路測試謎題,許多在網絡購物、登陸網站、申請帳號等情形中都會踫到。它於2000被卡內基美隆大學(Carnegie Mellon University)學者們創造出來,主要是用來辨識電腦使用者是否為人類。

因為電腦軟體不易辨識Captcha,而人類易於讀出Captcha並重新打上,因此大部份網際網路公司利用Captcha來防止發垃圾郵件自動電腦程式的入侵。為了方便視障人士的使用,業者甚至開發音響裝置,電腦直接朗誦一串單字和數字來進行測試。

然而,當線上淘氣的製造者設計更好的方式來擊敗Captcha,網路公司以加深謎題難度來回應。他們把字母變形,背景扭曲,加入令人困惑的萬花筒顏色,有時連人類都很難辨識這些Captcha。

戈登‧韋克利姆(Gordon Weakliem),一位電腦程式兼部落格設計師說:「他們設計的測試連健康的成人都沒辦法通過。」貝寶(PayPal,eBay集團分支)的資訊安全總監,邁可‧巴瑞特(Michael Barrett)表示:「你絕對可以設計出電腦無法辨識的Captcha,但在另一方面,卻讓人類可辨識的測試變成智力測驗。」

25歲的阿力克斯‧克魯佩浮(Aleksey Kolupaev)在烏克蘭基輔一家網路公司工作,他與朋友利用週末時間開發與銷售可破解captcha的軟體,每個專案依captcha難度索價100到5000美元。克魯佩浮表示,每個系統都有它的弱點,沒有無法解破的captcha,他甚至在他的網站(ocr-research.org.ua)替各種captcha效率排名。

網路公司設計更加複雜的captcha來回應。以YouTube 為例,captcha的字母和數字浮動在崎嶇的彩色網格上。在Slashdot網站上,利用隨機彎曲的線橫越字母與數字。這些設計主要為了掩飾字元的邊界,讓軟體無法辨識。然而,captcha的複雜性使人類都很難破解。雅各‧漢森(Jacob Hanson),鹽湖城一家職業介紹所的技術總監說,四次嚐試Ticketmaster網站的captcha,就有一次解答錯誤。

因此,大家正努力尋找對人類容易但對電腦困難的謎題。許多研究者將重心放在26位字母與 9個數字以外的測試。微軟開發另類的captcha,要求網路使用者先看九張寵物照片,然後選出貓或是狗。微軟研究員約翰‧杜瑟荷說:「對軟體是相當困難的。電腦會因各種角度,不同光線、背景和各種不同姿勢的動物照片造成誤判。」

此計劃稱為 Asirra(Animal Species Image Recognition for Restricting Access,限制進入之動物影像辨識),所使用的動物照片來自一個替無家可歸寵物尋找家庭的網站(Petfinder.com),它的資料庫中有超過200萬張影像。貝寶公司巴瑞特表示,新的captcha可能類似簡單的影像識別謎題,例如要求使用者先看萵苣、樹、鯨魚的照片,之後選出蔬菜。他說:「Captchas越變越好,它們可能慢慢會被另一種技術取代,卻達到一樣的效果。」

並非每個人都認為傳統captcha時代結束了。卡內基美隆大學教授,同時也是發明captcha團隊的成員之一,路易斯‧豐安( Luis von Ahn)最近發表一項新成果「ReCaptcha」,除了協助減少垃圾郵件,同時讓使用者將圖書數位化。

豐安的計劃是把軟體無法辨識的那些掃瞄書中的單字,例如頁面泛黃或是字母有污點等變成captcha當中的一部份。當這些謎題被解破後,回饋到這本書的數位拷貝中。他說:「聽說全球每天有6000萬個captcha被解破,起先讓我自鳴得意,但隨後卻很悲傷。一個captcha需要10秒解決,這表示全人類花了數千小時解開它們。我寧願用那些時間替全人類做有意義的事。」
(http://www.dajiyuan.com)

相關新聞
黑莓手機知多少 分享兩個使用絕招
新一代網絡"世界射線" 互聯網概念大變革
新型互聯網2010年問世
港法輪功受迫害案例成研討會話題
如果您有新聞線索或資料給大紀元,請進入安全投稿爆料平台
評論