自然語言處理(Natural Language Processing, NLP)的宗旨是讓人能夠以人類的語言與機器溝通,為人工智慧與語言學兩大學門的分支。研究如何使機器了解並使用人類語言處理問題,透過語言學將人類語言的特性藉由機器建立能夠分析及運算語意的模組。為了能夠讓機器了解我們人類用來溝通的最基本的元素-文字,必須要讓機器了解文字的意義。機讀式字典,除了是要給一般人閱讀的字典,更必須是能讓機器能夠閱讀的字典,較著名的機讀式字典有WordNet。這類字典除了能提供字根還原的功能外,也能提供查詢同義字、上義詞、下義詞、反義詞及詞性變化的資訊,此類資訊能用於語句分析、機器翻譯、文字處理等領域。而本文將介紹如何在Unix/Linux的作業系統上安裝Wordnet。

閱讀全文

信用卡是塑膠貨幣的一種,是目前常見的消費支付工具之一。許多人向銀行申請信用卡作為日常生活中的消費工具,銀行也隨著大眾不同的需求發行各式各樣的信用卡。您是否曾經想要了解銀行提供給您的卡片的號碼裡面包含哪些秘密呢?本文介紹的Bin Database是由人工蒐集世界各國發行的信用卡資料,提供使用者查詢不同卡號其中隱含的資訊。

閱讀全文

若是使用Linux/Unix架設網站伺服器,需要啟動FTP服務時,最常看到的套件莫過於vsftpd。然而,對於一個登入FTP只有上傳網頁的使用者而言,在設定vsftp的過程中我們常會有以下要求:

  • 使用者只能登入到其家目錄內,其他上層目錄在FTP內看不到
  • 使用者對其家目錄必須有寫入權限

閱讀全文

你的網站被盜用了嗎?

一個網站最重要的資產,就是該網站上的文章與文章內的圖片與文字。一位網站經營者辛辛苦苦的經營一個網站,最怕的就是辛苦的付出被其他人輕鬆的複製(Ctrl+C)、貼上(Ctrl+P)。除了辛苦的付出被偷走,對網站本身也會照成許多負面的影響。例如,因為圖片被貼到其他網站,但圖片本身仍存放在網站的伺服器上,造成伺服器對外流量增加。租用線上主機的網站經營者就必須對這些被盜用的流量付出成本。因此,為了防止辛苦經營的成果被盜用,我們在這篇文章中介紹如何使用.htaccess檔案防止您的重要資源被其他人盜用。

閱讀全文

最近工作上有些業務需要將台灣的法律翻成英文來呈現,但法律上的英文關鍵字並非一般線上翻譯服務可以輕易翻譯的,法律上用的英文相對較為正式,有些法律用語更是難以翻譯,甚至還沒有統一的英文翻譯方式,而最近由台灣法律資訊中心推動建置的線上台灣法律中英文關鍵字查詢對照系統提供了這方面的服務,將台灣各部法律中文與英文對照並建立線上資料庫免費供大眾查詢,使用這套軟體可以快速的查詢特定關鍵字包含的法條內容與其英文翻譯。

閱讀全文