前一陣子《新推出一個法語網站:法國工商企業》,新站收錄、展示都很慢,但我們腳步沒有停下,依然一直在做各種語言各國的開放數據集網站。7月份來了一位天津外國語大學的阿拉伯語實習生,一起配合做了第一個阿拉伯語的開放數據集網站 - 阿聯酋開放數據集:
上面阿拉伯語和英語版本的網址不一樣,與其它站多語言的設置不一樣,其它站多語言的網址都是一樣的,阿拉伯語/英語分為兩個不同的網址,因為阿拉伯語是從右到左閱讀的,沒法與英語用同一個網址,否則看起來就亂套了。
另外,其它部分站點的多語言是把英文和其它語言混合放在一起,例如香港就把中文、英文放在同一個頁面内,但這個站我們把英文、阿文對照的網址進行了一些設置,讓英文版基本隻顯示英文,讓阿拉伯文版基本隻顯示阿拉伯文,使用了Drupal自帶的多語言系統翻譯功能。
阿拉伯語還有一個字符集編碼的問題,我們下載的Excel表格直接另存為csv文件不行,要先另存為UNICODE文件,這時在Linux系統下用file -i查看顯示編碼格式charset=utf-16le,先用iconv轉為utf-8文件,然後再進行後續處理和導入數據庫表。
阿拉伯國家很多都有政府開放數據平台,但提供的數據量都偏少,一些統計類的數據也不适合做成網站,後續 還要去找尋更多數據來源。雖然阿拉伯世界的網站遠沒有英文、中文的豐富,但這也正是機會,我們也可以設法做出滿足當地人需求的網站來。
评论