去年在記錄《各國(地區)政府開放數據網站》的時候對“香港資料一線通”平台做了初步了解,相對國内各地的政府開放網站,香港的還算與國際接軌一些,不過數據量偏小是硬傷,當時看的隻有大約500個數據集,與台灣的30,000多、英國的20,000多、美國的230,000多差了幾個數量級。
今年初我們已經搭建了“香港數據集”的網站,添加了一個初始例子數據集“香港學校位置數據及相關資料”,并且對香港一線通平台做了初步的數據分析,為了後面繼續添加,現在專門寫一篇博文來記錄相關要點。
很多年前去過香港,就知道香港一直就是中英文雙語使用,政府這個平台自然也是提供了中英文雙語,數據集的具體内容也多提供了雙語,其中中文又提供簡體中文和繁體中文兩種,這點考慮還是比較周全的。
但奇怪的是一線通平台沒有找到所有數據集的可下載列表,甚至完整列表也不知道哪裡有鍊接,數量一開始都無從得知,後來反複研究,從為開發者提供的API接口方面了解到平台采用的是與美國、英國、台灣一樣的CKAN軟件,于是在我們網站裡面調用CKAN軟件的API才獲得了“香港政府開放數據集縂列表”,這樣統計出來的數量是500多個,每個數據集名稱點擊鍊接進去可以看API提供的詳細數據。
因為總共隻有500多個,所以要全部看一遍也不是很困難,當時就和同事一起基本看過一次,現在再次看看,先按照大的分類排列出來:
- 城市管理:2
- 氣象:7
- 工商業:81
- 發展:43
- 教育:47
- 就業及勞工:7
- 環境:22
- 财經:90
- 食物:13
- 衛生:72
- 房屋:9
- 資訊科技及廣播:49
- 法律及保安:22
- 人口:13
- 康樂及文化:47
- 社會福利:12
- 運輸:30
- 其他:8
從各個分類的數量上看财經、工商、教育、發展、康樂文化、資訊等分類排在前列,與我們大家印象中的香港還是比較接近的。
初步看看還是有不少适合用于做成網站為網民提供服務的,我這幾天準備再添加1、2個數據集的例子,等下個月回國後,再與同事商量着繼續添加。
评论