去年在记录《各国(地区)政府开放数据网站》的时候对“香港资料一线通”平台做了初步了解,相对国内各地的政府开放网站,香港的还算与国际接轨一些,不过数据量偏小是硬伤,当时看的只有大约500个数据集,与台湾的30,000多、英国的20,000多、美国的230,000多差了几个数量级。
今年初我们已经搭建了“香港数据集”的网站,添加了一个初始例子数据集“香港學校位置数据及相关资料”,并且对香港一线通平台做了初步的数据分析,为了后面继续添加,现在专门写一篇博文来记录相关要点。
很多年前去过香港,就知道香港一直就是中英文双语使用,政府这个平台自然也是提供了中英文双语,数据集的具体内容也多提供了双语,其中中文又提供简体中文和繁体中文两种,这点考虑还是比较周全的。
但奇怪的是一线通平台没有找到所有数据集的可下载列表,甚至完整列表也不知道哪里有链接,数量一开始都无从得知,后来反复研究,从为开发者提供的API接口方面了解到平台采用的是与美国、英国、台湾一样的CKAN软件,于是在我们网站里面调用CKAN软件的API才获得了“香港政府開放數據集縂列表”,这样统计出来的数量是500多个,每个数据集名称点击链接进去可以看API提供的详细数据。
因为总共只有500多个,所以要全部看一遍也不是很困难,当时就和同事一起基本看过一次,现在再次看看,先按照大的分类排列出来:
- 城市管理:2
- 气象:7
- 工商业:81
- 发展:43
- 教育:47
- 就业及劳工:7
- 环境:22
- 财经:90
- 食物:13
- 卫生:72
- 房屋:9
- 资讯科技及广播:49
- 法律及保安:22
- 人口:13
- 康乐及文化:47
- 社会福利:12
- 运输:30
- 其他:8
从各个分类的数量上看财经、工商、教育、发展、康乐文化、资讯等分类排在前列,与我们大家印象中的香港还是比较接近的。
初步看看还是有不少适合用于做成网站为网民提供服务的,我这几天准备再添加1、2个数据集的例子,等下个月回国后,再与同事商量着继续添加。
评论