当前位置

什么样的开放数据适合做网站?

James Qi 在 2018年1月22日 - 11:18 提交
内容摘要:前段时间和同事一起看了一些国外开放数据的网站,特别是一些国家/地区政府的开放数据,考虑哪些是适合用来做网站的、哪些不适合、好数据有什么特征等,下面小结几点: 适合做网站的: 词典类:......

  前段时间和同事一起看了一些国外开放数据的网站,特别是一些国家/地区政府的开放数据,考虑哪些是适合用来做网站的、哪些不适合、好数据有什么特征等,下面小结几点:

  适合做网站的:

  • 词典类:这类数据结构清晰,内容实用性强,数据来源官方,适合做成网站长期供网民浏览;
  • 名录类:数据来源于各政府机构、行业协会,有用户需求,有部分内容会定期更新;
  • 资料类:此类内容可能比较杂,只要是网民会感兴趣的都可以考虑做成网站。

  不适合做网站的:

  • 统计类:一些纯粹的统计数据,感兴趣的人不多;
  • 图片类:大批的图片,不太适合做成网站;
  • 地图类:需要做一些地理信息方面的工作,对这些有需求的人可能主要去用几个大公司的地图app去了。
  • 地方类:局限在比较小的区域范围内,感兴趣的人少,流量不会太大。

  总结一下有用信息的特征:

  • 有明确的用户群体;
  • 数据有一定稀缺性;
  • 机读格式为佳,例如csv, xml, json, excel等,而html, doc, pdf等效果差一些,需要先转换;
  • 数据量大为佳,便于占领长尾空间,我们目标是做海量数据集转为网站页面;
  • 时效性都可以,有长期更新来源的更好,如果更新频繁,可以考虑做成自动获取、更新内容。

  这些数据只是做了点初步分析,还没有正式开始启动来做,但也很快了,2018年还会招人来加大力度、加快速度。除了数据集直接导入做成网站以外,还需要人工来进行一些编辑,形成一些专题,方便用户浏览。

自由标签: