- 主题:本站内容主要是本人关注的互联网行业及个人爱好方面的主题,包括AdSense💲、MediaWiki👨💻、Drupal💻、马拉松🏃、架子鼓🥁等。
- 书讯:本人新书2018年12月出版《Google AdSense实战宝典 - 第二版📘》,欢迎关注。
去年在寻找公开数据的时候,就看到过GitHub上的“Awesome Public Datasets”,这是一个手工收集整理的各种公开数据集列表,按照主题可以分为下面这些大类:
- Agriculture 农业
- Biology 生物
- Climate+Weather 气候+天气
- ComplexNetworks 复杂网络
- ComputerNetworks 计算机网络
- DataChallenges 数据竞赛
记录了《美国政府开放数据了解》、《香港政府开放数据了解》后,继续在圣迭戈这边工作,多数是在住处房间里面上网,也有时跟着儿子去UCSD图书馆去搞我自己的工作,这周又重点了解了英国政府开放数据的情况,现在也记录一篇博客文章。
这是英国政府开放数据的官方网站:DATA.GOV.UK opening up government
我们已做了几个数据集内容的网站:United Kingdom Datasets
与美国、香港、台湾一样,采用的都是开源的CKAN平台,但在具体使用的时候有用很多不同。其中有两个功能我觉得特别棒:一
Drupal网站有站点联络功能,是通过填写contact表单来发送邮件实现的,我们总是收到一些来自俄罗斯的垃圾邮件,这些俄罗斯黑客有一定技术,可以识别图片验证码,使我们的主要反垃圾措施失效,但垃圾终究是垃圾,这种长期自动骚扰别人的做法,这世界上做得最多的就是俄罗斯人和中国人了,真是为国家丢脸,希望中国人干这些事的人以后少些吧。
早就想找办法来屏蔽,本来Drupal还自己带有“触发”、“动作”机制的,但好像原来屏蔽关键词就没有实验成功,所以这次干脆找底层API来解决,通过1个小时的摸索,找到了办法。
去年在记录《各国(地区)政府开放数据网站》的时候对“香港资料一线通”平台做了初步了解,相对国内各地的政府开放网站,香港的还算与国际接轨一些,不过数据量偏小是硬伤,当时看的只有大约500个数据集,与台湾的30,000多、英国的20,000多、美国的230,000多差了几个数量级。
今年初我们已经搭建了“香港数据集”的网站,添加了一个初始例子数据集“香港學校位置数据及相关资料”,并且对香港一线通平台做了初步的数据分析,为了后面继续添加,现在专门写一篇博文来记录相关要点。
去年开始就在了解开放数据领域的情况,当时记录了《各国(地区)政府开放数据网站》、《美国州县市政府开放数据网站》,后来今年初在考虑把一些数据做成网站形式让大众浏览的时候,还记录了《什么样的开放数据适合做网站?》,2、3月份在美国远程工作,也尝试添加了一些内容到U.S. Open Datasets这个新站,还在上面《什么样的开放数据适合做网站?》这篇博文后面添加了一些新的想法:
- 编码类:编码类数据集类似词典的结构,比较简单,但基本上没人能够记住编码及含义,都需要查资料,所以这类信息还是有用的,只是可能不经常查,或者只是
去年就发现我们有的网站在Google Search Console里面提交的网站地图一直都是“待定”状态(英文界面是“Pending”),重新提交也没有效果,前几天又和同事一起查看,发现有两个域名的系列网站全部都是网站地图处在“待定”状态,这应该有好多个月了,很是令人郁闷。
先以为是网站地图本身有问题,但打开都是正常的,用Google Search Console里面的“用Google方式打开”也可以正常获取内容,在其它验证网站地图的地方也可以通过验证,肯定不是网站
这几天在各个系列网站上添加社会化分享按钮,国内使用百度分享,国外使用AddThis。在普通的PC版本、手机版本或者自适应版本上添加都没有问题,但要在AMP(谷歌推出的Accelerated Mobile Pages)和MIP(百度推出的Mobile Instant Page)版本里面添加还有所不同,今天专门看了看,记录如下。
AMP里面有专门的amp-social-share插件,代码示范如下:
<head> ... <script async custom-element="amp-social-s
昨天在一些网站中添加AddThis分享按钮,主要是针对海外的站点上放置,放置当天就可以看到流量和分享数据。后悔没有更早放置分享按钮,不然网站可以有更多外链和来自社交媒体的流量。
以前国内的有些站放过百度分享按钮,所以我又去百度分享后台看了看,却发现没有统计数据,不知道是百度分享自己的问题,还是因为我们改https支持引起的问题。
百度搜索前两年都已经改全站https支持了,但他们的好些服务一直到现在都没有改https支持,例如百度联盟、百度统计、百度分享等,这效率实在太低,不知道他们忙什么去了。我是在网上找的文章,把百度分享的js代码下
以前使用过“百度分享”按钮代码嵌入到网站中,在《Drupal网站改http为https访问》这篇文章里面还记录了baiduShare代码改为支持https的办法,但国外站基本都没有添加。
上个星期和同事一起查看定期网站统计分析的时候,专门去看了百度站长平台、Google Search Consol里面的一些数据,有部分外部链接来自社会化媒体分享,都是用户自己主动做的,我们网站上连分享按钮都没有提供。
所以今天特意在网上搜了一下,国外站用AddThis的比较多,我就注册了一个帐号,进去可以进行设置、获取代码,然后放
前面介紹過去年底今年初“為台灣網民新做的四個國語辭典類網站”,推出后還進行了一些列的改進:
- 添加國語辭典站的發音、講解、圖嵌入到其它站;
- 四個站互相之間添加鏈接;
- 添加注音、拼音的索引;
- 文内引號之間的字進行比對,鏈接到本辭典或者其它辭典;
- 搜索功能自定義改進;
- 多音字按照順序排列;
- 詞組、成語分爲單字,做接龍鏈接;
- 文内引用本字詞加紅色標記;
- 菜單添