名录集网站包含的数据量极大,用MediaWiki来处理这上千万数据确实不是很容易,不过已经导入的数据只有就在现有的平台上保留、处理,未来新增的数据再用Drupal。
前期经过数轮的版面修改、模板更新以及补充索引,这些数据基本上稳定下来,本周前几天就对使用的MediaWiki平台实施从1.15到1.16的升级。
中文站的个数多、总数据量大,不过运行update.php和rebuildtextindex.php的时间比我想象的还是要快一些,一般几十万条数据的网站,运行升级、重建文本索引的时间都在几十分钟以内,完成升级、重建文本索引后,与以前最大的不同除了界面以外就是实现了中文的内部搜索功能,这对浏览用户来说更方便了。
英文站的升级更简单一些,只需要运行update.php,因为英文的内部搜索功能以前就打开了,是正常的。
我怕这么多网站升级后,全部数据都需要重新生成缓存让负载太高,先用以前1.15下的文件缓存,以后逐步更新,这个过渡应该是个不错的办法,基本不影响用户的正常使用。负载方面还需要观察一阵子,主要是担心中文站的内部搜索打开后,在进行内部搜索以及搜索框预先提示搜索词的过程中,是否会有让负载过高的情况。
名录集的MediaWiki平台都升级到1.16以后,就剩下查号吧、邮编库这两个网站还在用1.15版本了,按照数据量来说,在保持老缓存文件的前提下,升级应该不会对服务器负载有特别影响,不过是否繁体克隆网站能完全正常现在还没有验证,等过一阵子名录集网站升级都观察一切正常后,再来处理这两个关键性的网站。
评论