名錄集去年中期用MediaWiki導入大量數據,做成數十個子網站後,一直都在不斷調整模闆、檢查錯誤、修改完善,并推出名錄銷售,今年到4月份為止,也隻是用Drupal搭建了兩個中英文的供求信息、Trade Message網站,并沒有再導入大量數據來增加子網站了。
不過從上個月開始,我們重新啟動了新增子網站的工作,昨天除了推出435萬數據量的114電話查詢名錄以外,還有一個廣交會中國參展商名錄也公布出來。
以前的廣交會名錄以英文的國外買家為主,這次是中文的中國參展商名錄,數量也少一些,隻有1萬多,因此我們處理起來也比較快,前後也就一周左右時間,保留了留言和内部搜索功能。
原始數據依然質量有些問題,例如各行業中有很多重複的單位、展區展位信息比較亂、郵箱網站等數據格式錯位等,需要進行前期整合去重複、以及通過Drupal中的Contemplate來在模闆中用PHP語言進行判斷整理。目前已經基本完成,可以公布出來:
後面還有各屆廣交會的英文數據,也将陸續做成獨立網站。
评论