跳转到主要内容
首页
祁劲松的博客👨‍💻

Main menu

  • 🏠 首页
  • 博客文章
  • 书籍及手册
  • 关于本人
  • 关于本站
  • 留言联系
User Menu
  • 登录

面包屑

  1. 首页
  2. 博客文章

祁劲松的博客文章

由 James Qi, 2013年11月10日

去掉Word转HTML后多余的代码

  最近想把一些下载到的Word或者PDF文档放置到以前的MediaWiki网站中去,格式转换有些麻烦,网上可以找到一些工具,但似乎都不是很适合我来用。

  Word文档可以另存HTML文件(使用过滤的HTML格式可以去掉图片等附加文件),但打开HTML查看源文件会发现大量字体css代码需要清理。

  我想尝试搞个PHP小程序来进行过滤,如下:

<?php /* * input的html内容简化到output1,然后转成mediawiki格式的output2 * James Qi 2013-11-10 */ if (isset($_POST['i

由 James Qi, 2013年11月8日

从Apache访问日志统计IP访问数,发现采集者屏蔽

  在Drupal网站中使用PHP程序来屏蔽采集者效果还不错,可以自己任意设定判断标准。不过我们以前的MediaWiki平台上的网站还没有使用这套PHP程序来屏蔽,最近发现采集又太多了,搞得服务器负载太高,老是从Apache日志人工排查太麻烦、太慢(以前的办法见博文《Apache中设置屏蔽IP地址和URL网址来禁止采集》),今天花一些时间编写了一个小程序来统计日志中的IP访问数,程序很简短,如下:

<?php
/*
* 统计Apache日志文件的IP,找出访问最多的IP地址,方便发现采集者
* James Qi 2013-11-8
*/

//0
  
由 James Qi, 2013年11月7日

New Series Websites: Geographic Names Database

This is the geographic names website, including more than 8498214 items of area, city, region etc.

There are 250+ countries/regions subdomain websites:

  1. Andorra
  2. United Arab Emirates
  3. Afghanistan
  4. Antigua and Barbuda
由 James Qi, 2013年11月7日

A New Website: North America Area Code Database

This is the North America Area Code Database website, including more than 446,143 items of NPA (Numbering Plan Area), NXX (Local Number Prefix), Local Number Prefix, City, County, State, ZIP Code, Latitude, Longitude etc.

With 50 languages, both desktop and mobile version:

由 James Qi, 2013年11月4日

部分网站、部分广告位从Google AdSense改为百度联盟

网站广告收入

  10月23日到上海去参加了Google公司组织的Think with DoubleClick会议,在与其他几位AdSense发布商交流的时候,得知他们好些都改用百度联盟,而我这两年侧重与外文网站,很少关注百度,对百度联盟的印象还停留在几年前广告价值很低的阶段

由 James Qi, 2013年10月15日

调用Bing Webmaster API批量提交sitemap

  Google Webmaster Tools我们很早就在用,去年也开始使用其API,写过一篇记录《调用Google Webmaster Data API批量提交sitemap》,Bing和Yahoo的类似Webmaster工具我们也很早就注册、尝试过,后来Yahoo搜索并入Bing后,我们也没有多关注。

  上个月接到微软必应搜索部门客户经理的邮件,推荐使用Bing Toolbox Webmaster,想到我们现在的网站以外文、国外浏览者为主要发展方向,而Bing在美国的市场占有率也达到20%多,还是有必要去多了解、利用的,而且Bing去年也推出了新的API便于批量操

由 James Qi, 2013年9月18日

网站监控程序的开发需求

  对于持久化专业运营网站来说,对网站的监控必不可少,以我们自己的理解,网站监控需要做的两件基本事情:

  1. 监控网站健康状态,当网站出现故障的时候,及时发现并报警;
  2. 监控网站性能表现,获取网站访问速度,利于用数据来分析优化。

  说到网站监控,以我们的了解,可以采取的办法有以下几种:

  1. 使用现成的网上监控服务,例如site24x7.com提供收费和免费的专业服务;
  2. 自己安装现成的监控软件,例如radar website mo
由 James Qi, 2013年8月30日

Drupal系列网站设置文件settings.php包含共用的部分

  以前在设置MediaWiki网站的时候,是把一些共用的修改放在CommonSettings.php中,然后LocalSettings.php中最后加入一行:

require_once( "/usr/local/apache2/htdocs/common/CommonSettings.php" );

  就可以让一系列的网站都共用CommonSettings.php这个文件中的设置,比较简单、方便,我们一直在采用。

  在Drupal的网站中,因为需要在settings.php中做的修改不算多,所以以前就没

由 James Qi, 2013年8月30日

动态生成robots.txt的PHP程序

  以前尝试过《Drupal系列网站用robotstxt模块生成独立robots.txt》,可以实现多站点的每个站点都有不同的robots.txt,但缺点是需要逐个编辑,当子站数量多、修改次数多的时候,依然显得麻烦。

  后来也尝试过程序动态生成robots.txt,但一直没有成功,昨天还尝试了在自定义module中编写,但显示的内容包含在html.tpl.php, page.tpl.php等模板之中,也不行。

  再多查了一些网上的资料并反复测试,终于是可以实现了,步骤如下:

  1. 删除原来的robots.txt;
由 James Qi, 2013年8月29日

Linux下批量统计文本文件行数的Shell脚本

  这个统计其实很简单,就一行,把批量循环也记下来:

  lines.sh

!/bin/bash

# 51 us states
DB=(ak al ar az ca co ct dc de fl ga hi ia id il in ks ky la ma md me mi mn mo ms mt nc nd ne nh nj nm nv ny oh ok or pa ri sc sd tn tx ut va vt wa wi wv wy)

for i in "${DB[@]}";do
echo ---------
  

分页

  • 首页
  • 前一页
  • …
  • Page 66
  • Page 67
  • Page 68
  • Page 69
  • 当前页 70
  • Page 71
  • Page 72
  • Page 73
  • Page 74
  • …
  • 下一页
  • 末页

站内搜索

最新日志

  • 7月17日“世界Emoji日”的播客节目
  • 多库学区查询网站
  • EmojiAll的AI绘图平台
  • 免费文字生成图片平台pollinations.ai的利用
  • 赛博菩萨Cloudflare提供的免费AI Gateway
  • 用Cloudflare的Snippets来编程做各种工作
  • 利用Hugging Face的Datasets来保存数据
  • AI算力成本与广告收入的比较
  • 选择Dify作为AI应用开发的平台
  • 新推出Emoji角色聊天💬
更多

语言切换

  • 简体中文
  • 繁体中文
RSS源

2002-2023 v11.7 a-j-e-0