移至主內容
首頁
祁勁松的博客👨‍💻

Main menu

  • 🏠 首頁
  • 博客文章
  • 書籍及手冊
  • 關于本人
  • 關于本站
  • 留言聯系
User Menu
  • 登入

導航連結

  1. 首頁
  2. 博客文章

祁勁松的博客文章

By James Qi, 2013年11月10日

去掉Word轉HTML後多餘的代碼

  最近想把一些下載到的Word或者PDF文檔放置到以前的MediaWiki網站中去,格式轉換有些麻煩,網上可以找到一些工具,但似乎都不是很适合我來用。

  Word文檔可以另存HTML文件(使用過濾的HTML格式可以去掉圖片等附加文件),但打開HTML查看源文件會發現大量字體css代碼需要清理。

  我想嘗試搞個PHP小程序來進行過濾,如下:

<?php /* * input的html内容簡化到output1,然後轉成mediawiki格式的output2 * James Qi 2013-11-10 */ if (isset($_POST['i

By James Qi, 2013年11月8日

從Apache訪問日志統計IP訪問數,發現采集者屏蔽

  在Drupal網站中使用PHP程序來屏蔽采集者效果還不錯,可以自己任意設定判斷标準。不過我們以前的MediaWiki平台上的網站還沒有使用這套PHP程序來屏蔽,最近發現采集又太多了,搞得服務器負載太高,老是從Apache日志人工排查太麻煩、太慢(以前的辦法見博文《Apache中設置屏蔽IP地址和URL網址來禁止采集》),今天花一些時間編寫了一個小程序來統計日志中的IP訪問數,程序很簡短,如下:

<?php
/*
* 統計Apache日志文件的IP,找出訪問最多的IP地址,方便發現采集者
* James Qi 2013-11-8
*/

//0
  
By James Qi, 2013年11月7日

New Series Websites: Geographic Names Database

This is the geographic names website, including more than 8498214 items of area, city, region etc.

There are 250+ countries/regions subdomain websites:

  1. Andorra
  2. United Arab Emirates
  3. Afghanistan
  4. Antigua and Barbuda
By James Qi, 2013年11月7日

A New Website: North America Area Code Database

This is the North America Area Code Database website, including more than 446,143 items of NPA (Numbering Plan Area), NXX (Local Number Prefix), Local Number Prefix, City, County, State, ZIP Code, Latitude, Longitude etc.

With 50 languages, both desktop and mobile version:

By James Qi, 2013年11月4日

部分網站、部分廣告位從Google AdSense改為百度聯盟

網站廣告收入

  10月23日到上海去參加了Google公司組織的Think with DoubleClick會議,在與其他幾位AdSense發布商交流的時候,得知他們好些都改用百度聯盟,而我這兩年側重與外文網站,很少關注百度,對百度聯盟的印象還停留在幾年前廣告價值很低的階段

By James Qi, 2013年10月15日

調用Bing Webmaster API批量提交sitemap

  Google Webmaster Tools我們很早就在用,去年也開始使用其API,寫過一篇記錄《調用Google Webmaster Data API批量提交sitemap》,Bing和Yahoo的類似Webmaster工具我們也很早就注冊、嘗試過,後來Yahoo搜索并入Bing後,我們也沒有多關注。

  上個月接到微軟必應搜索部門客戶經理的郵件,推薦使用Bing Toolbox Webmaster,想到我們現在的網站以外文、國外浏覽者為主要發展方向,而Bing在美國的市場占有率也達到20%多,還是有必要去多了解、利用的,而且Bing去年也推出了新的API便于批量操

By James Qi, 2013年9月18日

網站監控程序的開發需求

  對于持久化專業運營網站來說,對網站的監控必不可少,以我們自己的理解,網站監控需要做的兩件基本事情:

  1. 監控網站健康狀态,當網站出現故障的時候,及時發現并報警;
  2. 監控網站性能表現,獲取網站訪問速度,利于用數據來分析優化。

  說到網站監控,以我們的了解,可以采取的辦法有以下幾種:

  1. 使用現成的網上監控服務,例如site24x7.com提供收費和免費的專業服務;
  2. 自己安裝現成的監控軟件,例如radar website mo
By James Qi, 2013年8月30日

Drupal系列網站設置文件settings.php包含共用的部分

  以前在設置MediaWiki網站的時候,是把一些共用的修改放在CommonSettings.php中,然後LocalSettings.php中最後加入一行:

require_once( "/usr/local/apache2/htdocs/common/CommonSettings.php" );

  就可以讓一系列的網站都共用CommonSettings.php這個文件中的設置,比較簡單、方便,我們一直在采用。

  在Drupal的網站中,因為需要在settings.php中做的修改不算多,所以以前就沒

By James Qi, 2013年8月30日

動态生成robots.txt的PHP程序

  以前嘗試過《Drupal系列網站用robotstxt模塊生成獨立robots.txt》,可以實現多站點的每個站點都有不同的robots.txt,但缺點是需要逐個編輯,當子站數量多、修改次數多的時候,依然顯得麻煩。

  後來也嘗試過程序動态生成robots.txt,但一直沒有成功,昨天還嘗試了在自定義module中編寫,但顯示的内容包含在html.tpl.php, page.tpl.php等模闆之中,也不行。

  再多查了一些網上的資料并反複測試,終于是可以實現了,步驟如下:

  1. 删除原來的robots.txt;
By James Qi, 2013年8月29日

Linux下批量統計文本文件行數的Shell腳本

  這個統計其實很簡單,就一行,把批量循環也記下來:

  lines.sh

!/bin/bash

# 51 us states
DB=(ak al ar az ca co ct dc de fl ga hi ia id il in ks ky la ma md me mi mn mo ms mt nc nd ne nh nj nm nv ny oh ok or pa ri sc sd tn tx ut va vt wa wi wv wy)

for i in "${DB[@]}";do
echo ---------
  

Pagination

  • First page
  • Previous page
  • …
  • 頁面 66
  • 頁面 67
  • 頁面 68
  • 頁面 69
  • 目前頁面 70
  • 頁面 71
  • 頁面 72
  • 頁面 73
  • 頁面 74
  • …
  • 下一頁
  • Last page

站内搜索

最新日志

  • 7月17日“世界Emoji日”的播客節目
  • 多庫學區查詢網站
  • EmojiAll的AI繪圖平台
  • 免費文字生成圖片平台pollinations.ai的利用
  • 賽博菩薩Cloudflare提供的免費AI Gateway
  • 用Cloudflare的Snippets來編程做各種工作
  • 利用Hugging Face的Datasets來保存數據
  • AI算力成本與廣告收入的比較
  • 選擇Dify作為AI應用開發的平台
  • 新推出Emoji角色聊天💬
更多

語言切換

  • 简体中文
  • 繁体中文
RSS源

2002-2023 v11.7 a-j-e-0