最近想把一些下載到的Word或者PDF文檔放置到以前的MediaWiki網站中去,格式轉換有些麻煩,網上可以找到一些工具,但似乎都不是很适合我來用。
Word文檔可以另存HTML文件(使用過濾的HTML格式可以去掉圖片等附加文件),但打開HTML查看源文件會發現大量字體css代碼需要清理。
我想嘗試搞個PHP小程序來進行過濾,如下:
<?php /* * input的html内容簡化到output1,然後轉成mediawiki格式的output2 * James Qi 2013-11-10 */ if (isset($_POST['i