最近想把一些下载到的Word或者PDF文档放置到以前的MediaWiki网站中去,格式转换有些麻烦,网上可以找到一些工具,但似乎都不是很适合我来用。
Word文档可以另存HTML文件(使用过滤的HTML格式可以去掉图片等附加文件),但打开HTML查看源文件会发现大量字体css代码需要清理。
我想尝试搞个PHP小程序来进行过滤,如下:
<?php /* * input的html内容简化到output1,然后转成mediawiki格式的output2 * James Qi 2013-11-10 */ if (isset($_POST['i