标题:
如何区分Office2003格式中的Word或Excel文档
[打印本页]
作者:
easthome2001
时间:
2011-11-16 16:13
标题:
如何区分Office2003格式中的Word或Excel文档
在Office培训公开课上有学员提问:Office2003格式文档后缀名经常错乱,有些明明是Word文档,后缀就会变成dat、无后缀、甚至是xls后缀,需要用Word或Excel打开去试,造成工作上的不便,那么如何区分这些文件呢。
首先文件头肯定是复合文件头:D0 CF 11 E0 A1 B1 1A E1
刚开始Office培训研究的时候发现文件头之后的数据根本分不出来哪些是Word、哪些是Excel,因为没有特别的标志来区分。在得到某帖子的提示后开始研究文件尾,发现文件尾大概2K字节内只要有类似“WordDocument”或者“Workbook”字样的就是Word或Excel文档,但有些尾部内容十分混乱,全是乱码,根本不能区分。今天发现一款微软官方的软件Microsoft Office Visualization Tool,虽然是用来检测Office2003格式文档中是否有恶意代码的,但能完整的分析文档结构,所以能够区分Word或Excel。
使用起来非常简单,打开相应文档,然后选择Parser里的OLESSFormat,再点击Parser即可。
欢迎光临 编程开发论坛 (http://bbs.lihuasoft.net/)
Powered by Discuz! 6.0.0