java如何读取一个加密后的.xls文件

如题所述

近日来,研究了一下Excel Biff8(xls 97-2007)与OpenXML(ECMA-376)的加密文档的读取(这还是为了我们世界先进Grid而做的 ^__^)。有些成果,写在这里,希望能给要做类似功能的XD们一些参考。
如有不详,请联系:Owen.Liu@GrapeCity.com / J2.NETe@gmail.com
前提:
1. 加密文档:指Wookbook级的加密,就是在Save Excel文档时在General Settings中设置open password之后的文档;
2. 打开:需要用户传入密码。并非破解。但请勿将本文方法添加暴力模块使用 :-) ;
3. 本文涉及较多为,密钥计算,关于解密细节请参考微软相关文档;
使用的加密算法: RC4, SHA1, MD5, AES-128(其中RC4并不包含在所有版本的.NET Framework中,AES算法可以在.NET Framework 3.5中找到)
本文示例依赖 .NET Framework 3.5

A. Biff8 的加密文档读取
1. 通过文档中FILEPASS的record取得,文档的加密信息(关于Biff文档的格式问题,请参阅Biff的微软文档)
其中Biff8可以使用两种方法加密:Biff8标准加密算法和Biff8扩充加密算法。本文主要讨论最常用的Biff标准加密算法
2. 通过FILEPASS的结构,获得如下信息:
salt(加密随机数,16 bytes)
password verifier (密码效验器,16 bytes)
password verifier hash(密码效验器Hash,16 bytes)
3. 通过以上信息,生成解密key。并通过密码效验器,验证密码:
i. 将密码转化成unicode数组,并进行MD5 Hash;
ii. 将hash结果与salt串联,然后将byte数组,反复串联16次(336 bytes) ,然后再进行MD5 Hash;
iii. 将上步hash结果的前五位,串联上4 bytes的block值(在密码验证阶段为0,在以后解密阶段为block的index) ,然后进行MD5 Hash;
iv. 将上步hash结果的前16位,作为key
v. 使用RC4对称加密算法,将password verifier和password verifier hash分别解密,然后对password verifier的解密结果进行MD5 hash,其值应和password verifier hash的解密结果一致,即为密码正确。
vi. 之后进行逐个record的解密。excel biff8加密原则基本为,record的标示不加密,长度不加密,个别record不加密(见文档);另外,在record解密时,还需要通过block的值重新计算解密key,block的大小为1024.
4. 详细请参照示例代码;

B. OpenXML(ECMA-376) 加密文档的读取
1. 通常来说,xlsx文件相当于一个zip文件,可以用zip程序,直接打开。而在加密后,为了安全性考虑,微软使用了 structured storage(一种OLE文档存储方式)存储(可以用7-zip或者OLE document viewer打开,windows也有相应API来操作此类结构)。在上述文档中,有一个叫做“EncryptedPackage”加密的package,就是一个zip包通过AES算法进行加密之后的结果。我们将使用和A一样的方式来检查密码,但生成key的方法不同;OpenXML的加密类型也有多种,我们这里就讨论常用的用AES-128进行加密的流程;
2. 通过文档的“EncryptedInfo”部分,需要过的一下信息(关于此部分的结构,请参考[MS-OFFCRYPTO].pdf)
salt(加密随机数,16 bytes)
password verifier (密码效验器,16 bytes)
password verifier hash(密码效验器Hash,32 bytes)
3. 通过以上信息,生成解密key。并通过密码效验器,验证密码:
i. 首先,定义一个H函数,其有两个输入,内部使用SHA1算法将两个输入串联之后的结果hash返回;
ii. 先将salt与password(password的unicode数组)进行H计算,h = H(salt, password) ;
iii.然后设iterator为0x00000000,将其转为4byte的数组,然后进行H计算,h1 = H(iterator, h);
iv.将上面的iterator递增一,然后再与h1进行H计算,h2 = H(iterator,h1),然后将这个递增和计算过程重复50000次,最后计算过的iterator为49999即可;
v. 现在有计算结果h50000,将h50000再与0x00000000(4 byte数组)进行H计算,Hfinal = H(h50000, 0x00000000);
vi. 生成一个64byte的数组,将每位都初始化成0x36,然后将这个数组与Hfinal异或;(关于这个地方,微软文档中写的有错误,按照原文的方法生成的key不正确,要不是文档的作者回信告诉我要使用这个法子,就算我想破头也想不出来啊 T__T)
vii.将异或结果,进行SHA1 hash,结果的前16byte就是解密的key;
viii.初始化AES算法,key长度为128,模式为ECB模式,Padding为none; 然后将password verifier 和password verifier hash分别解密;
ix. password verifier 解密后的SHA1 hash结果应该与password verifier hash解密后的前20byte相同;
4. 关于"EncryptedPackage" 的解密则更为简单,只许将“EncryptedPackage”读入,去除前8byte的size信息后,进行AES解密,即为未加密的标准openxml文档。

参考:
[MS-OFFCRYPTO].pdf
[MS-XLS].pdf
ECMA-376 standards

Reply by "winnow", 2008-09-10, 1:17
-----------------------------------------------------
总结一下, 关于这两种基于密码的加密方法, 基本上都是基于RFC2898 建议, 思想是这样:
输入是用户的密码:password, 输出是提供给加密函数的密钥:key.
考虑安全, 需要使同样的password生成的key不一样, 这样用相同的password加密后的结果就无法比较. 需要一个随机数salt.
另外, 为了使暴力破解的代价增大, 考虑使用一个循环多次的过程, 需要循环次数:iteration_count.
概念上, 生成方法为: 将password和salt进行某种运算, 配合一个Hash函数, 以某种方式循环iteration_count次, 在最后的结果里取一部分作为key输出.
具体参照RFC2898中的建议方法PBKDF1和PBKDF2.
这样, 用户输入的密码与一个随机数组合, 经过一定代价的运算, 就生成了可以供加密函数使用的密钥. 使用这个密钥和一个加密函数, 就可以进行加密了.

在应用中, 为了快速判断密码是否错误. 生成一个随机数verifier, 用一个Hash函数计算verifier的hash值:verifier_hash, 分别加密verifier和verifier_hash并保存.
解密的时候, 先分别解密出verifier和verifier_hash, 计算verifier的hash值, 与verifier_hash比较, 如果一致, 即说明密码正确.
温馨提示:内容为网友见解,仅供参考
第1个回答  推荐于2017-09-02
首先你这个Excel文件是从哪里来的,很可能是从一个页面上下载来的,而这个页面做的功能就是导出Excel,但做偷懒了,没有用jxl和POI等库,而是用直接用jsp生成html写的。

因此你上传时就要要判断了,如果是真的excel就要用jxl或POI解析,如果只是html,就要用HTML的解析方法了。
本回答被提问者采纳

java jxl怎么读取被密码保护的excel
1.如果知道密码怎么读取 现有的POI与JXL都没有发现能够读取和加密的excel的功能。只能对文件进行加密。如果想读取加密的excel,要借助jxcell,下载地址http:\/\/www.jxcell.net View m_view = new View();m_view.read("E:\\\\pass.xls", "123456");m_view.write("E:\\\\out.xls");类似这样输出一...

java如何读取一个加密后的.xls文件
1. 通过文档中FILEPASS的record取得,文档的加密信息(关于Biff文档的格式问题,请参阅Biff的微软文档)其中Biff8可以使用两种方法加密:Biff8标准加密算法和Biff8扩充加密算法。本文主要讨论最常用的Biff标准加密算法 2. 通过FILEPASS的结构,获得如下信息:salt(加密随机数,16 bytes)password verifier (...

能不能用Java控制一个加过密的图片在读取的时候解密,最好加密也是用Java...
图片加密的话,不太好做,因为你在页面显示了,用户可以根据图片的url地址进行查找并替换。你可以换一种方式,数据库里面不仅保存图片的地址,还保存图片的大小,不是图片的宽和高,而是图片的比特大小,然后显示图片的时候,判断链接的图片大小是不是你之前的大小,是的话,显示,不是的话,不显示。 ...

加密后的文件能不能打开?
在本地打开,存到不加密的文件夹试一下。 ---这里的方法可以试一下:一、加密文件或文件夹 步骤一:打开WINDOWS资源管理器。 步骤二:右键单击要加密的文件或文件夹,然后单击“属性”。 步骤三:在“常规”选项卡上,单击“高级”。选中“加密内容以便保护数据”复选框 在加密过程中还要注意以下五...

JAVA简单加密解密,写入文件再读取解密就不行了
这个因为加密的时候使用char[]数组,输出到文件的时候用GBK编码,而一些字符GBK无法编码,因此到文件中用"?"替代了。你可以比较一下encryptedStr与lines,虽然控制台看着是一样,但不是同一个字符串,只不过乱码字符都用"?"表示了

java中怎么对同一个文件读取两次或以上,用io
读取一个文件,把文件的内容缓存起来(用List,或者StringBuilder等等的容器)。然后读取另一个文件,再把内容缓存到同一个容器里面。直到最后一个文件读取完毕。我在对这个缓存内容的容器进行处理。但是这个可能会越界...或者可以试试把第一个文件的内容写入缓存,然后读第二个文件时把第一个文件的内容写入...

java有没有那个方法 获取文件保存的编码方式啊?
因此理论上说如果编辑器未放置任何标记是不可能知道文件的原始字符编码的,就好像你初次看一份密码加密过的文件时你也不可能知道它是什么加密方式一样,因为编码方式并不会和编码的数据放在一起的。正常的方法是当你读取一个文件时,应该有人已经告诉了你这个文件是字符集是什么。这个过程应该是人工决定的...

如何用java程序查看.dat文件
如果你的dat文件被加密过,那么需要解密才能看,否则读出来的都是乱码,如果没有加密,那么通过io流,反正java的io流可以把里面的所有字符都读出来,方法就多了去了,到网络中查找java读文件就可以找出一堆代码

如何将java中的.class文件反编译
[1] 反编译一个class文件:jad example.class,会生成example.jad,用文本编辑器打开就是java源代码 [2] 指定生成源代码的后缀名:jad -sjava example.class,生成example.java [3] 改变生成的源代码的名称,可以先使用-p将反编译后的源代码输出到控制台窗口,然后使用重定向,输出到文件:jad -p ...

Java 加密、解密PDF文档
方法1:从官方网站下载Jar包,解压后,将lib文件夹下的jar文件导入Java程序。方法2:通过Maven导入。详细步骤参考。以下是加密PDF文档的Java代码示例:编写并运行代码后,生成加密文档。输入密码后,可以查看加密文档的效果。同时,本文提供了解除PDF密码保护的代码示例。总结,通过Java编程,您可以灵活地对PDF...

相似回答