用Java获取文件的MD5校验和

Getting a File's MD5 Checksum in Java

我想用Java获取文件的MD5校验和。我真的很惊讶,但是我没有找到任何可以显示如何获取文件的MD5校验和的东西。

怎么做到的?


有一个输入流修饰器,java.security.DigestInputStream,这样您就可以像通常那样使用输入流来计算摘要,而不必额外传递数据。

1
2
3
4
5
6
7
MessageDigest md = MessageDigest.getInstance("MD5");
try (InputStream is = Files.newInputStream(Paths.get("file.txt"));
     DigestInputStream dis = new DigestInputStream(is, md))
{
  /* Read decorated stream (dis) to EOF as normal... */
}
byte[] digest = md.digest();


使用Apache Commons编解码器库中的DigestUtils:

1
2
3
try (InputStream is = Files.newInputStream(Paths.get("file.txt"))) {
    String md5 = org.apache.commons.codec.digest.DigestUtils.md5Hex(is);
}


在实际的Java中有一个例子,如何使用MasigeDigST类。

查看该页中使用CRC32和SHA-1的示例。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
import java.io.*;
import java.security.MessageDigest;

public class MD5Checksum {

   public static byte[] createChecksum(String filename) throws Exception {
       InputStream fis =  new FileInputStream(filename);

       byte[] buffer = new byte[1024];
       MessageDigest complete = MessageDigest.getInstance("MD5");
       int numRead;

       do {
           numRead = fis.read(buffer);
           if (numRead > 0) {
               complete.update(buffer, 0, numRead);
           }
       } while (numRead != -1);

       fis.close();
       return complete.digest();
   }

   // see this How-to for a faster way to convert
   // a byte array to a HEX string
   public static String getMD5Checksum(String filename) throws Exception {
       byte[] b = createChecksum(filename);
       String result ="";

       for (int i=0; i < b.length; i++) {
           result += Integer.toString( ( b[i] & 0xff ) + 0x100, 16).substring( 1 );
       }
       return result;
   }

   public static void main(String args[]) {
       try {
           System.out.println(getMD5Checksum("apache-tomcat-5.5.17.exe"));
           // output :
           //  0bb2827c5eacf570b6064e24e0e6653b
           // ref :
           //  http://www.apache.org/dist/
           //          tomcat/tomcat-5/v5.5.17/bin
           //              /apache-tomcat-5.5.17.exe.MD5
           //  0bb2827c5eacf570b6064e24e0e6653b *apache-tomcat-5.5.17.exe
       }
       catch (Exception e) {
           e.printStackTrace();
       }
   }
}


com.google.common.hash api提供:

  • 所有哈希函数的统一用户友好API
  • 可播种的32位和128位杂音3实现
  • md5()、sha1()、sha256()、sha512()适配器,只需更改一行代码即可在这些适配器和杂音之间切换。
  • goodfasthash(int位),当您不关心使用什么算法时
  • 用于哈希代码实例的常规实用程序,如CombineOrdered/CombineNordered

阅读用户指南(IO解释,哈希解释)。

对于您的用例,Files.hash()计算并返回文件的摘要值。

例如,sha-1摘要计算(将sha-1更改为md5以获取md5摘要)

1
2
HashCode hc = Files.asByteSource(file).hash(Hashing.sha1());
"SHA-1:" + hc.toString();

请注意,CRC32比MD5快得多,因此如果不需要密码安全校验和,请使用CRC32。还请注意,MD5不应该用于存储密码等,因为它很容易暴力,对于密码,请使用bcrypt、scrypt或sha-256。

为了使用哈希进行长期保护,Merkle签名方案增加了安全性,由欧洲委员会赞助的后量子密码研究小组建议使用这种密码术长期保护量子计算机(Ref)。

请注意,CRC32的碰撞率比其他的高。


不使用外部库(使用Java 7 +):

1
2
byte[] b = Files.readAllBytes(Paths.get("/path/to/file"));
byte[] hash = MessageDigest.getInstance("MD5").digest(b);

要将结果与预期的校验和进行比较,请执行以下操作:

1
2
3
String expected ="2252290BC44BEAD16AA1BF89948472E8";
String actual = DatatypeConverter.printHexBinary(hash);
System.out.println(expected.equalsIgnoreCase(actual) ?"MATCH" :"NO MATCH");


现在,guava提供了一个新的、一致的哈希API,它比JDK中提供的各种哈希API更加用户友好。见哈希解释。对于一个文件,您可以轻松获得MD5 SUM、CRC32(版本14.0+)或许多其他哈希:

1
2
3
4
5
6
7
8
9
10
HashCode md5 = Files.hash(file, Hashing.md5());
byte[] md5Bytes = md5.asBytes();
String md5Hex = md5.toString();

HashCode crc32 = Files.hash(file, Hashing.crc32());
int crc32Int = crc32.asInt();

// the Checksum API returns a long, but it's padded with 0s for 32-bit CRC
// this is the value you would get if using that API directly
long checksumResult = crc32.padToLong();

好啊。我不得不补充。对于那些已经具有Spring和ApacheCommons依赖性或计划添加它的用户,可以使用一行实现:

1
DigestUtils.md5DigestAsHex(FileUtils.readFileToByteArray(file))

对于和Apache Commons Only选项(credit@duleshi):

1
DigestUtils.md5Hex(FileUtils.readFileToByteArray(file))

希望这能帮助别人。


一种使用Java 7的无第三方库的简单方法

1
2
3
4
String path ="your complete file path";
MessageDigest md = MessageDigest.getInstance("MD5");
md.update(Files.readAllBytes(Paths.get(path)));
byte[] digest = md.digest();

如果需要打印这个字节数组。使用如下

1
System.out.println(Arrays.toString(digest));

如果你需要这个摘要中的十六进制字符串。使用如下

1
2
String digestInHex = DatatypeConverter.printHexBinary(digest).toUpperCase();
System.out.println(digestInHex);

其中datatypeconverter是javax.xml.bind.datatypeconverter


我最近不得不为一个动态字符串做这个,MessageDigest可以用多种方式表示散列。要像使用md5sum命令那样获得文件的签名,我必须执行如下操作:

1
2
3
4
5
6
7
8
9
10
try {
   String s ="TEST STRING";
   MessageDigest md5 = MessageDigest.getInstance("MD5");
   md5.update(s.getBytes(),0,s.length());
   String signature = new BigInteger(1,md5.digest()).toString(16);
   System.out.println("Signature:"+signature);

} catch (final NoSuchAlgorithmException e) {
   e.printStackTrace();
}

显然,这并不能回答你关于如何专门为一个文件做这件事的问题,上面的回答很好地解决了这个问题。我只是花了很多时间得到和,看起来像大多数应用程序的显示它,并认为您可能会遇到同样的问题。


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
public static void main(String[] args) throws Exception {
    MessageDigest md = MessageDigest.getInstance("MD5");
    FileInputStream fis = new FileInputStream("c:\\apache\\cxf.jar");

    byte[] dataBytes = new byte[1024];

    int nread = 0;
    while ((nread = fis.read(dataBytes)) != -1) {
        md.update(dataBytes, 0, nread);
    };
    byte[] mdbytes = md.digest();
    StringBuffer sb = new StringBuffer();
    for (int i = 0; i < mdbytes.length; i++) {
        sb.append(Integer.toString((mdbytes[i] & 0xff) + 0x100, 16).substring(1));
    }
    System.out.println("Digest(in hex format)::" + sb.toString());
}

或者你可以得到更多的信息http://www.asjava.com/core-java/java-md5-示例/


我们使用的代码与上一篇文章中的代码类似,使用

1
2
3
...
String signature = new BigInteger(1,md5.digest()).toString(16);
...

但是,注意这里使用BigInteger.toString(),因为它会截断前导零…(例如,尝试s ="27",校验和应为"02e74f10e0327ad868d138f2b4fdd6f0")

我赞同使用ApacheCommons编解码器的建议,我用它替换了我们自己的代码。


非常快和干净的Java方法,不依赖外部库:

(如果需要,只需将MD5替换为sha-1、sha-256、sha-384或sha-512)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
public String calcMD5() throws Exception{
        byte[] buffer = new byte[8192];
        MessageDigest md = MessageDigest.getInstance("MD5");

        DigestInputStream dis = new DigestInputStream(new FileInputStream(new File("Path to file")), md);
        try {
            while (dis.read(buffer) != -1);
        }finally{
            dis.close();
        }

        byte[] bytes = md.digest();

        // bytesToHex-method
        char[] hexChars = new char[bytes.length * 2];
        for ( int j = 0; j < bytes.length; j++ ) {
            int v = bytes[j] & 0xFF;
            hexChars[j * 2] = hexArray[v >>> 4];
            hexChars[j * 2 + 1] = hexArray[v & 0x0F];
        }

        return new String(hexChars);
}


1
2
3
4
5
6
7
8
9
10
public static String MD5Hash(String toHash) throws RuntimeException {
   try{
       return String.format("%032x", // produces lower case 32 char wide hexa left-padded with 0
      new BigInteger(1, // handles large POSITIVE numbers
           MessageDigest.getInstance("MD5").digest(toHash.getBytes())));
   }
   catch (NoSuchAlgorithmException e) {
      // do whatever seems relevant
   }
}


1
String checksum = DigestUtils.md5Hex(new FileInputStream(filePath));


标准Java运行时环境方式:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
public String checksum(File file) {
  try {
    InputStream fin = new FileInputStream(file);
    java.security.MessageDigest md5er =
        MessageDigest.getInstance("MD5");
    byte[] buffer = new byte[1024];
    int read;
    do {
      read = fin.read(buffer);
      if (read > 0)
        md5er.update(buffer, 0, read);
    } while (read != -1);
    fin.close();
    byte[] digest = md5er.digest();
    if (digest == null)
      return null;
    String strDigest ="0x";
    for (int i = 0; i < digest.length; i++) {
      strDigest += Integer.toString((digest[i] & 0xff)
                + 0x100, 16).substring(1).toUpperCase();
    }
    return strDigest;
  } catch (Exception e) {
    return null;
  }
}

结果与LinuxMD5SUM实用程序相同。


另一种实现:快速MD5在爪哇中的实现

1
String hash = MD5.asHex(MD5.getHash(new File(filename)));


这里有一个简单的函数,它将Sunil的代码包装起来,以一个文件作为参数。该函数不需要任何外部库,但它确实需要Java 7。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;

import javax.xml.bind.DatatypeConverter;

public class Checksum {

    /**
     * Generates an MD5 checksum as a String.
     * @param file The file that is being checksummed.
     * @return Hex string of the checksum value.
     * @throws NoSuchAlgorithmException
     * @throws IOException
     */

    public static String generate(File file) throws NoSuchAlgorithmException,IOException {

        MessageDigest messageDigest = MessageDigest.getInstance("MD5");
        messageDigest.update(Files.readAllBytes(file.toPath()));
        byte[] hash = messageDigest.digest();

        return DatatypeConverter.printHexBinary(hash).toUpperCase();
    }

    public static void main(String argv[]) throws NoSuchAlgorithmException, IOException {
        File file = new File("/Users/foo.bar/Documents/file.jar");          
        String hex = Checksum.generate(file);
        System.out.printf("hex=%s
"
, hex);            
    }


}

示例输出:

1
hex=B117DD0C3CBBD009AC4EF65B6D75C97B


GoogleGuava提供了一个新的API。在下面找到一个:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
public static HashCode hash(File file,
            HashFunction hashFunction)
                     throws IOException

Computes the hash code of the file using hashFunction.

Parameters:
    file - the file to read
    hashFunction - the hash function to use to hash the data
Returns:
    the HashCode of all of the bytes in the file
Throws:
    IOException - if an I/O error occurs
Since:
    12.0


如果您使用Ant来构建,这是非常简单的。将以下内容添加到build.xml中:

1
<checksum file="${jarFile}" todir="${toDir}"/>

其中jar file是要生成MD5的jar,todir是要放置MD5文件的目录。

更多信息。


这里是一个方便的变体,它使用了来自Java 9的EDCOX1,0和来自Java 11的EDCOX1 1。它不需要外部库,也不需要将整个文件加载到内存中。

1
2
3
4
5
6
7
8
9
10
11
public static String hashFile(String algorithm, File f) throws IOException, NoSuchAlgorithmException {
    MessageDigest md = MessageDigest.getInstance(algorithm);

    try(BufferedInputStream in = new BufferedInputStream((new FileInputStream(f)));
        DigestOutputStream out = new DigestOutputStream(OutputStream.nullOutputStream(), md)) {
        in.transferTo(out);
    }

    String fx ="%0" + (md.getDigestLength()*2) +"x";
    return String.format(fx, new BigInteger(1, md.digest()));
}

1
hashFile("SHA-512", Path.of("src","test","resources","some.txt").toFile());

退货

1
"e30fa2784ba15be37833d569280e2163c6f106506dfb9b07dde67a24bfb90da65c661110cf2c5c6f71185754ee5ae3fd83a5465c92f72abd888b03187229da29"

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
public static String getMd5OfFile(String filePath)
{
    String returnVal ="";
    try
    {
        InputStream   input   = new FileInputStream(filePath);
        byte[]        buffer  = new byte[1024];
        MessageDigest md5Hash = MessageDigest.getInstance("MD5");
        int           numRead = 0;
        while (numRead != -1)
        {
            numRead = input.read(buffer);
            if (numRead > 0)
            {
                md5Hash.update(buffer, 0, numRead);
            }
        }
        input.close();

        byte [] md5Bytes = md5Hash.digest();
        for (int i=0; i < md5Bytes.length; i++)
        {
            returnVal += Integer.toString( ( md5Bytes[i] & 0xff ) + 0x100, 16).substring( 1 );
        }
    }
    catch(Throwable t) {t.printStackTrace();}
    return returnVal.toUpperCase();
}