java unsigned char_如何安全地将Java字节用作unsigned char?

  • Post author:
  • Post category:java


我正在移植一些在

Java中使用大量位操作的C代码. C代码在假设int为32位宽且char为8位宽的情况下运行.其中有断言检查这些假设是否有效.

我已经接受了这样一个事实:我将不得不使用long代替unsigned int.但我可以安全地使用byte作为unsigned char的替代品吗?

它们只代表字节,但我已经遇到了这个奇怪的事件:(数据是C中的unsigned char *和Java中的byte []):

/* C */

uInt32 c = (data[0] << 24) | (data[1] << 16) | (data[2] << 8) | data[3];

/* Java */

long a = ((data[0] << 24) | (data[1] << 16) | (data[2] << 8) | data[3]) & 0xffffffff;

long b = ((data[0] & 0xff) << 24) | ((data[1] & 0xff) << 16) |

((data[2] & 0xff) << 8) | (data[3] & 0xff) & 0xffffffff;

你会认为左移操作是安全的.但是由于Java中奇怪的一元推广规则,如果数据中的某些字节是“负数”(b给出正确的结果),则a和b不会相同.

我应该注意哪些其他“陷阱”?我真的不想在这里使用短片.

最佳答案 如果在计算中使用它之前确保将其值与255(或0xFF)进行按位和运算,则可以安全地使用一个字节来表示0到255之间的值.这将它提升为int,并确保提升的值介于0到255之间.

否则,整数提升将导致-128和127之间的int值,使用符号扩展名. -127作为字节(十六进制0x81)将变为-127作为int(十六进制0xFFFFFF81).

所以你可以这样做:

long a = (((data[0] & 255) << 24) | ((data[1] & 255) << 16) | ((data[2] & 255) << 8) | (data[3] & 255)) & 0xffffffff;

注意第一个&这里不需要255,因为后面的步骤无论如何都掩盖了额外的比特(& 0xffffffff).但是,总是包含它可能是最简单的.



版权声明:本文为weixin_42240669原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。