iso-8859-1表示中文汉字

Post author:xfxia
Post published:2023年7月23日
Post category:其他

中文汉字字符用”iso-8859-1″表示

你们应该都有遇到过这种问题，就是

utf-8或者gbk编码格式的中文字符，若转成”iso-8859-1″编码格式，则会变成乱码

，为什么呢？那我们得先知道以下知识点。

1.

utf-8

存储中文汉字用的是

3个字节

2.

“gbk”

存储中文汉字用的是

2个字节

3.

iso-8859-1

存储任何字符都是

1个字节

知道这个之后就能原因明朗了，本来是用三个字节或两个字节存的内容，你用一个字节存，这能不出事吗？能不变成乱码吗？

那就转化不了了吗？

我就再想，存不下，那就多分几个字节存呗，汉字总是可以用iso-8859-1编码表示的！

后来就找到了

org.apache.commons.lang

这个包下的这个

类StringEscapeUtils

，里面就有

escape

或者unescape

静态方法

，用其中一个就好了，我这里用的escapeHtml方法，如下图所示：

在这里插入图片描述

在操作xml的导入导出时，就有用到哦！

我在JTopo图的导入导出xml文件时，就遇到这个问题了！

原文链接：https://blog.csdn.net/qq_42307562/article/details/103427042

中文汉字字符用”iso-8859-1″表示

你可能也喜欢