本文主要是介绍Base4 应用及设计,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
在对Base64、Base32、Base16进行了原理分析和应用示例后,突然想起,有没有一种不可见的编码,在一般文本查看器时,无法直观的查看文本中的内容,从而达到隐藏原文的目的。当然这只是一种编码,并不会保证数据的安全性。
· ASCII 编码
首先,在进行编码设计之前,我们需要先了解一下ASCII编码表中,每个编码的表现形式,写一个测试类,把ASCII全部输出:
package com.arhorchin.securitit.codec.ascii;public class AsciiTester {public static void main(String[] args) throws Exception {for (int i = 0; i < 128; i++) {System.out.println((char) i);}}}
输出结果:
从输出结果可以看出,ASCII码中0-32和127属不可见字符,在不可见字符串中,不会产生占位的共4个字符:28、29、30、31,这4个字符在一般文本编辑器查看时,不会显示,当然,功能强大的编辑器会显示其本来面目。
· Base4 编码
使用ASCII码中28、29、30、31四个字符对字节数组进行分解,每个字节是8位,利用已有的四个字符将每个字节拆分为4个字节,工具类如下:
package com.arhorchin.securitit.codec.base;import java.io.ByteArrayOutputStream;
import java.io.DataOutputStream;
import java.io.IOException;
import java.nio.charset.Charset;public class Base4 {/*** 编码码位集合.*/private static final String Base4Tb = new String(new char[] { (char) 28, (char) 29, (char) 30, (char) 31 });private Base4() {}/*** Base4编码.* @param strData 待编码字符串.* @param charset 字符集.* @return 已编码字符串.*/public static String encodeBase4String(String strData, Charset charset) {return new String(encodeBase4(strData.getBytes(charset)), charset);}/*** Base4编码.* @param strData 待编码字节数组.* @param charset 字符集.* @return 已编码字符串.*/public static String encodeBase4String(byte[] binaryData, Charset charset) {return new String(encodeBase4(binaryData), charset);}/*** Base4编码.* @param strData 待编码字节数组.* @param charset 字符集.* @return 已编码字节数组.*/public static byte[] encodeBase4(byte[] binaryData) {ByteArrayOutputStream os = new ByteArrayOutputStream();for (byte item : binaryData) {short value = (short) (item & 0xFF);byte first = (byte) (value >> 6);byte second = (byte) (((value << 2) & 0xFF) >> 6);byte third = (byte) (((value << 4) & 0xFF) >> 6);byte fourth = (byte) (((value << 6) & 0xFF) >> 6);os.write(Base4Tb.charAt(first));os.write(Base4Tb.charAt(second));os.write(Base4Tb.charAt(third));os.write(Base4Tb.charAt(fourth));}return os.toByteArray();}/*** Base4解码.* @param strData 待解码字符串.* @param charset 字符集.* @return 已解码字符串.*/public static String decodeBase4String(String strData, Charset charset) {return new String(decodeBase4(strData.getBytes(charset)), charset);}/*** Base4解码.* @param strData 待解码字节数组.* @param charset 字符集.* @return 已解码字符串.*/public static String decodeBase4String(byte[] binaryData, Charset charset) {return new String(decodeBase4(binaryData), charset);}/*** Base4解码.* @param strData 待解码字节数组.* @param charset 字符集.* @return 已解码字节数组.*/public static byte[] decodeBase4(byte[] binaryData) {ByteArrayOutputStream bs = new ByteArrayOutputStream();byte[] raw = binaryData;for (int i = 0; i < raw.length; i++) {bs.write(raw[i]);}byte[] in = bs.toByteArray();if (in.length % 4 != 0) {return null;}bs.reset();DataOutputStream ds = new DataOutputStream(bs);for (int i = 0; i < in.length; i += 4) {byte first = (byte) Base4Tb.indexOf((char) in[i]);byte second = (byte) Base4Tb.indexOf((char) in[i + 1]);byte third = (byte) Base4Tb.indexOf((char) in[i + 2]);byte fourth = (byte) Base4Tb.indexOf((char) in[i + 3]);try {ds.writeByte((first << 6) + (second << 4) + (third << 2) + fourth);} catch (IOException e) {}}return bs.toByteArray();}}
测试类如下:
package com.arhorchin.securitit.codec.base;import java.nio.charset.Charset;public class Base4Tester {public static void main(String[] args) throws Exception {String plain = "我们将使用Base4编码格式对数据进行编码,查看编码后数据.";String codec = "";// Base4 编码.codec = Base4.encodeBase4String(plain, Charset.forName("UTF-8"));System.out.println("编码后数据:" + codec);System.out.println("编码后数据长度:" + codec.length());// Base4 解码.plain = Base4.decodeBase4String(codec, Charset.forName("UTF-8"));System.out.println("解码后数据:" + plain);System.out.println("解码后数据长度:" + plain.length());}}
测试类输入结果:
从输出结果中可以看出,编码后的数据在IDE的Console中是不占位的,但是长度是依然存在的。
· Base4 文件中表现
我们同样可以把内容输出到文件中。在不同的文本编辑器下,显示的效果略有不同,示例如下:
package com.arhorchin.securitit.codec.base;import java.io.File;
import java.nio.charset.Charset;import org.apache.commons.io.FileUtils;public class Base4FileTester {public static void main(String[] args) throws Exception {String plain = "我们将使用Base4编码格式对数据进行编码,查看编码后数据.";String codec = "";// Base4 编码.codec = Base4.encodeBase4String(plain, Charset.forName("UTF-8"));System.out.println("编码后数据:" + codec);System.out.println("编码后数据长度:" + codec.length());// 内容写入文件.FileUtils.writeStringToFile(new File("C:/Users/Administrator/Downloads/个人文件/Base4.txt"), codec);}}
文件在记事本中显示:
文件在EditPlus中显示:
文件在UltraEdit中显示:
文件在Notepad++中显示:
从上面这些图片可以看出,Notepad、EditPlus、UltraEdit不会显示编码后内容,Notepad++会显示编码后内容。
· 总结
· Base4是纯属娱乐开发的小玩意。
· Base4会使当前数据膨胀为原数据的4倍。
· Base4在某些文本编辑器中不会显示内容,但是文本大小实际是有原文内容大小决定的。
· Base4只是编码算法,并非秘钥算法,所以并不能在数据安全性等方面给予保证。
这篇关于Base4 应用及设计的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!