java 判断字符串中是否包含中文 以及 字母数字 处理字母以及汉字和数字

  • Post author:
  • Post category:java


package cn.gwssi.app;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class China {

public static void main(String[] args) {
   
	String fileName = "我和你dfasdfasd</";
	String file1 = "我和你";
	String file2 = "asdf";
	String file3 = "sd</";

// System.out.println(filterChinese(fileName));

   System.out.println( filterChineseAndWord(fileName) );
   String result = filterChineseAndWord(fileName);
   
   if (file1.contains(result)) {
	   System.out.println( "file1" );
   }
   if (file2.contains(result)) {
	   System.out.println( "file2" );
   }
   if (file3.contains(result)) {
	   System.out.println( "file3" );
   }
}

/**
 * 校验String是否全是中文
 *
 * @param name 被校验的字符串
 * @return true 代表全是汉字
 */
public static boolean checkNameChese(String name) {
    boolean res = true;
    char[] cTemp = name.toCharArray();
    for (int i = 0; i < name.length(); i++) {
        if (!isRightChar(cTemp[i])) {
            res = false;
            break;
        }
    }
    return res;
}

/**
 * 验证是否是汉字 或 者0-9、a-z、A-Z
 *
 * @param c
 *  被验证的char
 * @return true代表符合条件
 */
public static boolean isRightChar(char c) {
    return isChinese(c) || isWord(c);
}

/**
 * 校验某个字符是否是a-z、A-Z、_、0-9
 *
 * @param c 被校验的字符
 * @return true 代表符合条件
 */
public static boolean isWord(char c) {
    String regEx = "[\\w]";
    Pattern p = Pattern.compile(regEx);
    Matcher m = p.matcher("" + c);
    return m.matches();
}

/**
 * 判定输入的是否是汉字
 *
 * @param c 被校验的字符
 * @return true 代表是汉字
 */
public static boolean isChinese(char c) {
    Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
    if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
            || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
            || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
            || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
            || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
        return true;
    }
    return false;
}

/**
 * 判断字符串中是否包含中文
 * @param str
 * 待校验字符串
 * @return 是否为中文
 * @warn 不能校验是否为中文标点符号
 */
public static boolean isContainChinese(String str) {
    Pattern p = Pattern.compile("[\u4e00-\u9fa5]");
    Matcher m = p.matcher(str);
    if (m.find()) {
        return true;
    }
    return false;
}

/**
 * 过滤掉中文
 * @param str 待过滤中文的字符串
 * @return 过滤掉中文后字符串
 */
public static String filterChinese(String str) {
    // 用于返回结果
    String result = str;
    boolean flag = isContainChinese(str);
    if (flag) {// 包含中文
        // 用于拼接过滤中文后的字符
        StringBuffer sb = new StringBuffer();
        // 用于校验是否为中文
        boolean flag2 = false;
        // 用于临时存储单字符
        char chinese = 0;
        // 5.去除掉文件名中的中文
        // 将字符串转换成char[]
        char[] charArray = str.toCharArray();
        // 过滤到中文及中文字符
        for (int i = 0; i < charArray.length; i++) {
            chinese = charArray[i];
            flag2 = isChinese(chinese);
            if (!flag2) {// 不是中日韩文字及标点符号
                sb.append(chinese);
            }
        }
        result = sb.toString();
    }
    return result;
}

/**
 * 过滤掉 中文 以及 a-z、A-Z、_、0-9
 * @param str 待过滤中文的字符串
 * @return 过滤掉中文后字符串
 */
public static String filterChineseAndWord(String str) {
    // 用于返回结果
    String result = str;
    boolean flag = isContainChinese(str);
    if (flag) {// 包含中文
        // 用于拼接过滤中文后的字符
        StringBuffer sb = new StringBuffer();
        // 用于校验是否为中文
        boolean flag2 = false;
        // 用于校验是否为字母以及数字
        boolean flag3 = false;
        // 用于临时存储单字符
        char chinese = 0;
        // 5.去除掉文件名中的中文
        // 将字符串转换成char[]
        char[] charArray = str.toCharArray();
        // 过滤到中文及中文字符
        for (int i = 0; i < charArray.length; i++) {
            chinese = charArray[i];
            flag2 = isChinese(chinese);
            flag3 = isWord(chinese);
            if (!flag2 && !flag3 ) {// 不是中日韩文字及标点符号
                sb.append(chinese);
            }
        }
        result = sb.toString();
    }
    return result;
}

/**
 * 校验一个字符是否是汉字
 *
 * @param c
 *  被校验的字符
 * @return true代表是汉字
 */
public static boolean isChineseChar(char c) {
    try {
        return String.valueOf(c).getBytes("UTF-8").length > 1;
    } catch (Exception e) {
        e.printStackTrace();
        return false;
    }
}

/**
 * 验证字符串内容是否包含下列非法字符<br>
 * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
 *
 * @param content
 *  字符串内容
 * @return 't'代表不包含非法字符,otherwise代表包含非法字符。
 */
public static char validateLegalString(String content) {
    String illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
    char isLegalChar = 't';
    L1: for (int i = 0; i < content.length(); i++) {
        for (int j = 0; j < illegal.length(); j++) {
            if (content.charAt(i) == illegal.charAt(j)) {
                isLegalChar = content.charAt(i);
                break L1;
            }
        }
    }
    return isLegalChar;
}



/**
 * 校验String是否全是中文
 *
 * @param name
 *  被校验的字符串
 * @return true代表全是汉字
 */
public static boolean checkNameisWord(String name) {
    boolean res = true;
    char[] cTemp = name.toCharArray();
    for (int i = 0; i < name.length(); i++) {
        if (!isWord(cTemp[i])) {
            res = false;
            break;
        }
    }
    return res;
}

}



版权声明:本文为qq_41035192原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。