现在的位置: 首页 > 编程语言 > 正文

JAVA统计字符串中中文,英文,数字,空格,特殊字符的个数

2020年02月14日 编程语言 ⁄ 共 2877字 ⁄ 字号 评论关闭

引言

可以根据各种字符在Unicode字符编码表中的区间来进行判断,如数字为'0'~'9'之间,英文字母为'a'~'z'或'A'~'Z'等,Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 但通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果。所以通过Character.UnicodeBlock来进行判断。代码如下:

package cn.csrc.base.count;public class CountCharacter {  public static void main(String[] args) {    String str ="我爱你abcd123中国 #!";    CountCharacter countCharacter = new CountCharacter();    countCharacter.count(str);  }  /**中文字符 */  private int chCharacter = 0;  /**英文字符 */  private int enCharacter = 0;  /**空格 */  private int spaceCharacter = 0;  /**数字 */  private int numberCharacter = 0;  /**其他字符 */  private int otherCharacter = 0;  //记录中文字符   private StringBuilder sb1=new StringBuilder();  //记录英文字符   private StringBuilder sb2=new StringBuilder();  //记录数字   private StringBuilder sb3=new StringBuilder();  //记录特殊字符   private StringBuilder sb4=new StringBuilder();  /***  * 统计字符串中中文,英文,数字,空格等字符个数   * @param str 需要统计的字符串   */  public void count(String str) {    if(str.equals("") || str==null){      System.out.println("字符串为空");     return;   }    for (int i = 0; i < str.length(); i++) {      char tmp = str.charAt(i);      if ((tmp >= 'A' && tmp <= 'Z') || (tmp >= 'a' && tmp <= 'z')) {        enCharacter ++;        sb2.append(tmp+" ");      } else if ((tmp >= '0') && (tmp <= '9')) {        numberCharacter ++;        sb3.append(tmp +" ");      } else if (tmp ==' ') {        spaceCharacter ++;      } else if (isChinese(tmp)) {        chCharacter ++;        sb1.append(tmp+" ");      } else {        otherCharacter ++;        sb4.append(tmp +" ");      }    }      System.out.println("字符串:" + str + " \r\n");      System.out.println("中文字符有:" + chCharacter +"个 ("+sb1.toString()+")");      System.out.println("英文字符有:" + enCharacter +"个 ("+sb2.toString()+")");      System.out.println("数字有:" + numberCharacter+"个 ("+sb3.toString()+")");      System.out.println("空格有:" + spaceCharacter+"个");      System.out.println("其他字符有:" + otherCharacter+"个 ("+sb4.toString()+")");    }    /***    * 判断字符是否为中文     * @param ch 需要判断的字符     * @return 中文返回true,非中文返回false    */    private boolean isChinese(char ch) {      //获取此字符的UniCodeBlock      Character.UnicodeBlock ub = Character.UnicodeBlock.of(ch);      // GENERAL_PUNCTUATION 判断中文的“号       // CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号       if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS        || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOG  RAPHS_EXTENSION_B      || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {      System.out.println(ch + " 是中文");      //sb1.append(ch+" ");      return true;    }    return false;     }}

结果如下:

总结

以上所述是小编给大家介绍的JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

本文标题: JAVA 统计字符串中中文,英文,数字,空格,特殊字符的个数

以上就上有关JAVA统计字符串中中文,英文,数字,空格,特殊字符的个数的相关介绍,要了解更多java,统计字符串,特殊字符个数内容请登录学步园。

抱歉!评论已关闭.