汉字gbk编码(为什么有些字体有GBK字母)
本文目录
为什么有些字体有GBK字母
GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称ChineseInternalCodeSpecification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。GB2312码是中华人民共和国国家汉字信息交换用编码,全称《信息交换用汉字编码字符集——基本集》,1980年由国家标准总局发布。基本集共收入汉字6763个和非汉字图形字符682个,通行于中国大陆。新加坡等地也使用此编码。GBK是对GB2312-80的扩展,也就是CP936字码表(CodePage936)的扩展(之前CP936和GB2312-80一模一样)。GB2312的出现,基本满足了汉字的计算机处理需要,但对于人名、古汉语等方面出现的罕用字,GB2312不能处理,这导致了后来GBK及GB18030汉字字符集的出现。 GBK采用双字节表示,总体编码范围为8140-FEFE,首字节在81-FE之间,尾字节在40-FE之间,剔除xx7F一条线。总计23940个码位,共收入21886个汉字和图形符号,其中汉字(包括部首和构件)21003个,图形符号883个。P-Windows3.2和苹果OS以GB2312为基本汉字编码,Windows95/98则以GBK为基本汉字编码。 有些汉字用五笔和拼音都打不出来,如:溙(五笔IDWI),须调出GBK字符集才能打出这个字。极品五笔中可右击输入法图标,设置,属性中选GBK字符集。极点五笔中可点击工具条中相关图标进行转换。
java中如何得到输入的汉字的GBK编码
/* * To change this license header, choose License Headers in Project Properties. * To change this template file, choose Tools | Templates * and open the template in the editor. */package cn.timecd.gyhhy.mscup;import java.io.UnsupportedEncodingException;import java.nio.charset.Charset;import java.util.Arrays;import java.util.logging.Level;import java.util.logging.Logger;/** * 主要涉及到 String 类的 getBytes 方法 * @author 32798 */public class Test { public static void main(String args){ // 预定义常量 String charset = “gbk“;// 编码 // 请注意,找不到编码集的时候,下面这句代码 会抛出 // java.nio.charset.UnsupportedCharsetException Charset charset$ = Charset.forName(charset); // 获取编码集 // 只是阅读: 两个 变量名字 比较, 请注意区分 // charset // charset$ // 从 string 转 bytes String str = “这是一个测试文本“; try { // 方法一: 直接通过 编码集的名字 转码 // 需要 try-catch // 当字符集找不到时会抛出 java.io.UnsupportedEncodingException System.out.println(Arrays.toString(str.getBytes(charset))); } catch (UnsupportedEncodingException ex) { Logger.getLogger(Test.class.getName()).log(Level.SEVERE, null, ex); } // 方法二: 通过 编码集(java.nio.charset.Charset) 转码 // 不需要 try-catch System.err.println(Arrays.toString(str.getBytes(charset$))); try { Thread.sleep(200); // 只是为了让 ide 能按顺序输出 } catch (InterruptedException ex) {} // 从bytes 转 string //byte bytes = {-78, -35, -60, -32, -62, -19}; byte bytes = str.getBytes(charset$);// 只是为了获取测试文本的 gbk 码 System.out.print(“\n\n\n“); // 隔出3行, 免得跟之前的输出混淆 try { // 方法一: 通过 编码集名字 新建一个 string // 需要 try-catch // 当字符集找不到时会抛出 java.io.UnsupportedEncodingException System.out.println(new String(bytes, charset)); } catch (UnsupportedEncodingException ex) { Logger.getLogger(Test.class.getName()).log(Level.SEVERE, null, ex); } // 方法二: 直接通过 字符集 新建一个 string System.err.println(new String(bytes, charset$)); }}
更多文章:

js随机数5到10(js随机输出设定5,6,9,10这4个数字,是每次只输出其中的一个数字)
2025年3月8日 16:00

ethnic group(学校申请书上要填ethnic group 黄种人用英语怎么说呢)
2025年2月13日 22:40

全球一线游戏制作公司有哪些?高中毕业,能学习游戏开发吗有前途吗
2025年3月11日 17:00

制作代码的软件(我想自己制作网页,对源代码不懂.请问用什么软件好)
2025年2月25日 20:40

accustomed to do还是doing(be accustomed to 是接doing 还是接do)
2025年3月9日 17:50