标准科研

    汉字编码技术有了自主国标——解读汉信码及《汉信码》国家标准

    时间:2011-12-08 来源:中国质量新闻网 作者: 阅读:

    从2008年2月1日起,一项具有我国自主知识产权,特别适用于以汉字作为信息交换重要手段的《汉信码》国家标准将开始实施。这项凝聚着国家“十五”重大科技专项《二维条码新码制开发与关键技术标准研究》多项重要成果的国家标准,将使我国二维条码的应用进入一个崭新的阶段。

    《汉信码》(GB/21049-2007)国家标准已于8月23日由国家质检总局和国家标准化管理委员会发布。该标准对汉信码的符号结构、信息编译码方法、纠错编译码算法、信息排布方法、参考译码算法等内容进行了详细描述,适合于在我国各行业广泛应用。

    汉字信息编码的最佳选择

    在10月12日举行的《汉信码》国家标准发布会上,记者看到,存储在电脑中的一张照片、一段音乐、一份文件,在中国物品编码中心科研人员操作的汉信码生成、识读系统的演示中,先是从打印机中打出一张张二维条码标签,再用自动识别设备扫描这些标签时,电脑上显示了同样清晰的照片和文件,播放了同样悦耳的音乐。

    据标准主要起草人、中国物品编码中心工程师王毅介绍,汉信码具有超强的汉字编码能力和极强的抗污损、抗畸变识读能力,识读速度快,信息容量大、密度高,纠错能力强、图形美观等优势并支持加密技术。《汉信码》国家标准是国家“十五”重大科技专项《二维条码新码制开发与关键技术标准研究》的一项重要成果,这项研究形成了包括纠错编码方法、数据信息的编码方法、二维条码编码的汉字信息压缩方法、生成二维条码的方法、二维条码符号转换为编码信息的方法以及二维条码图形畸变校正的方法等6项专利成果。《汉信码》国家标准引言中还特别提出:“专利持有人已向本标准的发布机构保证,任何申请人皆可免费获得使用授权许可。”

    超强的汉字编码能力。汉信码目前是惟一一个能够全面支持我国汉字信息编码强制性国家标准《信息技术 信息交换用汉字编码字符集 基本集的扩充》的二维条码,能够表示该标准中规定的全部常用汉字、二字节汉字、四字节汉字,同时支持该标准在未来的扩展。在汉字信息编码效率方面,对于常用的双字节汉字采用12位二进制数进行表示,在现有的二维条码中表示汉字效率最高。

    极强的抗污损、抗畸变识读能力。物流环境千差万别,这不可避免地会给条码符号造成污损,同时由于识读角度不垂直、镜头曲面畸变、所贴物品表面凹凸不平等原因,也会造成二维条码符号的畸变。为解决这些问题,汉信码在码图和纠错算法、识读算法方面进行了专门的优化设计,从而使汉信码具有极强的抗污损、抗畸变识读能力。现在汉信码能够在倾角为60度的情况下准确识读,能够容忍较大面积的符号污损,特别适合于在物流等恶劣条件下使用。

    识读速度快。为提高二维条码的识读效率,满足物流、票据等实时应用系统的迫切需求,汉信码在信息编码、纠错编译码、码图设计方面采用了多种技术手段提高了汉信码的识读速度,目前汉信码的识读速度比国际上的主流二维条码要高出90%~60%,因此汉信码能够广泛地在生产线、物流、票据等实时性要求高的领域中应用。

    信息密度高。为提高汉信码的信息表示效率,汉信码在码图设计、字符集划分、信息编码等方面充分考虑了这一需求,从而提高了汉信码的信息,特别是汉字信息的表示效率。当对大量汉字进行编码时,相同信息内容的汉信码符号面积大大低于国际主流二维条码符号的面积,汉信码是表示汉字信息的首选码制。

    信息容量大。汉信码最多可以表示7827个数字字符,4350个字母型字符,2174个汉字字符,二字节汉字1739个字符,四字节汉字1044个字符,二进制数据3261个字节,同时支持照片、指纹、掌纹、签字、声音、文字等数字化信息的编码。

    纠错能力强。根据汉信码自身的特点以及实际应用需求,采用最先进的纠错算法,设计了4种纠错等级,适应于各种应用情形,最大纠错能力可以达到30%,在性能上接近并超越现有国际上通行的主流二维条码码制。

    支持加密技术。汉信码是第一种在码制中预留加密接口的条码,它可以与各种加密算法和密码协议进行集成,因此具有极强的保密防伪性能。

    图形美观。从码图的总体外观上看,特征明显,方向感强,美观整齐,凹凸有致,有立体美感。

    王毅说,汉信码可以表示数字、英文字母、汉字、图像、声音、多媒体等一切可以二进制化的信息;可以将照片、指纹、掌纹、签字、声音、文字等凡可数字化的信息进行编码;可以在纸张、卡片、PVC、甚至金属表面上印出,所增费用仅是油墨的成本,堪称是“零成本”的技术。

    瞄准应用制定的标准

    组织制定《汉信码》国家标准的中国物品编码中心,具有雄厚的研究实力和丰富的标准制修订经验,我国条码领域的国家标准,均由该中心组织制定。但该标准并非中国物品编码中心独家完成,两家业内知名的企业即北京网络畅想科技发展有限公司和北京意锐新创科技有限公司及相关领域的专家学者也参加了标准的制定工作。

    尤其重要的是,《汉信码》国家标准制定的过程中,就已在物流、铁路、教育等行业建立了6个应用试点。其中,北京西南物流中心项目以及天津天保冈谷国际物流有限公司项目达到了10个以上扫描点、一万次以上的扫描规模。

    据中国自动识别技术协会秘书长谢颖介绍,建立这些试点的主要目的,就是为了验证《汉信码》国家标准制定过程中可能出现的技术问题。标准制定的过程中,起草组认真研究了各试点反馈的信息,并根据这些信息对标准中的相关要求进行了必要的修改,使这项标准更加科学,更加适用。

    据介绍,与北京西南物流中心联系的出版社、图书批销中心、书店、图书馆普遍认为,汉信码的应用能够极大地推动图书行业的信息化进程。北京西南物流中心应用汉信码规范了工作流程,提升了工作效率,实现了与上下游企业的业务数据交换,经济效益和社会效益都非常明显。天津天保冈谷国际物流有限公司通过在其供应链管理系统中使用汉信码,实现了货物的批次管理,不同渠道的产品通过产品的批次信息得到区分,提升了客户服务水平,有效地提了高物流企业的管理水平和服务水平,可以显著增强物流企业的核心竞争力。

    2005年12月,由倪光南、何德全两位院士担任组长的专家组对《二维条码新码制开发与关键技术标准研究》进行了鉴定,专家们一致认为,该课题攻克了二维条码码图设计、汉字编码方案、纠错编译码算法、符号识读与畸变矫正等关键技术,研制的汉信码具有抗畸变、抗污损能力强,信息容量高等特点,达到了国际先进水平。这项研究最重要的成果《汉信码》国家标准通过审定。

    从一维条码到二维条码

    人们通常看到的印刷在商品包装上的条码是一维条码,一维条码在商业POS(Point of sales)结算和流通等领域已广泛应用,社会效益和经济效益十分显著。但由于受信息容量的限制,一维条码通常只是对物品的类别进行标识,而不能对物品的属性进行描述。而且,在一维条码的应用系统中,对商品的属性信息,如生产日期、价格等的描述必须依赖数据库的支持,没有预先建立商品数据库或不便联网的地方也就不能使用一维条码。

    现代信息管理迫切需要在条码有限的几何空间内表示更多的信息,以满足千变万化的信息表示的需要。由于受信息容量和生成原理的限制,一维条码不能表示汉字和图像信息。二维条码的出现,大大弥补了一维条码的不足,解决了对物品属性进行描述的问题,使条码真正成为信息存储和识别的有效工具。二维条码的符号在水平和垂直两个方向均可以表示数据信息,具有信息容量大、可靠性高、可表示图像、汉字等多种文字信息、保密防伪性强等优点。

    根据生成原理和结构形状,二维条码可分为行排式二维条码和矩阵式二维条码。行排式二维条码是在一维条码的基础上,通过两行或多行高度截短后的一维条码的堆积,在增加行识别、错误纠正等特性的基础上来实现信息表示。矩阵式二维条码在结构形状上具有矩阵的特征,它以计算机图像处理技术为基础,用深色点的方点或圆点表示二进制的“1”,浅色点表示二进制的“0”,用不同的排列组合表示数据信息。

    我国对二维条码技术的研究开始于上世纪90年代初,经历了从二维码共性技术研究的起步,到自主创新的新型二维码研究,走出了一条从技术引进吸收到自主创新的发展之路。目前已出现汉信码、龙贝码、点众码等一批国产二维条码。其中,汉信码成为第一个具有我国自主知识产权的二维条码的国家标准。

      相关文章------分隔线----------------------------