as400机器上的db2的varchar字段测试报告

superhanliu 2009-03-26 09:41:40
大家可能都知道,数据库的varchar字段在保存中文时,字段最大长度和可以保存的字符的最大数量可能是不相等的。

在Oracle中,varchar(100)可以保存50个纯汉字或100个纯字母或者数字。如果希望长度100的varchar保存100个汉字,可以将字段类型设置为nvarchar(这个不太确定,但是oracle确实有这个功能。n表示国际化的意思)

而在db2尤其是as400服务器下的db2,是怎么个情况,今天我们进行了一下测试。下面是测试报告:


数据库VARCHAR字段长度设置测试报告
测试时间:2009-01-16 14:00
测试用例:
数据库表:UserInfo 字段:password varchar(32)

操作记录:
执行SQL:
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热我'); --失败 16汉字
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热'); --成功 15汉字
update usrinfo set password='我使中国热我使中国热我使中国热1' where id='xxxx'; --失败 15汉字1数字
update usrinfo set password='我使中国热我使中国热我使中国热a' where id='xxxx'; --失败 15汉字1字母


update usrinfo set password='012345678901234567890123456789' where id='xxxx'; --成功 30数字
update usrinfo set password='01234567890123456789012345678901' where id='xxxx'; --成功 32数字
update usrinfo set password='012345678901234567890123456789我' where id='xxxx'; --失败 30数字1汉字


update usrinfo set password='0123456789我使中国热0123456789' where id='xxxx'; --成功 20数字5汉字
select length(password) from usrinfo where usr_id='xxxx' ---32


update usrinfo set password='0我1使2中3国4热' where id='xxxx'; --成功
select length(password) from usrinfo where usr_id='xxxx' ---25


结论:
1 每个汉字占用2个字符空间
2 每段汉字再额外占用2个字符空间(可能是辨别标识?)
3 每个字母或数字占用1个字符空间

----->假设需要保存1000个字(汉字、字母、数字都允许),那么数据库字段最少的长度应该是:
最极限的情况是:单个汉字和字母(数字)连续间隔出现,即形式如下:
汉1字2是3好a.......(假设总字符数是x,x是偶数)
那么汉字个数是x/2,字母数字个数是x/2,为保证该字段的insert和update不报错,字段最少的长度是===>
x/2*2 汉字占用字符数
+
x/2*1 字母数字占用字符数
+
x/2*2 每段汉字占用的标识位数
=2.5x

===================>>>所以,如果需求要求可输入1000个字符,那么数据库保证不出错误的长度应该是2500,而不是我们通常认为的2000!!!




...全文
391 5 打赏 收藏 转发到动态 举报
写回复
用AI写文章
5 条回复
切换为时间正序
请发表友善的回复…
发表回复
superhanliu 2009-05-07
  • 打赏
  • 举报
回复
[Quote=引用 3 楼 wguxin 的回复:]
我们公司用1AS400 , 表中的列用的是 GRAPHIC(n), 比如GRAPHIC(10) , 可以存储任何的10 个字符(只不过存储时每个字符占2个字节)
[/Quote]

哦,原来这样啊。以前还真不知道,刚才看你说,我试了一下果然是有这样的数据类型。。。
这个类型很奇怪啊。。。。
txm207 2009-04-17
  • 打赏
  • 举报
回复
学习
wguxin 2009-04-03
  • 打赏
  • 举报
回复
我们公司用1AS400 , 表中的列用的是 GRAPHIC(n), 比如GRAPHIC(10) , 可以存储任何的10 个字符(只不过存储时每个字符占2个字节)
fenyun61 2009-04-01
  • 打赏
  • 举报
回复
汉字的两边会自动补两个空格的

5,889

社区成员

发帖
与我相关
我的任务
社区描述
IBM DB2 是美国IBM公司开发的一套关系型数据库管理系统,它主要的运行环境为UNIX(包括IBM自家的AIX)、Linux、IBM i(旧称OS/400)、z/OS,以及Windows服务器版本
社区管理员
  • DB2
加入社区
  • 近7日
  • 近30日
  • 至今
社区公告
暂无公告

试试用AI创作助手写篇文章吧