如果判断一个字符串是UTF-8编码还是本地字符集编码
在网上找的UTF资料是这样的
根据首字节判断长度
0x00-0x7F 1字节
0xC0-0xDF 2字节
0xE0-0xEF 3字节
0xF0-0xF7 4字节
0xF8-0xFB 5字节
0xFC-0xFD 6字节
随字节的范围是0x80-0xBF
但是“食品”这两个字的GB2312编码完全符合UTF-8的2字节规范,它的HEX值是:
0xCA 0xB3 0xC6 0xB7
刚好0xCA和0xC6都在[0xC0-0xDF]范围里,而且0xB3和0xB7也符合[0x80-0xBF]的跟随字节范围,这就造成判断不准确了,请问还有更准确的判断方法么?