社区
C#
帖子详情
如何判断一个文本文件的编码方式呢?
fhawk
2005-01-06 02:35:29
现有几个文本文件,各个文件的编码方式是不确定的,有的是Ascii,有的是unicode等等,请如一下,有什么方法可以判断这些文件的编码方式呢?
...全文
3336
5
打赏
收藏
如何判断一个文本文件的编码方式呢?
现有几个文本文件,各个文件的编码方式是不确定的,有的是Ascii,有的是unicode等等,请如一下,有什么方法可以判断这些文件的编码方式呢?
复制链接
扫一扫
分享
转发到动态
举报
写回复
配置赞助广告
用AI写文章
5 条
回复
切换为时间正序
请发表友善的回复…
发表回复
打赏红包
fhawk
2005-01-20
打赏
举报
回复
后来发现,这种方法只会对一些文本文件有效。有些Unicode文件,就不采用这种方式。也就是有些文件采用的是混合编码,不知这是为何?如何判断这样的文本文件呢?
谢谢!
fhawk
2005-01-06
打赏
举报
回复
收到,非常谢谢!
marvelstack
2005-01-06
打赏
举报
回复
需要判断文件流的前三个字节来判断编码。
或者使用
StreamReader sr = new StreamReader("filepath", true/*detectEncodingFromByteOrderMarks*/);
通常,当一个软件打开一个文本时,它要做的第一件事是决定这个文本究竟是使用哪种字
符集的哪种编码保存的。软件有几种途径来决定文本的字符集和编码,
最标准的途径是检测文本最开头的几个字节,楼主可以以不同编码保存后研究一下各种格式看看.比如
开头字节 Charset/encoding
EF BB BF UTF-8
FE FF UTF-16/UCS-2, little endian
FF FE UTF-16/UCS-2, big endian
FF FE 00 00 UTF-32/UCS-4, little endian.
00 00 FE FF UTF-32/UCS-4, big-endian.
chenyuming2004
2005-01-06
打赏
举报
回复
StreamReader sr=new StreamReader(@"F:\cym\temp\1.txt");
sr.CurrentEncoding //返回编码
AReed
2005-01-06
打赏
举报
回复
好像文本文件里是没有存放该文本的编码方式的,只是在读出的时候指定按什么方式来读出来,所以可能得不到一个文本文件的写入的时的编码方式.
零基础Linux命令详细案例讲解课程(第3季)--文本搜索和文本处理
文本处理:行或者指定字段排序、去重复行、文本剪切、文本合并、文件比较、字符替换,学习本内容后学员可熟练掌握文本处理相关命令 课程特色: 笔记Linux命令:用200条笔记串连所有知识点,让学员从一点一滴积累,...
如何
判断
文本文件
的编码格式?
这里指的文本是用于Windows系统中的扩展名为.txt的文件。Notepad(记事本)只支持四种格式:ANSI/...首先,不同编码的文本,是根据文本的前两个字节来定义其编码格式的。定义如下:ANSI: 无格式定义;Unicode:
C#
判断
一个
文本文件
的编码格式(转载)
文件的字符集在Windows下有两种,一种是ANSI,一种Unicode。...我们可以从文件的头部来区分
一个
文件是属于哪种编码。当头部开始的两个字节为 FF FE时,是Unicode的小尾编码;当头部的两个字节为FE FF时,是...
NET中
判断
一个
文本文件
的
编码方式
文件的字符集在Windows下有两种,一种是ANSI,一种Unicode。...我们可以从文件的头部来区分
一个
文件是属于哪种编码。当头部开始的两个字节为 FF FE时,是Unicode的小尾编码;当头部的两个字节为FE FF时,是U
C#
110,545
社区成员
642,580
社区内容
发帖
与我相关
我的任务
C#
.NET技术 C#
复制链接
扫一扫
分享
社区描述
.NET技术 C#
社区管理员
加入社区
获取链接或二维码
近7日
近30日
至今
加载中
查看更多榜单
社区公告
让您成为最强悍的C#开发者
试试用AI创作助手写篇文章吧
+ 用AI写文章