- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
文本文件与二进制文件区别
在学习 C 语言文件操作后,我们都会知道打开文件的函数是
fopen ,也知道它的第二个参数是标志字符串。其中,如果字符串
中出现 b ,则表明是以打开二进制 (binary) 文件,否则是打开文本
文件。
那么甚么是文本文件, 甚么是二进制文件呢 ? 可能大多数
人都没有仔细考虑过。
在 Windows 和 DOS 系统中,狭义的文本文件是指扩展名
为 txt 的文件。实际上,那些没有规定格式的, 由可理解的的 ASCII
以及其它编码文字组成的文件都是文本文件,如 C 源程序文件,
HTML 超文本, XML 。除此之外的其它文件都是二进制文件,如
Word 文件 DOC ,图像格式文件 JPG。
但是,所谓使用 fopen 标志打开文本文件与二进制文件的
说法并不准确。正确的说法应该是--以文本方式和二进制方式
打开文件。因为我们用两种方式都可以任意的文件。
即使这样,为甚么还要区分这两种方式呢 ?
这是因为这两种方式在读写文件时的操作是不一样的。
二进制方式很简单, 读文件时, 会原封不动的读出文件的
全部内容,写的时候,也是把内存缓冲区的内容原封不动的写到
文件中。
而文本方式就不一样了,在读文件时,会将换行符号
CRLF(0x0D 0x0A) 全部转换成单个的 0x0A ,并且当遇到结束符
CTRLZ(0x1A) 时,就认为文件已经结束。相应的,写文件时,会
将所有的 0x0A 换成 0x0D0x0A 。
所以, 若使用文本方式打开二进制文件时, 就很容易出现
文件读不完整,或内容不对的错误。即使是用文本方式打开文本
文件,也要谨慎使用,比如复制文件,就不应该使用文本方式。
要特别注意的是,上面这样的说法仅适用于 DOS 和
Windows 系统。在 Unix 和其它一些系统中, 没有文本方式和二进
制方式的区分,使不使用 b标志都是一样的。这是由于不同操作
系统对文本文件换行符的定义,和 C 语言中换行符的定义有所不
同而造成的。
如上文已提到, DOS 和 Windows 系统使用 CRLF(0x0D
0x0A) 双字节作为文本文件换行符,而 Unix 文本文件的换行符只
有一个字节 LF(0x0A) 为。在 C 语言中,也是以 LF 即\n为换行符。
由于 DOS/Windows 定义的换行符和 C 语言的不一致, C
语 言 的 标 准 输 入 输 出 函 数 进 行 读 写 文 本 文 件 时 , 就 进 行 了
CRLF-LF 的转换。而 Unix 的定义和 C 语言的是一样的, 就不必
转换了。
那么,为甚么会有定义不一致的情况呢, 这纯属历史原因。
当初 C 是在 Unix 上发展的, 对换行的定义自然就一样了。 其后 C
被引入到 DOS 系统,为了使原有的 C 程序能不加修改的读写 DOS
的文本文件, 所以就在文件读写上做了修改。 随着 DOS/Windows
成为主流平台,这个当初为了兼容而
原创力文档


文档评论(0)