为了账号安全,请及时绑定邮箱和手机立即绑定

用Python从文件中读取字符

用Python从文件中读取字符

偶然的你 2019-11-11 14:16:03
在文本文件中,有一个字符串“我不喜欢这样”。但是,当我将其读取为字符串时,它变为“我不这样\ xe2 \ x80 \ x98t”。我了解\ u2018是“'”的Unicode表示形式。我用f1 = open (file1, "r")text = f1.read()命令来做阅读。现在,是否可以以这样的方式读取字符串,即当将其读入字符串时,它是“我不喜欢这样”而不是“我不喜欢这样”吗?第二编辑:我见过有人使用映射解决此问题,但实际上,没有内置的转换可以将这种ANSI转换为unicode(反之亦然)吗?
查看完整描述

3 回答

?
大话西游666

TA贡献1817条经验 获得超14个赞

但这确实是“我不喜欢这样”而不是“我不喜欢这样”。字符u'\ u2018'与“'”是完全不同的字符(并且在视觉上应更对应于“`”)。


如果您尝试将编码的unicode转换为纯ASCII,则可以保留要转换为ASCII的unicode标点的映射。


punctuation = {

  u'\u2018': "'",

  u'\u2019': "'",

}

for src, dest in punctuation.iteritems():

  text = text.replace(src, dest)

unicode中有很多标点字符,但是我想您只能指望其中的几个实际上被创建您正在阅读的文档的任何应用程序所使用。


查看完整回答
反对 回复 2019-11-11
  • 3 回答
  • 0 关注
  • 1138 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信