为了账号安全,请及时绑定邮箱和手机立即绑定

如何检测文件的编码?

如何检测文件的编码?

Go
潇潇雨雨 2021-04-30 18:17:18
我正在尝试找出使用Go在Windows上文件的编码。经过一些研究,我发现了许多关于Mozilla的字符集检测器(chardet)的建议,但是它们很难编译,而且我没有运气。我还发现了libguess,它似乎已在Linux中广泛使用,但我无法使其在Windows中工作。最好的方法是什么?在Windows上是否可以使用事实上的标准库?
查看完整描述

2 回答

?
函数式编程

TA贡献1807条经验 获得超9个赞

您可以使用pythonpackage:chardet


查看完整回答
反对 回复 2021-05-10
?
jeck猫

TA贡献1909条经验 获得超7个赞

您可能对Enca(极端幼稚的字符集分析器)感兴趣。我猜您可以尝试使用所有候选编码读取文件,并计算每种尝试与该语言的“标准”字符频率分布之间的距离。Enca需要一些语言信息,但是我不确定它是否使用这种方法。(这只是一个主意,可能会被误导。)

查看完整回答
反对 回复 2021-05-10
  • 2 回答
  • 0 关注
  • 193 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信