为了账号安全,请及时绑定邮箱和手机立即绑定

处理两个具有不同分隔的文件 Python 3

处理两个具有不同分隔的文件 Python 3

森林海 2021-12-16 15:59:34
我想获取两个文本文件并将它们写入/附加到一个文件中。每个文件都有不同的分隔符。有没有一种方法可以轻松检测定界?或者处理这种情况的简单方法?如何处理未知文件分隔?
查看完整描述

1 回答

?
尚方宝剑之说

TA贡献1788条经验 获得超4个赞

不,没有简单的方法来确定未指定的分隔符。事实上,人们可以很容易地构造出分隔符不明确的病理情况。

但是,您提供的示例带来了希望。看起来您的字段主要是字母数字数据——有时包括连字符、引号等——由常见的标点符号分隔。您可以阅读文件的几行并根据文本特征确定可能的分隔符。

识别字母数字字段并将其折叠为单个字符,例如A. 从剩余的字符中,寻找与这些字段或多或少交替出现的字符。使用优先考虑的列表,例如(制表符、逗号、空格等)并计算一些拟合优度,直到得到一个看起来可能的数字。使用它作为分隔符来读取文件。

一旦您正确摄取了每个文件的行,用csv包编写文件就很简单(请参阅在线示例)。


查看完整回答
反对 回复 2021-12-16
  • 1 回答
  • 0 关注
  • 158 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
微信客服

购课补贴
联系客服咨询优惠详情

帮助反馈 APP下载

慕课网APP
您的移动学习伙伴

公众号

扫描二维码
关注慕课网微信公众号