为了账号安全,请及时绑定邮箱和手机立即绑定

使用 Pandas 以 .txt 格式保存拆分数据集

使用 Pandas 以 .txt 格式保存拆分数据集

白板的微信 2021-09-11 16:12:19
尝试将数据集吐出到train和test,然后需要将其保存为.txt格式。这是到目前为止的代码,import pandas as pdfrom sklearn.model_selection import train_test_splitcategory=pd.read_csv('dataset.tsv',delimiter='\t',encoding='utf-8')train, test = train_test_split(category, test_size=0.2)test.to_csv('checkme.txt')但是,当我尝试这样做时,它给出了错误:回溯(最近一次调用):文件“splitter.py”,第 8 行,在 test.to_csv('checkme.tsv') 文件“/home/abc/micro/micro/local/lib/python2.7/site- package/pandas/core/frame.py", line 1745, in to_csv formatter.save() 文件 "/home/abc/micro/micro/local/lib/python2.7/site-packages/pandas/io/formats/ csvs.py”,第 171 行,在保存 self._save() 文件“/home/abc/micro/micro/local/lib/python2.7/site-packages/pandas/io/formats/csvs.py”中,行286,在_save self._save_chunk(start_i,end_i)文件“/home/abc/micro/micro/local/lib/python2.7/site-packages/pandas/io/formats/csvs.py”,第313行,在_save_chunk self.cols, self.writer) 文件“pandas/_libs/writers.pyx”,第 64 行,在 pandas._libs.writers.write_csv_rows UnicodeEncodeError: 'ascii'编解码器无法对位置 111 中的字符 u'\u026a' 进行编码:序号不在范围内(128)这里可能有什么问题,以及如何解决这个问题?
查看完整描述

1 回答

  • 1 回答
  • 0 关注
  • 274 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信