为了账号安全,请及时绑定邮箱和手机立即绑定

如何使用 gensim 在 Windows 上运行 word2vec

如何使用 gensim 在 Windows 上运行 word2vec

梵蒂冈之花 2021-09-14 20:24:27
几年前,我团队的一位前任开发人员编写了以下 Python 代码,调用 word2vec,传入训练文件和输出文件的位置。他在 Linux 上工作。我被要求让它在 Windows 机器上运行。请记住,我几乎不知道 Python,我已经安装了 Gensim,我猜它现在实现了 word2vec,但不知道如何重写代码以使用库而不是在 Windows 上似乎无法编译的可执行文件盒子。有人可以帮我更新此代码吗?#!/usr/bin/env python3import osimport csvimport subprocessimport shutilfrom gensim.models import word2vecdef train_word2vec(trainFile, output):    # run word2vec:    subprocess.run(["word2vec", "-train", trainFile, "-output", output,                    "-cbow", "0", "-window", "10", "-size", "100"],                   shell=False)    # Remove some invalid unicode:    with open(output, 'rb') as input_,\         open('%s.new' % output, 'w') as new_output:        for line in input_:            try:                print(line.decode('utf-8'), file=new_output, end='')            except UnicodeDecodeError:                print(line)                pass    shutil.move('%s.new' % output, output)def main():    train_word2vec("c:/temp/wc/test1_BigF.txt", "c:/temp/wc/test1_w2v_model.txt")if __name__ == '__main__':    main()
查看完整描述

2 回答

  • 2 回答
  • 0 关注
  • 185 浏览
慕课专栏
更多

添加回答

举报

0/150
提交
取消
意见反馈 帮助中心 APP下载
官方微信