我正在训练一个大型模型,试图在 Azure 笔记本中使用Azure 机器学习服务。因此,我创建了一个Estimator在本地进行培训:from azureml.train.estimator import Estimatorestimator = Estimator(source_directory='./source_dir', compute_target='local', entry_script='train.py')(我train.py应该从一个大的词向量文件开始加载和训练)。运行时run = experiment.submit(config=estimator)我得到训练异常:====================================================================尝试拍摄 /data/home/username/notebooks/source_dir 的快照时,您的总快照大小超过 300.0 MB 的限制。请参阅 http://aka.ms/aml-largefiles了解如何处理大文件。====================================================================错误中提供的链接可能已损坏。我的内容./source_dir确实超过了 300 MB。我该如何解决这个问题?
2 回答
喵喔喔
TA贡献1735条经验 获得超5个赞
在我阅读了 GitHub 问题Encounter |total Snapshot size 300MB while start logging和官方文档Manage and request quotas for Azure resources for Azure ML service 后,我认为这是一个未知问题,需要一些时间等待 Azure 修复。
同时,我建议您可以尝试将当前工作迁移到其他服务Azure Databricks,上传您的数据集和代码,然后在托管在 HDInsight Spark Cluster 上的 Azure Databricks notebook 中运行它,而无需担心内存或存储限制。你可以在 Azure Databricks 上参考Azure ML 的这些示例。
添加回答
举报
0/150
提交
取消
