我有一个非常简单的教练,遵循示例目录结构:

/dist
  __init__.py
  setup.py
  /trainer
    __init__.py
    task.py


在/ dist目录下,在本地运行良好:

$ gcloud ml-engine local train
    --package-path=trainer
    --module-name=trainer.task


现在,当尝试部署它时,在/ dist目录和以下命令下:

$ gcloud ml-engine jobs submit training testA
    --package-path=trainer
    --module-name=trainer.task
    --staging-bucket=$JOB_DIR
    --region us-central1


它给我一个错误“无模块名称培训师”

INFO    2017-04-13 12:28:35 -0700   master-replica-0        Installing collected packages: pyyaml, scipy, scikit-learn, trainer
INFO    2017-04-13 12:28:38 -0700   master-replica-0        Successfully installed pyyaml-3.12 scikit-learn-0.18.1 scipy-0.18.1 trainer-0.1
INFO    2017-04-13 12:28:38 -0700   master-replica-0        Running command: python -m trainer.task
ERROR   2017-04-13 12:28:38 -0700   master-replica-0        /usr/bin/python: No module named trainer


编辑:
这是setup.py的内容

from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = [
    'pyyaml',
    'scipy==0.18.1',
    'scikit-learn'
]
setup(
    name='trainer',
    version='0.1',
    install_requires=REQUIRED_PACKAGES,
    include_package_data=True,
    description='Classifier test'
)


我究竟做错了什么?

谢谢,

中号

最佳答案

您在setup.py中缺少重要的一行,即packages函数调用的setup参数(参见these instructions)。试试这个:

from setuptools import find_packages
from setuptools import setup
REQUIRED_PACKAGES = ['pyyaml','scipy==0.18.1','scikit-learn']
setup(
    name='trainer',
    version='0.1',
    install_requires=REQUIRED_PACKAGES,
    packages=find_packages(),
    include_package_data=True,
    description='Classifier test'
)


我已经更新了CloudML Engine docs(可能要花几天的时间传播)。

我使用--package-path=trainer和上述更改复制了您的命令,并且一切都在云中正常运行。

最后,尽管它无害,但__init__.py中的dist/是不必要的,可以安全地删除。

关于google-cloud-ml - 没有名为培训师的模块,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/43400599/

10-12 19:39