1 files changed, 120 insertions, 0 deletions
diff --git a/var/spack/repos/builtin/packages/py-horovod/package.py b/var/spack/repos/builtin/packages/py-horovod/package.py
new file mode 100644
index 0000000000..598e01c6f9
--- /dev/null
+++ b/var/spack/repos/builtin/packages/py-horovod/package.py
@@ -0,0 +1,120 @@
+# Copyright 2013-2019 Lawrence Livermore National Security, LLC and other
+# Spack Project Developers. See the top-level COPYRIGHT file for details.
+#
+# SPDX-License-Identifier: (Apache-2.0 OR MIT)
+
+
+class PyHorovod(PythonPackage):
+    """Horovod is a distributed deep learning training framework for
+    TensorFlow, Keras, PyTorch, and Apache MXNet."""
+
+    homepage = "https://github.com/horovod"
+    git      = "https://github.com/horovod/horovod.git"
+
+    maintainers = ['adamjstewart']
+
+    version('master', branch='master', submodules=True)
+    version('0.19.1', tag='v0.19.1', submodules=True)
+    version('0.19.0', tag='v0.19.0', submodules=True)
+    version('0.18.2', tag='v0.18.2', submodules=True)
+    version('0.18.1', tag='v0.18.1', submodules=True)
+    version('0.18.0', tag='v0.18.0', submodules=True)
+    version('0.17.1', tag='v0.17.1', submodules=True)
+    version('0.17.0', tag='v0.17.0', submodules=True)
+    version('0.16.4', tag='v0.16.4', submodules=True)
+    version('0.16.3', tag='v0.16.3', submodules=True)
+    version('0.16.2', tag='v0.16.2', submodules=True)
+
+    # Deep learning frameworks
+    variant('pytorch',    default=True,  description='Enables PyTorch')
+    variant('tensorflow', default=False, description='Enables TensorFlow')
+    variant('mxnet',      default=False, description='Enables Apache MXNet')
+
+    # Distributed support
+    variant('gloo', default=False, description='Enables features related to distributed support')
+    variant('mpi',  default=True,  description='Enables MPI build')
+
+    # GPU support
+    variant('cuda', default=True, description='Enables CUDA build')
+    variant('gpu_allreduce', default='mpi',
+            description='Backend to use for GPU_ALLREDUCE',
+            values=('mpi', 'nccl'), multi=False)  # DDL support is deprecated
+    variant('gpu_allgather', default='mpi',
+            description='Backend to use for GPU_ALLGATHER',
+            values=('mpi',), multi=False)
+    variant('gpu_broadcast', default='mpi',
+            description='Backend to use for GPU_BROADCAST',
+            values=('mpi', 'nccl'), multi=False)
+
+    # Required dependencies
+    depends_on('py-setuptools', type='build')
+    depends_on('py-cloudpickle', type=('build', 'run'))
+    depends_on('py-psutil', type=('build', 'run'))
+    depends_on('py-pyyaml', type=('build', 'run'))
+    depends_on('py-six', type=('build', 'run'))
+
+    # Deep learning frameworks
+    depends_on('py-torch@0.4.0:', type=('build', 'run'), when='+pytorch')
+    depends_on('py-torch+cuda', type=('build', 'run'), when='+pytorch+cuda')
+    depends_on('py-cffi@1.4.0:', type=('build', 'run'), when='+pytorch')
+    depends_on('py-tensorflow@1.1.0:', type=('build', 'link', 'run'), when='+tensorflow')
+    depends_on('mxnet@1.4.0:+python', type=('build', 'link', 'run'), when='+mxnet')
+    depends_on('mxnet+cuda', type=('build', 'link', 'run'), when='+mxnet+cuda')
+
+    # Distributed support
+    # There does not appear to be a way to use an external Gloo installation
+    depends_on('cmake', type='build', when='+gloo')
+    depends_on('mpi', when='+mpi')
+    depends_on('mpi', when='gpu_allreduce=mpi')
+    depends_on('mpi', when='gpu_allgather=mpi')
+    depends_on('mpi', when='gpu_broadcast=mpi')
+
+    # GPU support
+    depends_on('cuda', when='+cuda')
+    depends_on('nccl@2.0:', when='gpu_allreduce=nccl')
+    depends_on('nccl@2.0:', when='gpu_broadcast=nccl')
+
+    # Test dependencies
+    depends_on('py-mock', type='test')
+    depends_on('py-pytest', type='test')
+    depends_on('py-pytest-forked', type='test')
+
+    conflicts('+gloo', when='platform=darwin', msg='Gloo cannot be compiled on MacOS')
+    conflicts('~gloo~mpi', msg='One of Gloo or MPI are required for Horovod to run')
+    conflicts('~pytorch~tensorflow~mxnet', msg='At least one deep learning backend is required')
+
+    def setup_build_environment(self, env):
+        # Deep learning frameworks
+        if '~pytorch' in self.spec:
+            env.set('HOROVOD_WITHOUT_PYTORCH', 1)
+        if '~tensorflow' in self.spec:
+            env.set('HOROVOD_WITHOUT_TENSORFLOW', 1)
+        if '~mxnet' in self.spec:
+            env.set('HOROVOD_WITHOUT_MXNET', 1)
+
+        # Distributed support
+        if '~gloo' in self.spec:
+            env.set('HOROVOD_WITHOUT_GLOO', 1)
+        if '+mpi' in self.spec:
+            env.set('HOROVOD_WITH_MPI', 1)
+        else:
+            env.set('HOROVOD_WITHOUT_MPI', 1)
+
+        # GPU support
+        if '+cuda' in self.spec:
+            env.set('HOROVOD_CUDA_HOME', self.spec['cuda'].prefix)
+            env.set('HOROVOD_CUDA_INCLUDE',
+                    self.spec['cuda'].headers.directories[0])
+            env.set('HOROVOD_CUDA_LIB', self.spec['cuda'].libs.directories[0])
+        if '^nccl' in self.spec:
+            env.set('HOROVOD_NCCL_HOME', self.spec['nccl'].prefix)
+            env.set('HOROVOD_NCCL_INCLUDE',
+                    self.spec['nccl'].headers.directories[0])
+            env.set('HOROVOD_NCCL_LIB', self.spec['nccl'].libs.directories[0])
+        env.set('HOROVOD_GPU_ALLREDUCE',
+                self.spec.variants['gpu_allreduce'].value.upper())
+        env.set('HOROVOD_GPU_ALLGATHER',
+                self.spec.variants['gpu_allgather'].value.upper())
+        env.set('HOROVOD_GPU_BROADCAST',
+                self.spec.variants['gpu_broadcast'].value.upper())
+        env.set('HOROVOD_ALLOW_MIXED_GPU_IMPL', 1)