Databricks

Databricks

Databricks : plateforme d’analytique créée par les premiers concepteurs d’Apache Spark™

Databricks unifie la science et l’ingénierie des données tout au long du cycle de vie de l’analyse, de la préparation, de la mise en place de flux de big data et de streaming data jusqu’à l’expérimentation et le déploiement d’applications ML.

Traitez les cas d'utilisation modernes des données, depuis l'entreposage de gros volumes de données ou de données IdO jusqu'aux cas d'analyse avancée tels que l'apprentissage automatique et profond, avec delaware et Databricks sur la plateforme cloud Microsoft Azure. Databricks, fondée par l’équipe qui a créé Apache Spark™, est une plateforme analytique unifiée qui permet d’accélérer le processus d’innovation en unifiant la science des données, l'ingénierie et les affaires.Databricks est un service de première ligne offert par Microsoft sur Microsoft Azure. Vous bénéficiez, autrement dit, de tous les avantages d’Azure tels que la sécurité et les accords de niveau de service d'entreprise ainsi que l'intégration transparente avec les services Azure existants (y compris l'authentification AAD), avec l'espace de travail interactif entièrement géré de Databricks pour les cas d'utilisation de données modernes.

Databricks stimule l’innovation en vous offrant une plateforme unifiée pour vos besoins en données modernes

Spécifications principales

Databricks se concentre sur les besoins modernes en matière de données, ce qui vous permet de démarrer rapidement sans avoir à gérer vous-même un paysage analytique complexe.

Les fonctionnalités suivantes sont :

  • Une configuration en un clic qui permet un accès rapide à l’information; Databricks propose des clusters Spark gérés d’un bout à l’autre dans le cloud, alimentés directement depuis le portail Azure au même titre que tout autre service Azure, et s’intègre de façon homogène aux autres services Azure. Cette intégration passe par des services de données tels que Azure SQL DB, Azure CosmosDB et Azure Data Lake permettant de créer un véritable pipeline de CI/CD avec Azure DevOps ou de créer des images de conteneurs prêtes à être déployées pour les périphériques via Azure Machine Learning Workspace ;
  • Des flux de travail rationalisés fournissent un planificateur de pipeline de production permettant de programmer facilement un carnet de notes Databricks en tant que tâche. Cela permet une mise en service transparente de vos efforts en matière de science des données et d'ingénierie : ce que vous écrivez est ce que vous exécutez. Les tâches peuvent démarrer et arrêter un cluster lorsque cela est nécessaire afin d'offrir une véritable configuration "pay-as-you-use" ;
  • Grâce à l'espace de travail interactif de type carnet de notes, vous favorisez la collaboration entre les spécialistes des données, les ingénieurs de données et les analystes commerciaux. L'espace de travail offre une interface en un clic permettant d'affecter les notebooks à différents clusters exécutant différentes versions des moteurs d'exécution sous-jacents Spark et Scale/Python, ainsi qu'à des clusters équipés de GPU ;
  • Outre le moteur d'exécution de base, Databricks comprend MLflow pour ajouter DevOps à vos efforts d'apprentissage automatique et Delta pour ajouter une couche de gouvernance au-dessus d’un Azure Data Lake ;
  • En tant que service de première partie sur Microsoft Azure, Databricks sur Azure offre une sécurité Azure de niveau entreprise (y compris une intégration Active Directory prête à l'emploi), une conformité et des accords de niveau de service de niveau entreprise.

Contactez nos experts en data & analytics

contenu associé