{"id":3562,"date":"2023-05-15T10:21:50","date_gmt":"2023-05-15T08:21:50","guid":{"rendered":"https:\/\/datapy.fr\/?p=3562"},"modified":"2024-03-27T16:21:26","modified_gmt":"2024-03-27T15:21:26","slug":"dbt-vs-spark","status":"publish","type":"post","link":"https:\/\/datapy.fr\/index.php\/2023\/05\/15\/dbt-vs-spark\/","title":{"rendered":"DBT VS Spark"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-post\" data-elementor-id=\"3562\" class=\"elementor elementor-3562\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-6c54d6e8 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"6c54d6e8\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-6d87a730\" data-id=\"6d87a730\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-242f698c elementor-widget elementor-widget-image\" data-id=\"242f698c\" data-element_type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"592\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-1024x592.png\" class=\"attachment-large size-large wp-image-3586\" alt=\"\" srcset=\"https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-1024x592.png 1024w, https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-300x173.png 300w, https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-768x444.png 768w, https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-1536x888.png 1536w, https:\/\/datapy.fr\/wp-content\/uploads\/2023\/05\/DBT_VS_SPARK-3-2048x1184.png 2048w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-213264b0 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"213264b0\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-54ac1ed6\" data-id=\"54ac1ed6\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-138b8aad elementor-widget elementor-widget-heading\" data-id=\"138b8aad\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style><h2 class=\"elementor-heading-title elementor-size-default\">DBT VS Spark<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-3ffc041 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"3ffc041\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-60e57b3a\" data-id=\"60e57b3a\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-1d4289a6 elementor-widget elementor-widget-text-editor\" data-id=\"1d4289a6\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-text-editor.elementor-drop-cap-view-stacked .elementor-drop-cap{background-color:#69727d;color:#fff}.elementor-widget-text-editor.elementor-drop-cap-view-framed .elementor-drop-cap{color:#69727d;border:3px solid;background-color:transparent}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap{margin-top:8px}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap-letter{width:1em;height:1em}.elementor-widget-text-editor .elementor-drop-cap{float:left;text-align:center;line-height:1;font-size:50px}.elementor-widget-text-editor .elementor-drop-cap-letter{display:inline-block}<\/style>\t\t\t\t<p>DBT (Data Build Tool) et Spark sont deux technologies que l&rsquo;on utilise dans le traitement des donn\u00e9es. Cependant, elles ont des objectifs diff\u00e9rents.<\/p>\n<p><!-- \/wp:paragraph --><!-- wp:paragraph --><\/p>\n<p>DBT est un outil de transformation de donn\u00e9es open source permettant d&rsquo;organiser, tester et documenter les flux de travail de traitement de donn\u00e9es dans une organisation. Il aide \u00e0 cr\u00e9er des pipelines de traitement de donn\u00e9es fiables et reproductibles.<\/p>\n<p><!-- \/wp:paragraph --><!-- wp:paragraph --><\/p>\n<p>Spark est \u00e9galement une plate-forme de traitement de donn\u00e9es open source mais se concentre davantage sur l&rsquo;exploitation et l&rsquo;analyse de donn\u00e9es \u00e0 grande \u00e9chelle, en temps r\u00e9el. Elle utilise une architecture distribu\u00e9e. Spark permet d&rsquo;effectuer des analyses avanc\u00e9es, du machine learning et de la manipulation de donn\u00e9es en m\u00e9moire.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-2cb4512d elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"2cb4512d\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-4ff9ca76\" data-id=\"4ff9ca76\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-f74291e elementor-widget elementor-widget-heading\" data-id=\"f74291e\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">DBT<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-12c8052 elementor-widget-divider--view-line elementor-widget elementor-widget-divider\" data-id=\"12c8052\" data-element_type=\"widget\" data-widget_type=\"divider.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-divider{--divider-border-style:none;--divider-border-width:1px;--divider-color:#0c0d0e;--divider-icon-size:20px;--divider-element-spacing:10px;--divider-pattern-height:24px;--divider-pattern-size:20px;--divider-pattern-url:none;--divider-pattern-repeat:repeat-x}.elementor-widget-divider .elementor-divider{display:flex}.elementor-widget-divider .elementor-divider__text{font-size:15px;line-height:1;max-width:95%}.elementor-widget-divider .elementor-divider__element{margin:0 var(--divider-element-spacing);flex-shrink:0}.elementor-widget-divider .elementor-icon{font-size:var(--divider-icon-size)}.elementor-widget-divider .elementor-divider-separator{display:flex;margin:0;direction:ltr}.elementor-widget-divider--view-line_icon .elementor-divider-separator,.elementor-widget-divider--view-line_text .elementor-divider-separator{align-items:center}.elementor-widget-divider--view-line_icon .elementor-divider-separator:after,.elementor-widget-divider--view-line_icon .elementor-divider-separator:before,.elementor-widget-divider--view-line_text .elementor-divider-separator:after,.elementor-widget-divider--view-line_text .elementor-divider-separator:before{display:block;content:\"\";border-block-end:0;flex-grow:1;border-block-start:var(--divider-border-width) var(--divider-border-style) var(--divider-color)}.elementor-widget-divider--element-align-left .elementor-divider .elementor-divider-separator>.elementor-divider__svg:first-of-type{flex-grow:0;flex-shrink:100}.elementor-widget-divider--element-align-left .elementor-divider-separator:before{content:none}.elementor-widget-divider--element-align-left .elementor-divider__element{margin-left:0}.elementor-widget-divider--element-align-right .elementor-divider .elementor-divider-separator>.elementor-divider__svg:last-of-type{flex-grow:0;flex-shrink:100}.elementor-widget-divider--element-align-right .elementor-divider-separator:after{content:none}.elementor-widget-divider--element-align-right .elementor-divider__element{margin-right:0}.elementor-widget-divider--element-align-start .elementor-divider .elementor-divider-separator>.elementor-divider__svg:first-of-type{flex-grow:0;flex-shrink:100}.elementor-widget-divider--element-align-start .elementor-divider-separator:before{content:none}.elementor-widget-divider--element-align-start .elementor-divider__element{margin-inline-start:0}.elementor-widget-divider--element-align-end .elementor-divider .elementor-divider-separator>.elementor-divider__svg:last-of-type{flex-grow:0;flex-shrink:100}.elementor-widget-divider--element-align-end .elementor-divider-separator:after{content:none}.elementor-widget-divider--element-align-end .elementor-divider__element{margin-inline-end:0}.elementor-widget-divider:not(.elementor-widget-divider--view-line_text):not(.elementor-widget-divider--view-line_icon) .elementor-divider-separator{border-block-start:var(--divider-border-width) var(--divider-border-style) var(--divider-color)}.elementor-widget-divider--separator-type-pattern{--divider-border-style:none}.elementor-widget-divider--separator-type-pattern.elementor-widget-divider--view-line .elementor-divider-separator,.elementor-widget-divider--separator-type-pattern:not(.elementor-widget-divider--view-line) .elementor-divider-separator:after,.elementor-widget-divider--separator-type-pattern:not(.elementor-widget-divider--view-line) .elementor-divider-separator:before,.elementor-widget-divider--separator-type-pattern:not([class*=elementor-widget-divider--view]) .elementor-divider-separator{width:100%;min-height:var(--divider-pattern-height);-webkit-mask-size:var(--divider-pattern-size) 100%;mask-size:var(--divider-pattern-size) 100%;-webkit-mask-repeat:var(--divider-pattern-repeat);mask-repeat:var(--divider-pattern-repeat);background-color:var(--divider-color);-webkit-mask-image:var(--divider-pattern-url);mask-image:var(--divider-pattern-url)}.elementor-widget-divider--no-spacing{--divider-pattern-size:auto}.elementor-widget-divider--bg-round{--divider-pattern-repeat:round}.rtl .elementor-widget-divider .elementor-divider__text{direction:rtl}.e-con-inner>.elementor-widget-divider,.e-con>.elementor-widget-divider{width:var(--container-widget-width,100%);--flex-grow:var(--container-widget-flex-grow)}<\/style>\t\t<div class=\"elementor-divider\">\n\t\t\t<span class=\"elementor-divider-separator\">\n\t\t\t\t\t\t<\/span>\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-ed1fc07 elementor-widget elementor-widget-heading\" data-id=\"ed1fc07\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Avantages<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-5e4e645c elementor-widget elementor-widget-text-editor\" data-id=\"5e4e645c\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Les principaux avantages du DBT (Data Build Tool) sont :<\/p>\n<p><!-- \/wp:paragraph --><!-- wp:list {\"ordered\":true} --><\/p>\n<ol><!-- wp:list-item -->\n<li>Modularit\u00e9\u00a0: DBT permet de d\u00e9composer les workflows de traitement de donn\u00e9es en modules autonomes et reproductibles. Cela facilite la gestion des modifications et la r\u00e9utilisation du code.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Documentation : un moyen simple et structur\u00e9 de documenter le flux de travail de traitement de donn\u00e9es. L\u00a0\u00bboutil facilite donc la collaboration et la compr\u00e9hension des diff\u00e9rentes \u00e9tapes de transformation des donn\u00e9es.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Testabilit\u00e9 : cr\u00e9er des tests automatis\u00e9s pour s&rsquo;assurer que les donn\u00e9es sont correctement transform\u00e9es et coh\u00e9rentes \u00e0 chaque \u00e9tape du workflow. On am\u00e9liore ainsi la qualit\u00e9 des donn\u00e9es.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Versionnage : Nous pouvons versionner DBT et le suivre \u00e0 l&rsquo;aide d&rsquo;un syst\u00e8me de contr\u00f4le de version. Nous pouvons donc suivre l&rsquo;historique des modifications et de revenir aux versions ant\u00e9rieures si n\u00e9cessaire.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Int\u00e9gration facile : nous pouvons facilement l&rsquo;int\u00e9grer \u00e0 d\u2019autres technologies de traitement de donn\u00e9es, telles que les entrep\u00f4ts de donn\u00e9es, les outils d\u2019ELT\/ETL, les plateformes de visualisation de donn\u00e9es, etc.<\/li>\n<\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-1818697 elementor-widget elementor-widget-heading\" data-id=\"1818697\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Limites<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-6d502182 elementor-widget elementor-widget-text-editor\" data-id=\"6d502182\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Bien que DBT soit un outil tr\u00e8s utile pour cr\u00e9er, documenter et tester des flux de travail de traitement de donn\u00e9es, il a des limites. En voici quelques-unes :<\/p>\n<p><!-- \/wp:paragraph --><!-- wp:list {\"ordered\":true} --><\/p>\n<ol><!-- wp:list-item -->\n<li>Complexit\u00e9 : peut \u00eatre complexe \u00e0 comprendre et \u00e0 configurer pour les d\u00e9butants. En particulier lorsqu&rsquo;il s&rsquo;agit de t\u00e2ches plus avanc\u00e9es telles que la gestion des versions, la configuration des connexions de base de donn\u00e9es, la mise en \u0153uvre des tests automatis\u00e9s, etc.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Limitations de manipulation de donn\u00e9es : il manque certaines capacit\u00e9s de manipulation de donn\u00e9es que l&rsquo;on peut trouver dans d&rsquo;autres outils comme Pandas ou Spark.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Limitations de performances : il peut ne pas \u00eatre la meilleure option pour les charges de travail tr\u00e8s volumineuses et intensives en traitement.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Limitations de prise en charge de base de donn\u00e9es : il ne prend pas n\u00e9cessairement en charge toutes les fonctionnalit\u00e9s de chaque base de donn\u00e9es. Ce qui peut limiter certaines de ses fonctionnalit\u00e9s.<\/li>\n<\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-1ec18e2 elementor-widget elementor-widget-heading\" data-id=\"1ec18e2\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Cas d'usages<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-c9870ad elementor-widget elementor-widget-text-editor\" data-id=\"c9870ad\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Voici trois cas d&rsquo;utilisation courants pour DBT :<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-8c7c957 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"8c7c957\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<link rel=\"stylesheet\" href=\"https:\/\/datapy.fr\/wp-content\/plugins\/elementor\/assets\/css\/widget-icon-box.min.css\">\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tMod\u00e9lisation de donn\u00e9es : mod\u00e9liser des donn\u00e9es provenant de diff\u00e9rentes sources de donn\u00e9es. DBT les transforme en un mod\u00e8le de donn\u00e9es normalis\u00e9 et coh\u00e9rent. Ceci est particuli\u00e8rement utile pour les entreprises dont les donn\u00e9es sont r\u00e9parties sur diff\u00e9rents syst\u00e8mes, souhaitant les unifier pour une meilleure analyse.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-fdd313c elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"fdd313c\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tOrchestration de flux de travail : il automatise les t\u00e2ches telles que l'extraction, la transformation et le chargement (ETL). On utilise \u00e9galement DBT pour g\u00e9rer les versions de code et les mises \u00e0 jour de sch\u00e9ma.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-9604cf7 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"9604cf7\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tTests de donn\u00e9es : cr\u00e9er des tests automatis\u00e9s pour les donn\u00e9es, en v\u00e9rifiant la qualit\u00e9 et l'int\u00e9grit\u00e9 des donn\u00e9es, ainsi que la coh\u00e9rence des mod\u00e8les de donn\u00e9es. Cela permet de garantir que leur exactitude et leur coh\u00e9rence pour une analyse pr\u00e9cise.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-b56a61a elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"b56a61a\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-9dd3f9b\" data-id=\"9dd3f9b\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-54c3a75 elementor-widget elementor-widget-heading\" data-id=\"54c3a75\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Spark<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-84e60c4 elementor-widget-divider--view-line elementor-widget elementor-widget-divider\" data-id=\"84e60c4\" data-element_type=\"widget\" data-widget_type=\"divider.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-divider\">\n\t\t\t<span class=\"elementor-divider-separator\">\n\t\t\t\t\t\t<\/span>\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-9b4c95f elementor-widget elementor-widget-heading\" data-id=\"9b4c95f\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Avantages<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-cf1c57c elementor-widget elementor-widget-text-editor\" data-id=\"cf1c57c\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Les principaux avantages de Spark sont :<\/p>\n<p><!-- \/wp:paragraph --><!-- wp:list {\"ordered\":true} --><\/p>\n<ol><!-- wp:list-item -->\n<li>Traitement de donn\u00e9es massives : Spark est con\u00e7u pour traiter des volumes de donn\u00e9es massifs. Il offre des performances \u00e9lev\u00e9es pour le traitement parall\u00e8le des donn\u00e9es.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Analyse avanc\u00e9e : une vaste gamme de biblioth\u00e8ques d&rsquo;analyse de donn\u00e9es. Elles comprennent des algorithmes de machine learning, des graphiques, des analyses statistiques et des traitements de donn\u00e9es en m\u00e9moire.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Architecture distribu\u00e9e : Spark utilise une architecture distribu\u00e9e pour traiter les donn\u00e9es. Ceci permet une meilleure \u00e9volutivit\u00e9 et une r\u00e9silience accrue en cas de d\u00e9faillance d&rsquo;un n\u0153ud du cluster.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Polyvalence : prend en charge plusieurs langages de programmation, notamment Python, Java, Scala et R. Ce qui facilite l&rsquo;adoption par les d\u00e9veloppeurs avec diff\u00e9rentes comp\u00e9tences.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Int\u00e9gration facile : nous pouvons facilement l&rsquo;int\u00e9grer \u00e0 d&rsquo;autres technologies de traitement de donn\u00e9es comme les entrep\u00f4ts de donn\u00e9es, les outils ETL\/ELT, les bases de donn\u00e9es, les plateformes de visualisation de donn\u00e9es, etc.<\/li>\n<!-- \/wp:list-item --><\/ol>\n<p><!-- \/wp:list --><!-- wp:paragraph --><\/p>\n<p>En r\u00e9sum\u00e9, Spark est une technologie polyvalente qui offre des performances \u00e9lev\u00e9es pour le traitement et l&rsquo;analyse de grandes quantit\u00e9s de donn\u00e9es en temps r\u00e9el, gr\u00e2ce \u00e0 son architecture distribu\u00e9e et ses nombreuses biblioth\u00e8ques d&rsquo;analyse de donn\u00e9es.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-b6de578 elementor-widget elementor-widget-heading\" data-id=\"b6de578\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Limites<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-5d9c9ad elementor-widget elementor-widget-text-editor\" data-id=\"5d9c9ad\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<ol>\n<li>Complexit\u00e9 : Spark peut \u00eatre complexe \u00e0 configurer et \u00e0 utiliser, en particulier pour les d\u00e9butants. Il n\u00e9cessite souvent une connaissance avanc\u00e9e de la programmation distribu\u00e9e pour \u00eatre pleinement exploit\u00e9.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Co\u00fbt \u00e9lev\u00e9 : un grand nombre de n\u0153uds de calcul sont g\u00e9n\u00e9ralement n\u00e9cessaires pour ex\u00e9cuter des t\u00e2ches de traitement de donn\u00e9es massives. Cela entra\u00eene des co\u00fbts d&rsquo;infrastructure et de maintenance \u00e9lev\u00e9s.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Limitations de la RAM : la quantit\u00e9 de RAM disponible pour chaque n\u0153ud de calcul peut \u00eatre limit\u00e9e. Ce qui peut limiter les performances de certaines t\u00e2ches de traitement de donn\u00e9es.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Gestion de la s\u00e9curit\u00e9 : la configuration de la s\u00e9curit\u00e9 de Spark peut \u00eatre complexe. Elle n\u00e9cessite souvent une attention particuli\u00e8re pour s&rsquo;assurer que les donn\u00e9es sont bien prot\u00e9g\u00e9es.<\/li>\n<!-- \/wp:list-item --><!-- wp:list-item -->\n<li>Limitations de la prise en charge des bases de donn\u00e9es : il peut ne pas prendre en charge toutes les fonctionnalit\u00e9s de chaque source de donn\u00e9es. Ce qui peut limiter certaines fonctionnalit\u00e9s.<\/li>\n<\/ol>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-e53c198 elementor-widget elementor-widget-heading\" data-id=\"e53c198\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Cas d'usages<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-b4b7a49 elementor-widget elementor-widget-text-editor\" data-id=\"b4b7a49\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>Voici trois cas d&rsquo;utilisation courants pour Spark :<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-deaefa3 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"deaefa3\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tTraitement de donn\u00e9es massives : Spark est particuli\u00e8rement adapt\u00e9 pour le traitement de donn\u00e9es massives, en raison de son architecture distribu\u00e9e et de ses capacit\u00e9s de traitement en m\u00e9moire. On peut l'utiliser pour traiter de grandes quantit\u00e9s de donn\u00e9es en parall\u00e8le, acc\u00e9l\u00e9rant ainsi les t\u00e2ches de traitement.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-9b3d652 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"9b3d652\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tAnalyse de donn\u00e9es avanc\u00e9e : une biblioth\u00e8que d'analyse avanc\u00e9e qui permet de r\u00e9aliser des analyses de donn\u00e9es complexes comme la fouille de donn\u00e9es, la classification, la pr\u00e9diction et l'apprentissage automatique. Ces capacit\u00e9s d'analyse aident les entreprises \u00e0 d\u00e9couvrir des mod\u00e8les dans les donn\u00e9es et \u00e0 prendre des d\u00e9cisions.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-b22763f elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"b22763f\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tTraitement de donn\u00e9es en temps r\u00e9el : il permet aux entreprises de traiter les donn\u00e9es au fur et \u00e0 mesure qu'elles sont g\u00e9n\u00e9r\u00e9es. Cette fonctionnalit\u00e9 est tr\u00e8s utile pour les entreprises qui ont besoin de prendre des d\u00e9cisions en temps r\u00e9el.\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-5b312295 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"5b312295\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-312cef8f\" data-id=\"312cef8f\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-dfcc042 elementor-widget elementor-widget-heading\" data-id=\"dfcc042\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<h2 class=\"elementor-heading-title elementor-size-default\">Lequel choisir ?<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<div class=\"elementor-element elementor-element-187fc34 elementor-widget elementor-widget-text-editor\" data-id=\"187fc34\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t\t\t<p>En r\u00e9sum\u00e9, DBT et Spark sont deux outils compl\u00e9mentaires de traitement et d&rsquo;analyse de donn\u00e9es. DBT est id\u00e9al pour la mod\u00e9lisation des donn\u00e9es et l&rsquo;orchestration des flux de travail. Tandis que Spark est puissant pour le traitement de donn\u00e9es massives et l&rsquo;analyse avanc\u00e9e. Le choix entre les deux d\u00e9pend des besoins sp\u00e9cifiques de chaque organisation en termes de volume de donn\u00e9es, de ressources et de comp\u00e9tences techniques.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-f3a92c3 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"f3a92c3\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-20b51779\" data-id=\"20b51779\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-1a973b39 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"1a973b39\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-angle-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tVous devriez \u00e9galement aimer\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-647ba2a3 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"647ba2a3\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-7b9dd2dc\" data-id=\"7b9dd2dc\" data-element_type=\"column\" data-settings=\"{&quot;background_background&quot;:&quot;classic&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-682d604b elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"682d604b\" data-element_type=\"widget\" data-settings=\"{&quot;_animation&quot;:&quot;none&quot;}\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-image-box .elementor-image-box-content{width:100%}@media (min-width:768px){.elementor-widget-image-box.elementor-position-left .elementor-image-box-wrapper,.elementor-widget-image-box.elementor-position-right .elementor-image-box-wrapper{display:flex}.elementor-widget-image-box.elementor-position-right .elementor-image-box-wrapper{text-align:end;flex-direction:row-reverse}.elementor-widget-image-box.elementor-position-left .elementor-image-box-wrapper{text-align:start;flex-direction:row}.elementor-widget-image-box.elementor-position-top .elementor-image-box-img{margin:auto}.elementor-widget-image-box.elementor-vertical-align-top .elementor-image-box-wrapper{align-items:flex-start}.elementor-widget-image-box.elementor-vertical-align-middle .elementor-image-box-wrapper{align-items:center}.elementor-widget-image-box.elementor-vertical-align-bottom .elementor-image-box-wrapper{align-items:flex-end}}@media (max-width:767px){.elementor-widget-image-box .elementor-image-box-img{margin-left:auto!important;margin-right:auto!important;margin-bottom:15px}}.elementor-widget-image-box .elementor-image-box-img{display:inline-block}.elementor-widget-image-box .elementor-image-box-title a{color:inherit}.elementor-widget-image-box .elementor-image-box-wrapper{text-align:center}.elementor-widget-image-box .elementor-image-box-description{margin:0}<\/style><div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\" tabindex=\"-1\"><img decoding=\"async\" width=\"2560\" height=\"1576\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless.jpeg\" class=\"attachment-full size-full wp-image-3177\" alt=\"\" srcset=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless.jpeg 2560w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-300x185.jpeg 300w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-1024x630.jpeg 1024w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-768x473.jpeg 768w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-1536x945.jpeg 1536w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-2048x1261.jpeg 2048w\" sizes=\"(max-width: 2560px) 100vw, 2560px\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\">\u201cBuzz Query\u201d, un moteur de requ\u00eates pour dashboarding bigdata serverless<\/a><\/h3><p class=\"elementor-image-box-description\">L\u2019histoire commence par la rencontre entre l\u2019\u00e9quipe DataPy et R\u00e9mi Dettai\u2026 R\u00e9mi est un ing\u00e9nieur de talent sp\u00e9cialis\u00e9 en Data et Cloud. R\u00e9mi a eu de nombreuses exp\u00e9riences dans les domaines de la tech, chez des industriels com...<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-546684e7\" data-id=\"546684e7\" data-element_type=\"column\" data-settings=\"{&quot;background_background&quot;:&quot;classic&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-318aff7e elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"318aff7e\" data-element_type=\"widget\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/06\/07\/forces-et-faiblesses-de-spark-et-elasticsearch\/\" tabindex=\"-1\"><img decoding=\"async\" width=\"1050\" height=\"566\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-e1711553094473.jpeg\" class=\"attachment-full size-full wp-image-3184\" alt=\"\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/06\/07\/forces-et-faiblesses-de-spark-et-elasticsearch\/\">Forces et faiblesses de Spark et Elasticsearch<\/a><\/h3><p class=\"elementor-image-box-description\">\nNous avons partag\u00e9 les enjeux li\u00e9s \u00e0 la techno du Serverless dans le pr\u00e9c\u00e9dent article. Nous allons creuser aujourd\u2019hui les solutions les plus connues dans le domaine du traitement de donn\u00e9es \u00e0 grande \u00e9chelle, Spark et Elasticsearch.<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-ae526ec\" data-id=\"ae526ec\" data-element_type=\"column\" data-settings=\"{&quot;background_background&quot;:&quot;classic&quot;}\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-29274548 elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"29274548\" data-element_type=\"widget\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\" tabindex=\"-1\"><img loading=\"lazy\" decoding=\"async\" width=\"1050\" height=\"566\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/20210526-Serverless-e1711553126530.jpeg\" class=\"attachment-full size-full wp-image-3182\" alt=\"\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\">Le serverless, une approche efficace \u00e0 bas prix<\/a><\/h3><p class=\"elementor-image-box-description\"> \nNous avions introduit dans l\u2019article pr\u00e9c\u00e9dent ce qu\u2019\u00e9tait la notion de moteur de requ\u00eate de dashboarding. Nous allons \u00e0 pr\u00e9sent nous concentrer sur une nouvelle notion, plus proche des ressources mat\u00e9rielles, le serverless.\n<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>DBT VS Spark DBT (Data Build Tool) et Spark sont deux technologies que l&rsquo;on utilise dans le traitement des donn\u00e9es. Cependant, elles ont des objectifs diff\u00e9rents. DBT est un outil de transformation de donn\u00e9es open source permettant d&rsquo;organiser, tester et documenter les flux de travail de traitement de donn\u00e9es dans une organisation. Il aide \u00e0 [&hellip;]<\/p>\n","protected":false},"author":42,"featured_media":3590,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[],"class_list":["post-3562","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data","entry","has-media"],"_links":{"self":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts\/3562","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/users\/42"}],"replies":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/comments?post=3562"}],"version-history":[{"count":0,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts\/3562\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/media\/3590"}],"wp:attachment":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/media?parent=3562"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/categories?post=3562"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/tags?post=3562"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}