{"id":626,"date":"2021-06-07T14:26:50","date_gmt":"2021-06-07T12:26:50","guid":{"rendered":"https:\/\/datapy.fr\/?p=626"},"modified":"2024-03-27T16:25:01","modified_gmt":"2024-03-27T15:25:01","slug":"forces-et-faiblesses-de-spark-et-elasticsearch","status":"publish","type":"post","link":"https:\/\/datapy.fr\/index.php\/2021\/06\/07\/forces-et-faiblesses-de-spark-et-elasticsearch\/","title":{"rendered":"Forces et faiblesses de Spark et Elasticsearch"},"content":{"rendered":"\t\t<div data-elementor-type=\"wp-post\" data-elementor-id=\"626\" class=\"elementor elementor-626\">\n\t\t\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-4a43c2a elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"4a43c2a\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-479c5dc\" data-id=\"479c5dc\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-27ce067 elementor-widget elementor-widget-image\" data-id=\"27ce067\" data-element_type=\"widget\" data-widget_type=\"image.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-image{text-align:center}.elementor-widget-image a{display:inline-block}.elementor-widget-image a img[src$=\".svg\"]{width:48px}.elementor-widget-image img{vertical-align:middle;display:inline-block}<\/style>\t\t\t\t\t\t\t\t\t\t<img fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"552\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-1024x552.jpeg\" class=\"attachment-large size-large wp-image-3184\" alt=\"\" srcset=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-1024x552.jpeg 1024w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-300x162.jpeg 300w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-768x414.jpeg 768w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-1536x828.jpeg 1536w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-2048x1104.jpeg 2048w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/06\/20210604-DataPy_Apache_SPARK_ELASTICSEARCH-e1711553094473.jpeg 1050w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/>\t\t\t\t\t\t\t\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-fe5283e elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"fe5283e\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-34e74a2\" data-id=\"34e74a2\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-84f22e9 elementor-widget elementor-widget-heading\" data-id=\"84f22e9\" data-element_type=\"widget\" data-widget_type=\"heading.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-heading-title{padding:0;margin:0;line-height:1}.elementor-widget-heading .elementor-heading-title[class*=elementor-size-]>a{color:inherit;font-size:inherit;line-height:inherit}.elementor-widget-heading .elementor-heading-title.elementor-size-small{font-size:15px}.elementor-widget-heading .elementor-heading-title.elementor-size-medium{font-size:19px}.elementor-widget-heading .elementor-heading-title.elementor-size-large{font-size:29px}.elementor-widget-heading .elementor-heading-title.elementor-size-xl{font-size:39px}.elementor-widget-heading .elementor-heading-title.elementor-size-xxl{font-size:59px}<\/style><h2 class=\"elementor-heading-title elementor-size-default\">Forces et faiblesses de Spark et Elasticsearch<\/h2>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-bbe954a elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"bbe954a\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-bb208b2\" data-id=\"bb208b2\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-fd5fa66 elementor-widget elementor-widget-text-editor\" data-id=\"fd5fa66\" data-element_type=\"widget\" data-widget_type=\"text-editor.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-text-editor.elementor-drop-cap-view-stacked .elementor-drop-cap{background-color:#69727d;color:#fff}.elementor-widget-text-editor.elementor-drop-cap-view-framed .elementor-drop-cap{color:#69727d;border:3px solid;background-color:transparent}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap{margin-top:8px}.elementor-widget-text-editor:not(.elementor-drop-cap-view-default) .elementor-drop-cap-letter{width:1em;height:1em}.elementor-widget-text-editor .elementor-drop-cap{float:left;text-align:center;line-height:1;font-size:50px}.elementor-widget-text-editor .elementor-drop-cap-letter{display:inline-block}<\/style>\t\t\t\t<p>Nous avons partag\u00e9 les enjeux li\u00e9s \u00e0 la techno du <a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\">Serverless<\/a> dans le pr\u00e9c\u00e9dent article. Nous allons creuser aujourd&rsquo;hui\u00a0<span style=\"font-weight: 400;\">les solutions les plus connues dans le domaine du traitement de donn\u00e9es \u00e0 grande \u00e9chelle, Spark et Elasticsearch.<\/span><\/p><p>Spark (ou Apache Spark) est un framework open source de calcul distribu\u00e9. Il s&rsquo;agit d&rsquo;un ensemble d&rsquo;outils et de composants logiciels structur\u00e9s selon une architecture d\u00e9finie. Ce produit est un cadre applicatif de traitements big data pour effectuer des analyses complexes \u00e0 grande \u00e9chelle. Spark a \u00e9t\u00e9 d\u00e9velopp\u00e9 \u00e0 l&rsquo;universit\u00e9 de Berkeley en 2009. \u00c0 l&rsquo;origine, son d\u00e9veloppement \u00e9tait une solution destin\u00e9e \u00e0 acc\u00e9l\u00e9rer le traitement des syst\u00e8mes Hadoop. Les d\u00e9veloppeurs mettent notamment en avant la rapidit\u00e9 du produit en termes d&rsquo;ex\u00e9cution des t\u00e2ches par rapport \u00e0 MapReduce. Spark r\u00e9alise une lecture des donn\u00e9es au niveau du cluster (grappe de serveurs sur un r\u00e9seau), effectue toutes les op\u00e9rations d&rsquo;analyse n\u00e9cessaires, puis \u00e9crit les r\u00e9sultats \u00e0 ce m\u00eame niveau. Malgr\u00e9 le fait que les t\u00e2ches s&rsquo;\u00e9crivent avec les langages Scala, Java et Python, il utilise au mieux ses capacit\u00e9s avec son langage natif, Scala. De ce fait, l\u00e0 o\u00f9 le MapReduce de Hadoop travaille par \u00e9tape, Spark peut travailler sur la totalit\u00e9 des donn\u00e9es en m\u00eame temps. Il est donc jusqu&rsquo;\u00e0 dix fois plus rapide pour le traitement en lots et jusqu&rsquo;\u00e0 cent fois plus rapide pour effectuer l&rsquo;analyse en m\u00e9moire. Spark est aujourd\u2019hui leader de ce type de solutions. Cette solution versatile permet de requ\u00eater les donn\u00e9es en SQL. On peut coder n&rsquo;importe quoi en termes de data, requ\u00eater des images et faire du deep learning dessus. C\u2019est la boite \u00e0 outil clef. Spark est tr\u00e8s flexible. Il faut provisionner son cluster au pr\u00e9alable. De nombreuses entreprises travaillent pour faciliter le scaling. Cela reste malgr\u00e9 tout un outil assez lourd, qui montrera ses limites pour avoir une faible latence. A la base imagin\u00e9 pour tourner sur Hadoop,\u00a0 Spark s\u2019est progressivement ouvert avec le cloud pour aller chercher les donn\u00e9es sur S3, ce qui devient tr\u00e8s commun de nos jours. On peut aussi combiner S3 et HDFS avec Spark.<\/p><p>Elasticsearch est un logiciel utilisant Lucene pour l&rsquo;indexation et la recherche de donn\u00e9es. Lucene est une biblioth\u00e8que open source \u00e9crite en Java qui permet d&rsquo;indexer et de chercher du texte. Il est utilis\u00e9 dans certains moteurs de recherche. Cr\u00e9\u00e9 en 2010 par Shay Banon, Elasticsearch fournit un moteur de recherche distribu\u00e9 et multi-entit\u00e9 \u00e0 travers une interface REST (indexation et moteur de recherche). Cette interface permet donc \u00e0 n\u2019importe quel langage d\u2019acc\u00e9der aux donn\u00e9es. Les donn\u00e9es \u00e9chang\u00e9es sont au format JSON. C&rsquo;est un logiciel \u00e9crit en Java distribu\u00e9 sous licence Elastic. L&rsquo;\u00e9diteur propose aussi une version sous Server Side Public License ainsi que la possibilit\u00e9 de souscrire \u00e0 une offre Saas. Elasticsearch est devenu le serveur de recherche le plus populaire chez les professionnels, suivi par Apache Solr qui utilise aussi Lucene. Il est associ\u00e9 \u00e0 deux autres produits libres, Kibana et Logstash, qui sont respectivement un visualiseur de donn\u00e9es et un ETL (initialement destin\u00e9 aux logs). On appelle souvent le trin\u00f4me, \u201csuite ELK\u201d. Elasticsearch est open source, mais les sources sont complexes. La soci\u00e9t\u00e9 Elastik propose une gamme d\u2019outils compl\u00e9mentaires performants. Il offre une bonne optimisation du cache et une bonne capacit\u00e9 d\u2019agr\u00e9gation. Le cache permet d&rsquo;afficher les r\u00e9sultats de plus en plus rapidement. La premi\u00e8re analyse est un peu plus lente, mais les suivantes sont plus rapides. Elasticsearch est bas\u00e9 sur un cluster. Il prend du temps \u00e0 d\u00e9marrer. Le mod\u00e8le de donn\u00e9es prend comme hypoth\u00e8se que le mod\u00e8le de donn\u00e9es est stable. Tr\u00e8s interactif.<\/p><p><span style=\"font-weight: 400;\">En parall\u00e8le de ces deux solutions leaders, nous pourrons \u00e9galement faire appel \u00e0 d\u2019autres solutions plus sp\u00e9cialis\u00e9es, bas\u00e9es sur des clusters: Presto et Impala ont la fonctionnalit\u00e9 SQL, mais pas la bo\u00eete \u00e0 outil Spark. Toutes deux ont des performances similaires.\u00a0\u00a0<\/span><\/p><p>Nous aborderons dans le prochain article, Athena, solution d&rsquo;Amazon.<\/p>\t\t\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-ef36c8f elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"ef36c8f\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-100 elementor-top-column elementor-element elementor-element-497421b\" data-id=\"497421b\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-e8013a2 elementor-position-left elementor-view-default elementor-mobile-position-top elementor-vertical-align-top elementor-widget elementor-widget-icon-box\" data-id=\"e8013a2\" data-element_type=\"widget\" data-widget_type=\"icon-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<link rel=\"stylesheet\" href=\"https:\/\/datapy.fr\/wp-content\/plugins\/elementor\/assets\/css\/widget-icon-box.min.css\">\t\t<div class=\"elementor-icon-box-wrapper\">\n\n\t\t\t\t\t\t<div class=\"elementor-icon-box-icon\">\n\t\t\t\t<span  class=\"elementor-icon elementor-animation-\">\n\t\t\t\t<i aria-hidden=\"true\" class=\"fas fa-chevron-right\"><\/i>\t\t\t\t<\/span>\n\t\t\t<\/div>\n\t\t\t\n\t\t\t\t\t\t<div class=\"elementor-icon-box-content\">\n\n\t\t\t\t\t\t\t\t\t<h3 class=\"elementor-icon-box-title\">\n\t\t\t\t\t\t<span  >\n\t\t\t\t\t\t\tVous devriez \u00e9galement aimer\u200b\t\t\t\t\t\t<\/span>\n\t\t\t\t\t<\/h3>\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\t\t\t\n\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<section class=\"elementor-section elementor-top-section elementor-element elementor-element-11f53e1 elementor-section-boxed elementor-section-height-default elementor-section-height-default\" data-id=\"11f53e1\" data-element_type=\"section\">\n\t\t\t\t\t\t<div class=\"elementor-container elementor-column-gap-default\">\n\t\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-d1f2c10\" data-id=\"d1f2c10\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-d342cba elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"d342cba\" data-element_type=\"widget\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<style>\/*! elementor - v3.21.0 - 25-04-2024 *\/\n.elementor-widget-image-box .elementor-image-box-content{width:100%}@media (min-width:768px){.elementor-widget-image-box.elementor-position-left .elementor-image-box-wrapper,.elementor-widget-image-box.elementor-position-right .elementor-image-box-wrapper{display:flex}.elementor-widget-image-box.elementor-position-right .elementor-image-box-wrapper{text-align:end;flex-direction:row-reverse}.elementor-widget-image-box.elementor-position-left .elementor-image-box-wrapper{text-align:start;flex-direction:row}.elementor-widget-image-box.elementor-position-top .elementor-image-box-img{margin:auto}.elementor-widget-image-box.elementor-vertical-align-top .elementor-image-box-wrapper{align-items:flex-start}.elementor-widget-image-box.elementor-vertical-align-middle .elementor-image-box-wrapper{align-items:center}.elementor-widget-image-box.elementor-vertical-align-bottom .elementor-image-box-wrapper{align-items:flex-end}}@media (max-width:767px){.elementor-widget-image-box .elementor-image-box-img{margin-left:auto!important;margin-right:auto!important;margin-bottom:15px}}.elementor-widget-image-box .elementor-image-box-img{display:inline-block}.elementor-widget-image-box .elementor-image-box-title a{color:inherit}.elementor-widget-image-box .elementor-image-box-wrapper{text-align:center}.elementor-widget-image-box .elementor-image-box-description{margin:0}<\/style><div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\" tabindex=\"-1\"><img decoding=\"async\" width=\"1050\" height=\"566\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/20210526-Serverless-e1711553126530.jpeg\" class=\"attachment-full size-full wp-image-3182\" alt=\"\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/26\/le-serverless-une-approche-efficace-a-bas-prix\/\">Le serverless, une approche efficace \u00e0 bas prix<\/a><\/h3><p class=\"elementor-image-box-description\">Nous avions introduit dans l\u2019article pr\u00e9c\u00e9dent ce qu\u2019\u00e9tait la notion de moteur de requ\u00eate de dashboarding. Nous allons \u00e0 pr\u00e9sent nous concentrer sur une nouvelle notion, plus proche des ressources mat\u00e9rielles, le serverless. Qu\u2019est-ce que le serverless?<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-58122eb\" data-id=\"58122eb\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-c932f55 elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"c932f55\" data-element_type=\"widget\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/17\/buzz-query-un-moteur-de-requetes-pour-dashboarding-bigdata-serverless-pour-les-startups\/\" tabindex=\"-1\"><img decoding=\"async\" width=\"2560\" height=\"1576\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless.jpeg\" class=\"attachment-full size-full wp-image-3177\" alt=\"\" srcset=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless.jpeg 2560w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-300x185.jpeg 300w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-1024x630.jpeg 1024w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-768x473.jpeg 768w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-1536x945.jpeg 1536w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/05\/DataPy_Article_moteur_de_requetes_pour_dashboarding_bigdata_serverless-2048x1261.jpeg 2048w\" sizes=\"(max-width: 2560px) 100vw, 2560px\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/05\/17\/buzz-query-un-moteur-de-requetes-pour-dashboarding-bigdata-serverless-pour-les-startups\/\">\u201cBuzz Query\u201d, un moteur de requ\u00eates pour dashboarding bigdata serverless<\/a><\/h3><p class=\"elementor-image-box-description\">L\u2019histoire commence par la rencontre entre l\u2019\u00e9quipe DataPy et R\u00e9mi Dettai\u2026 R\u00e9mi est un ing\u00e9nieur de talent sp\u00e9cialis\u00e9 en Data et Cloud. R\u00e9mi a eu de nombreuses exp\u00e9riences dans les domaines de la tech, chez des industriels comme Continental ou encore dans des startups.<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t<div class=\"elementor-column elementor-col-33 elementor-top-column elementor-element elementor-element-6a4550e\" data-id=\"6a4550e\" data-element_type=\"column\">\n\t\t\t<div class=\"elementor-widget-wrap elementor-element-populated\">\n\t\t\t\t\t\t<div class=\"elementor-element elementor-element-2796f15 elementor-position-top elementor-widget elementor-widget-image-box\" data-id=\"2796f15\" data-element_type=\"widget\" data-widget_type=\"image-box.default\">\n\t\t\t\t<div class=\"elementor-widget-container\">\n\t\t\t<div class=\"elementor-image-box-wrapper\"><figure class=\"elementor-image-box-img\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/02\/22\/en-route-vers-lautomatisation-iceberg-procrastination-et-noeud-gordien\/\" tabindex=\"-1\"><img loading=\"lazy\" decoding=\"async\" width=\"2551\" height=\"1376\" src=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2.jpg\" class=\"attachment-full size-full wp-image-3247\" alt=\"\" srcset=\"https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2.jpg 2551w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2-300x162.jpg 300w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2-1024x552.jpg 1024w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2-768x414.jpg 768w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2-1536x829.jpg 1536w, https:\/\/datapy.fr\/wp-content\/uploads\/2021\/02\/robot2-2-2048x1105.jpg 2048w\" sizes=\"(max-width: 2551px) 100vw, 2551px\" \/><\/a><\/figure><div class=\"elementor-image-box-content\"><h3 class=\"elementor-image-box-title\"><a href=\"https:\/\/datapy.fr\/index.php\/2021\/02\/22\/en-route-vers-lautomatisation-iceberg-procrastination-et-noeud-gordien\/\"> En route vers l\u2019automatisation: iceberg, procrastination et n\u0153ud...<\/a><\/h3><p class=\"elementor-image-box-description\">Quels sont les freins et acc\u00e9l\u00e9rateurs du DevOps ? Iceberg Lorsque l\u2019on \u00e9voque l\u2019automatisation, le top management dispose trop souvent de peu d\u2019indicateurs sur le volume de taches automatisables dans son d\u00e9partement. En effet, les collaborateurs ont...<\/p><\/div><\/div>\t\t<\/div>\n\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t\t<\/section>\n\t\t\t\t<\/div>\n\t\t","protected":false},"excerpt":{"rendered":"<p>Forces et faiblesses de Spark et Elasticsearch Nous avons partag\u00e9 les enjeux li\u00e9s \u00e0 la techno du Serverless dans le pr\u00e9c\u00e9dent article. Nous allons creuser aujourd&rsquo;hui\u00a0les solutions les plus connues dans le domaine du traitement de donn\u00e9es \u00e0 grande \u00e9chelle, Spark et Elasticsearch. Spark (ou Apache Spark) est un framework open source de calcul distribu\u00e9. [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":3184,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[12],"tags":[],"class_list":["post-626","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data","entry","has-media"],"_links":{"self":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts\/626","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/comments?post=626"}],"version-history":[{"count":0,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/posts\/626\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/media\/3184"}],"wp:attachment":[{"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/media?parent=626"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/categories?post=626"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/datapy.fr\/index.php\/wp-json\/wp\/v2\/tags?post=626"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}