Recherche détaillée

Le moteur de recherche et d’analyse distribué Elasticsearch - Offre de formation

Docdoku

Docdoku

Organisme de formation depuis 2009, nous formons vos équipes aux technologies Web, Mobile, Java, DevOps ainsi que sur notre plateforme digitale de gestion des données métier.

Experts sur les sujets enseignés, nous vous ferons profiter de nos réels retours d’expérience puisque nous intervenons également sur des missions…
découvrir Docdoku

Le moteur de recherche et d’analyse distribué Elasticsearch - Détail de la Formation

Présentation
Construit sur la base du moteur d’indexation et de recherche Lucene, Elasticsearch a su tirer le maximum de cette librairie open source en y ajoutant des facilités d’interrogation et des fonctions de distribution en cluster autorisant une excellente montée en charge.
Aujourd’hui grâce à sa grande tolérance aux pannes, sa capacité à traiter de gros volumes de données et ses fonctionnalités d’analyse, Elasticsearch est devenu un moteur de recherche très populaire et cela bien au-delà du cercle des développeurs Java, premiers utilisateurs de Lucene.

Objectifs
Cette formation s’adresse à tous ceux désireux d’exploiter ce système de gestion de données. Les API, les stratégies d’indexation et de requêtage seront passées en revue. Par ailleurs, nous ne ferons pas l’impasse sur les principes architecturaux tant ils sont au cœur de la valeur ajoutée d’Elasticsearch. Un TP fil rouge réaliste accompagnera les stagiaires tout au long de leur apprentissage pour ainsi illustrer les cas d’utilisation où le moteur de recherche prend tout son sens.

Public visé
Architectes techniques, développeurs

Prérequis
Quelques notions NoSQL, REST

Programme

# Découverte
Une surcouche de Lucene
Mais qu’est ce que Lucene ?
Les apports à la librairie historique
Une API CRUD simplifiée
Vous avez dit NoSQL ?
Les entités d’ES
--------------------------------
# Architecture logiciel
Les nœuds, les indexes et les shards
Clusterisé par nature
Shard primaire et répliqué
Installation et paramétrage
--------------------------------
# Au cœur de l’API
API REST HTTP
De nombreux SDK (Java, Python…)
Exemples CRUD
Illustration avec Curl et NodeJS
Protocoles natifs
Intégration dans une application Java
--------------------------------
# Modélisation des données
Les enjeux du mapping
Les types de données
Analysé ou pas ?
Choix de l’analyseur
Stratégie de jointure
Gestion des nested
Parent/Enfant avec le type join
--------------------------------
# Focus sur la recherche
Query DSL (Domain Specific Language)
Filtres et requêtes
Utilisation de Kibana
Cumuler filtres et requêtes
Les types de recherche (exact, partial, proximity matching…)
Recherche géospatiale
Mise en cache
L’agrégation
La Percolation (Percolate Query)
--------------------------------
# Gestion du scoring
Les boost values
La fréquence des termes
Fréquence des termes dans l’index
Le nombre de documents
Le facteur taille du document
Les fonctions de boost
Extension par scripts
--------------------------------
# Administration et outillage
Traitements pipeline
Supervision du cluster
Sauvegarde et restauration
Optimisation des performances
La sécurité
Collecter les données avec Logstash
Installation d’extensions
Les plugins essentiels

Contact référent : Madame Laurie Pujos

Coût : 1 595 €

Durée : 3 jours

Formation Formations Qualifiantes

Niveau d'études requis : aucun

Offre de formation : dans nos locaux, à distance, inter entreprise, intra entreprise

Point orange : centre de formation
Zone foncée : intra/inter entreprises

Public concerné : Salarié du Privé, Salarié du Public, Entreprise - (Département RH - Formation)

Dispositifs éligibles : PF - Plan de Formation

Sessions : nous consulter

Demande de rappel

 

Haut de Page