Devenez opérationnel

Big Data Analytics avec Python

Modélisation & Exploration de Données Massives
Formation pratique pour maîtriser l’analyse de données massives avec Python, de la préparation des jeux de données à la modélisation prédictive et à la visualisation interactive.

Objectifs de la formation

  • Acquérir les fondamentaux de la data science et du big data en environnement Python
  • Acquérir les fondamentaux de la data science et du big data en environnement Python
  • Maîtriser les outils de modélisation et d’évaluation d’algorithmes prédictifs
  • Maîtriser les outils de modélisation et d’évaluation d’algorithmes prédictifs
  • Explorer, transformer et analyser de grands jeux de données structurés et non structurés
  • Explorer, transformer et analyser de grands jeux de données structurés et non structurés
  • Mettre en œuvre des analyses statistiques, textuelles et visuelles à grande échelle
  • Mettre en œuvre des analyses statistiques, textuelles et visuelles à grande échelle

Public

  • Responsables et analystes métiers (marketing, qualité, risque, RH…)
  • Développeurs, chefs de projets, consultants data

Prérequis

  • Connaissances de base en Python (structures, boucles, fonctions)
  • Notions en statistiques descriptives et modélisation

Contenu de la formation

Introduction à la Data Science & à l’environnement Python

  • Rappels Python : structures, librairies (NumPy, pandas, matplotlib)
  • Notebooks interactifs (Jupyter, Google Colab)
  • Présentation des grandes étapes d’un projet data

Préparation & traitement des données volumineuses

  • Nettoyage et exploration (EDA) de datasets massifs
  • Gestion des données manquantes et catégorielles
  • Optimisation mémoire et temps de traitement
  • Chargement depuis CSV, SQL, API, JSON, etc.

Modélisation supervisée

  • Régression linéaire et logistique
  • Arbres de décision, Random Forest, Gradient Boosting
  • Évaluation : courbes ROC, AUC, scores F1, précision/rappel
  • Validation croisée, overfitting, sélection de variables

Modélisation non supervisée

  • Clustering (k-means, DBSCAN, hiérarchique)
  • Réduction de dimension : PCA, t-SNE, UMAP
  • Détection d’anomalies

Analyse de données textuelles (NLP)

  • Nettoyage, tokenisation, lemmatisation
  • Nettoyage, tokenisation, lemmatisation
  • Analyse de sentiments, catégorisation, résumé automatique

Visualisation & restitution des résultats

  • Graphiques interactifs avec seaborn, plotly
  • Dashboarding avec Streamlit ou Dash
  • Data storytelling et communication des résultats

Equipe pédagogique

Nos formations dont animées par des experts reconnus dans leur domaine possédant une expérience sur le terrain significative et des compétences pédagogiques reconnues.

Référent pédagogique et technique
Haciba, responsable pédagogique, est à votre disposition pour toute question relative au contenu, aux objectifs ou à l’organisation de la formation. Vous pouvez la joindre par téléphone au 01 53 90 15 20 ou par mail : esic(@)esic-online.com.  Nous encourageons les apprenants à prendre contact pour toute précision ou pour discuter d’éventuels besoins spécifiques liés à leur parcours.

Suivi de l'exécution et évaluation des résultats

Dispositions spécifiques à cette formation

  • Questionnaire de positionnement initial
  • Évaluation continue via des exercices pratiques
  • Mini-projet final évalué avec grille de compétences
  • Questionnaire de satisfaction et certificat de réalisation

Dispositions relatives à l’ensemble des formations

Nous mettons en place un suivi rigoureux et une évaluation complète des résultats pour garantir la qualité et l’efficacité de nos formations.

  • Avant la formation:
    • Entretien individuel ou questionnaire de positionnement: Permet d’analyser les besoins spécifiques des participants et d’ajuster les contenus pédagogiques en conséquence.
  • Pendant la formation:
    • Exercices pratiques et mises en situation: Ces activités sont intégrées tout au long de la formation pour valider les acquis en temps réel.
    • Feuilles de présence: Chaque participant émarge une feuille de présence par demi-journée, également signée par le formateur, assurant le suivi administratif.
  • Après la formation:
    • Questionnaire de satisfaction à chaud: Administré immédiatement après la formation pour recueillir un retour sur la qualité des contenus et de l’animation.
    • Questionnaire de satisfaction à froid: Envoyé trois mois après la formation pour évaluer l’impact réel sur les pratiques professionnelles.
    • Questionnaire d’auto-évaluation possible: Permet aux participants de mesurer leurs progrès à l’issue de la formation.
    • Certification(optionnelle) : Passage de la certification en conditions d’examen ou via télésurveillance, selon le dispositif retenu.
    • Certificat de réalisation: Remis à l’issue de la formation, attestant de la participation effective des apprenants.

 

Nous veillons à accompagner les participants avant, pendant et après la formation pour maximiser leur progression et mesurer les retombées concrètes dans leur environnement professionnel.

Ressources techniques et pédagogiques

  • Alternance théorie/pratique sur des cas réels
  • Ateliers guidés de modélisation de bout en bout
  • Utilisation de notebooks interactifs et datasets variés
  • Pédagogie orientée projets avec feedback régulier

Accessibilité

Nous accordons une attention particulière à l’accueil des personnes en situation de handicap. Si vous êtes concerné(e) et souhaitez suivre cette formation, nous vous invitons à nous contacter dès que possible. Ensemble, nous étudierons vos besoins spécifiques et mettrons en place les adaptations nécessaires pour garantir votre accès à la formation dans les meilleures conditions.

Délai d'accès

L’inscription à cette formation est possible dans un délai de 2 semaines avant le début de la session. Ce délai permet de finaliser les démarches administratives, de confirmer la prise en charge éventuelle des frais de formation et d’assurer une préparation optimale des participants.

Pour toute demande spécifique ou situation particulière, nous vous invitons à nous contacter afin d’étudier ensemble les possibilités d’adaptation.

Prérequis technique

Pour suivre cette formation dans de bonnes conditions, les moyens techniques suivants sont requis :

  • En présentiel:
    • Tableau blanc ou paperboard, et un vidéoprojecteur pour les présentations.
    • Outils pour le partage de documents avec les formateurs et autres participants.
  • À distance:
    • Un logiciel de visioconférencecompatible (Teams, Zoom ou équivalent) pour participer aux sessions en ligne.
    • Possibilité de partage d’écran entre le formateur et les participants.
    • Accès à une plateforme pour le partage des documents pédagogiques et supports de formation.
    • Connexion internet haut débit pour garantir une expérience fluide et interactive.

 

Nous vous recommandons de vérifier la disponibilité et la fonctionnalité de ces moyens techniques avant le début de la formation. En cas de difficulté, n’hésitez pas à nous contacter pour trouver une solution adaptée.

Actualisation du programme