Les débuts en Python
Débutez sur Python, le langage de programmation accessible et puissant, idéal pour les débutants comme pour les experts. Découvrez comment automatiser des tâches, analyser des données, et développer des applications rapidement grâce à sa syntaxe claire et ses vastes bibliothèques. Pour cela, téléchargez ce Cheat Sheets !
Pour rappel
Pour coder en Python, tu peux utiliser...
- Anaconda (ou simplement "conda")
- Visual studio Code et installer l'extension Jupyter Notebook
- Les variables sont les éléments de base de Python, qui contiennent nos données.
- Une variable peut donc contenir du texte, des chiffres, des listes...
- En fonction de son "type", il y a des méthodes pour manipuler et analyser ces variables.
Importer des packages
Les packages Python sont des collections d'outils open source, développés par la communauté. Ils étendent les capacités de python.
Pour installer un nouveau package (par exemple, pandas), vous pouvez accéder à votre invite de commande et saisir pip install pandas. Une fois un package installé, vous pouvez l'importer comme cela :
Répertoire de travail
Le répertoire de travail est le chemin de fichier par défaut dans lequel Python lit ou enregistre les fichiers. Un exemple de répertoire de travail est ”C://file/path". La bibliothèque os est nécessaire pour définir et obtenir le répertoire de travail.
Les types de données
Les boucles
Deux types de boucles sont particulièrement essentiels : la boucle "for" et la boucle "while".
Les listes
- La liste est un type de variable défini par des [ ].
- Une liste peut elle-même contenir plusieurs types (int, float, string, etc.).
- On peut l'utiliser comme itérateur dans une boucle.
Les dictionnaires
Le dictionnaire possède une structure {clé : valeur} où la clé serait le mot et la valeur sa définition.
Création d’un dictionnaire
NumPy
NumPy est le package permettant de manipuler et d'analyser des arrays, c'est-à-dire des listes avec quelques avantages supplémentaires.Un array est une matrice, mais qui peut avoir plusieurs dimensions.
D’autre part, plus d'opérations sont autorisées sur les arrays que sur les listes : multiplication, division, moyenne etc.
Le slicing d'un array utilise également la syntaxe avec les [ ].
Pandas
Pandas est le package le plus utilisé de l'analyse de données avec Python. Il permet de lire des données tabulaires et les afficher sous la forme de tableaux, appelés dataframes.
Le package Pandas nous fournit de nombreuses fonctions pour les manipuler.La sélection de données avec Pandas utilise la méthode généraliste du slicing, vue précédemment pour les listes et arrays. Le slicing peut être conditionnel, c'est-à-dire intégrer une condition pour filtrer le dataframe. Pandas fournit également des méthodes supplémentaires pour sélectionner les données plus précisément (loc et iloc).