CSV and Parquet Fundamentals: File Formats, Schemas, and Data Quality
A practical two-hour session on CSV and Parquet Fundamentals, focused on File Formats, Schemas, and Data Quality. Attendees work through concrete engineering tradeoffs, review examples, and leave with a checklist they can apply in real team projects.
Description
section.descriptionUne session pratique de deux heures sur les fondamentaux du CSV et du Parquet, axée sur les formats de fichiers, les schémas et la qualité des données. Les participants exploreront des compromis d'ingénierie concrets, examineront des exemples et repartiront avec une liste de contrôle applicable à leurs projets d'équipe.
Public cible : développeurs débutants et intermédiaires souhaitant une session d'ingénierie pratique plutôt qu'une présentation de langage.
Objectifs :
- Expliquer les limites pratiques des fondamentaux du CSV et du Parquet
- Appliquer les formats de fichiers dans un petit exemple concret
- Appliquer les schémas dans un petit exemple concret
- Appliquer la qualité des données dans un petit exemple concret
Format : deux heures comprenant une courte présentation de cadrage, un exemple concret, une discussion sur les compromis et une liste de contrôle finale pour la pratique.