spark 5
- Cài đặt Apache Spark và Jupyter Lab trên Ubuntu với pip
- Khái niệm cốt lõi trong Spark SQL: Hive, Hive Metastore, Hive Warehouse, Catalog, và Managed/Unmanaged Tables
- Read/Write Dữ Liệu trong Apache Spark
- Tổng quan DataFrame trong Apache Spark: Khái Niệm, Schema, và Partitioning
- Reusable Utils & Code Snippets