17 điểm bởi xguru 2021-05-04 | 1 bình luận | Chia sẻ qua WhatsApp

Các ví dụ phân tích dữ liệu bằng SQL thay vì Pandas

  • So sánh hiệu năng/bộ nhớ giữa SQL và Pandas

  • Cơ bản

→ Common Table Expressions

→ Tạo dữ liệu

→ Tạo ngẫu nhiên

→ Chọn ngẫu nhiên

→ Lấy mẫu

  • Thống kê mô tả

  • Tạo tổng phụ: Rollup, Cube, nhóm hóa

  • Tổng hợp lũy tích: hàm Window, Sliding Window

  • Hồi quy tuyến tính

  • Nội suy

  • Phân thùng

1 bình luận

 
xguru 2021-05-04

Thay vì xem nó như thứ thay thế toàn bộ quy trình phân tích dữ liệu, có lẽ nên xem đây là cách tiền xử lý bằng SQL để giảm bớt dữ liệu, nhờ đó làm cho Pandas vốn ngốn nhiều bộ nhớ trở nên nhẹ hơn.