3 điểm bởi GN⁺ 2023-09-16 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Bài viết nói về API yêu thích nhất của tác giả, tức zipfile trên website của Ngân hàng Trung ương châu Âu, và zipfile này cung cấp dữ liệu lịch sử về vị thế của đồng euro so với các đồng tiền khác.
  • Tác giả cho thấy cách dùng nhiều công cụ như curl, gunzip, sqlite3, pandas để tải dữ liệu từ zipfile, giải nén và truy vấn nó.
  • Dữ liệu lấy từ zipfile ở định dạng "wide", với một cột ngày và các cột bổ sung cho từng đồng tiền, điều này không lý tưởng cho việc lọc và tổng hợp.
  • Tác giả dùng pandas để chuyển dữ liệu từ định dạng "wide" sang định dạng "long", tức thực hiện thao tác "melting".
  • Tác giả cũng chỉ ra có vấn đề trong dữ liệu: dấu phẩy thừa ở cuối mỗi dòng cản trở quá trình melting. Điều này được giải quyết bằng cách thêm .iloc[:, :-1] vào chuỗi phương thức của pandas.
  • Tác giả thừa nhận rằng việc xử lý dữ liệu này đòi hỏi công việc "chuẩn bị dữ liệu", nhưng cũng lưu ý rằng dữ liệu ngoại hối của ECB tương đối dễ làm việc hơn so với nhiều bản phát hành dữ liệu mở khác.
  • Sau đó, tác giả trình bày cách tải dữ liệu đã được làm sạch lên bảng csvbase và cách vẽ biểu đồ dữ liệu bằng gnuplot.
  • Tác giả cũng giới thiệu một công cụ tên là DuckDB, tương tự sqlite nhưng theo kiểu columnar, và cho thấy cách dùng nó để nạp trực tiếp CSV từ HTTP vào một file bảng.
  • Tác giả chỉ ra rằng dữ liệu mở có thể hoạt động như một open API, đồng thời khen sự đơn giản của zipfile của ECB như một định dạng trao đổi dữ liệu.
  • Tác giả cũng cung cấp một lịch sử ngắn gọn của đồng euro và giải thích vì sao nó yếu hơn so với đô la khi mới ra mắt vào năm 2000.

Chưa có bình luận nào.

Chưa có bình luận nào.