3 điểm bởi GN⁺ 2025-08-25 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • PositronIDE chuyên dụng cho khoa học dữ liệu thế hệ mới do Posit, công ty tạo ra RStudio, mới phát triển
  • IDE này hỗ trợ R và Python mặc định, đồng thời là một nền tảng đa ngôn ngữ (polyglot) được thiết kế phù hợp với môi trường khoa học dữ liệu thường xuyên kết hợp nhiều ngôn ngữ
  • Về cấu trúc, nó dựa trên Code OSS của VS Code, mang lại môi trường quen thuộc và khả năng mở rộng phong phú, đồng thời tích hợp các tính năng chuyên biệt cho nhà khoa học dữ liệu như đồ thị, biến, trợ giúp, trình khám phá dữ liệu
  • Thông qua kernel R mới Arkhỗ trợ cú pháp R bằng Tree-sitter, công cụ này cải thiện đáng kể việc thực thi mã, tự động hoàn thành, gỡ lỗi và duyệt tài liệu, đồng thời còn hỗ trợ gỡ lỗi mã kết hợp giữa R và C++
  • RStudio vẫn tiếp tục được duy trì và hỗ trợ ổn định, nhưng Positron được kỳ vọng sẽ dần trở thành trung tâm của môi trường phát triển khoa học dữ liệu về lâu dài nhờ đa ngôn ngữ, khả năng mở rộng và kiến trúc hiện đại

Giới thiệu về Positron và sự cần thiết

  • IDE chuyên dụng cho khoa học dữ liệu, mang lại trải nghiệm được tùy biến cho công việc tập trung vào phân tích dữ liệu, khác với IDE phát triển phần mềm thông thường
  • Theo đuổi cách tiếp cận code-first, không phải công cụ dựa trên GUI, từ đó cung cấp môi trường giúp nâng cao năng suất và khả năng tái lập
  • Vượt qua giới hạn của các IDE hiện có (RStudio, Spyder, MATLAB, v.v.) vốn tập trung vào một ngôn ngữ duy nhất, để phù hợp với quy trình làm việc thực tế nơi nhiều ngôn ngữ được dùng kết hợp

Tính năng chính

  • Hỗ trợ đa ngôn ngữ: hiện hỗ trợ R và Python, và về mặt cấu trúc có thể mở rộng sang các ngôn ngữ khác
  • Giao diện quen thuộc nhưng có thể mở rộng: cung cấp cấu trúc 4 khung tương tự RStudio (nguồn, console, biến, đồ thị), đồng thời sở hữu khả năng mở rộng dựa trên VS Code
  • Engine theo ngôn ngữ (Language Packs): Python và R hoạt động như các phần mở rộng độc lập để duy trì độ ổn định của IDE; khi bị crash, toàn bộ IDE sẽ không bị treo

Ark dành cho hỗ trợ R

  • Ark (An R Kernel): kernel Jupyter mới cho R, cung cấp khả năng thực thi mã, tự động hoàn thành, chẩn đoán và gỡ lỗi
  • Mới phát triển hỗ trợ cú pháp R bằng Tree-sitter, có thể được tận dụng cả trong tìm kiếm mã của GitHub và các IDE khác (Zed, Neovim, v.v.)
  • Đổi mới trình gỡ lỗi: có thể step-through trực tiếp từ mã R sang mã C++, tối đa hóa hiệu quả gỡ lỗi khi phát triển gói dựa trên Rcpp/cpp11

Tính năng chuyên biệt cho khoa học dữ liệu

  • Trình khám phá dữ liệu (Data Explorer): vượt ra ngoài bảng đơn giản (grid), cung cấp thống kê tóm tắt, kiểm tra giá trị khuyết, lọc đa điều kiện và histogram sparkline
  • Khung biến (Variables Pane): có thể xem tên biến, kiểu, phần xem trước và mở rộng để khám phá dictionary
  • Khung đồ thị (Plots Pane): hỗ trợ tích lũy, so sánh kết quả trực quan và xuất ra nhiều định dạng (PNG, SVG, PDF, v.v.)
  • Khung trợ giúp (Help Pane): khi nhập ? sau tên hàm, có thể xem ngay tài liệu và ví dụ; mang thế mạnh của RStudio đến cả người dùng Python

Nền tảng kỹ thuật và kiến trúc

  • Khác với RStudio, công cụ này không dùng cấu trúc đơn tiến trình mà áp dụng kiến trúc nhiều lớp dựa trên Code OSS của VS Code
  • Sử dụng các giao thức tiêu chuẩn:
    • Thực thi mã → Jupyter Protocol
    • Hỗ trợ mã (tự động hoàn thành, kiểm tra cú pháp) → Language Server Protocol
    • Gỡ lỗi → Debug Adapter Protocol
  • Nhờ sự tiêu chuẩn hóa này, công cụ có thể tương thích lẫn nhau với nhiều môi trường như Jupyter Notebook, Zed IDE, v.v.

Cộng đồng và khả năng mở rộng

  • Có thể dùng vô số phần mở rộng tương thích VS Code thông qua Open VSX marketplace (tuy nhiên không dùng được GitHub Copilot)
  • Có thể mở rộng chức năng bằng các extension như Quarto, Shiny, kết nối cơ sở dữ liệu, v.v.
  • Tăng cường tùy biến cho người dùng như dark theme, thay đổi bố cục, tương thích keymap của RStudio

Mối quan hệ với RStudio

  • RStudio sẽ tiếp tục được duy trì và hỗ trợ, với thế mạnh là độ ổn định và mức độ hoàn thiện, nên dự kiến vẫn sẽ được nhiều người dùng sử dụng trong thời gian tới
  • Positron là một lựa chọn mới mang tính thử nghiệm và có khả năng mở rộng cao, đồng thời gợi mở lộ trình tiến hóa dài hạn của IDE khoa học dữ liệu

Người dùng phù hợp với Positron

  • Người dùng VS Code: khi cảm thấy thiếu các tính năng chuyên biệt cho khoa học dữ liệu
  • Người dùng JupyterLab/notebook: khi muốn mở rộng sang một IDE mạnh mẽ và hoàn chỉnh hơn
  • Người dùng RStudio: khi muốn tăng cường khả năng tùy biến và mở rộng của IDE
  • Người dùng đa ngôn ngữ: khi sử dụng thêm Rust, C++, JavaScript, Lua ngoài Python và R
  • Người dùng định hướng tận dụng AI: khi muốn các tính năng tích hợp AI chuyên biệt cho khoa học dữ liệu

Triển vọng sắp tới

  • Dự kiến sẽ hỗ trợ tích hợp Posit Workbench và Cloud; các tính năng cộng tác (chia sẻ thời gian thực, chia sẻ workspace) cũng đang được nghiên cứu
  • Có kế hoạch tăng cường khả năng xử lý dữ liệu on-disk như hỗ trợ dữ liệu quy mô lớn, tích hợp DuckDB và Arrow
  • Với các thế mạnh đa ngôn ngữ, khả năng mở rộng và nền tảng giao thức tiêu chuẩn, Positron có khả năng cao trở thành tiêu chuẩn thế hệ tiếp theo cho IDE khoa học dữ liệu

Chưa có bình luận nào.

Chưa có bình luận nào.