7 điểm bởi bluearisu 2022-01-20 | 2 bình luận | Chia sẻ qua WhatsApp
  • Ngành thương mại điện tử đã tăng trưởng nhanh chóng do COVID-19

  • Thanh toán số tăng lên kéo theo gian lận thanh toán cũng gia tăng

  • PayPal ngăn chặn gian lận bằng phân tích đồ thị thời gian thực

  • Việc tính toán thời gian thực có được nhờ framework DSL đồ thị mã nguồn mở Apache Gremlin

  • Công nghệ đồ thị rất hiệu quả trong việc phát hiện và ngăn chặn gian lận trong ngành thương mại điện tử

2 bình luận

 
kwangyeol 2022-01-20

Tôi thấy thú vị khi lại bắt gặp những từ khóa đã lâu không thấy.

Aerospike là một kho lưu trữ key-value mã nguồn mở (APL). Nó được tối ưu để hoạt động trên in-memory và SSD nên hiệu năng rất cao. Tuy vậy, theo tôi biết thì có những ràng buộc về kích thước cụm, khóa và giá trị, nên cần cân nhắc khi triển khai.

Tôi nghĩ việc đặt một lớp truy vấn lên trên kho lưu trữ key-value, ở đây là Gremlin, là một kiến trúc hợp lý. Xây dựng một lớp truy vấn đồ thị ngay từ đầu không hề dễ.

Tuy nhiên, khá tiếc là phần giải thích về cấu hình vật lý còn thiếu. Do truy vấn của cơ sở dữ liệu đồ thị rất phức tạp, khi tách biệt node dữ liệu và node truy vấn hoặc khi scale-out thì hiệu năng giảm rất mạnh. Vì các truy vấn phức tạp, dữ liệu tạm phục vụ tính toán có thể tích tụ rất lớn ở các node trung gian, dễ gây thiếu bộ nhớ và làm QPS giảm xuống.

Tôi tò mò không biết họ đã giải quyết vấn đề này bằng cách scale-up hay scale-out; nếu là scale-out thì sẽ hay hơn nếu họ mô tả chi tiết hơn về quá trình đó.

Có cảm giác đã 8 năm kể từ lần cuối tôi thấy những thứ như Gremlin hay Titan, và dường như lĩnh vực cơ sở dữ liệu đồ thị phát triển không nhanh như tôi từng nghĩ.

 
bluearisu 2022-01-21

Nội dung hơi khó nên ban đầu tôi thấy khó hiểu, nhưng sau khi đọc bình luận thì đã dễ hiểu hơn một chút. Cảm ơn.