Đầu ra:
WITH LastMonthOrders AS (
SELECT o.customerid, o.orderid, op.productid, op.quantity, p.productname, op.quantity * p.unitprice AS total_order_value
FROM orders o
JOIN order_details op ON o.orderid = op.orderid
JOIN products p ON op.productid = p.productid
WHERE o.orderdate >= date_trunc('month', CURRENT_DATE) - INTERVAL '1 month'
AND o.orderdate < date_trunc('month', CURRENT_DATE)
),
CustomerTotalOrderValue AS (
SELECT customerid, SUM(total_order_value) AS total_value
FROM LastMonthOrders
GROUP BY customerid
ORDER BY total_value DESC
LIMIT 1
)
SELECT c.customerid, c.companyname, lm.productid, lm.productname, lm.quantity
FROM CustomerTotalOrderValue ctov
JOIN LastMonthOrders lm ON ctov.customerid = lm.customerid
JOIN customers c ON c.customerid = lm.customerid;
1 bình luận
Ý kiến trên Hacker News
Điểm hiệu năng trên SQL-Eval là 76,5%, hơi kém hơn GPT-4 với 83% và sqlcoder-15b với 78%.
Tôi nghĩ các mô hình text-to-SQL không thực sự giải đúng vấn đề.
group by, mà là hiểu ý nghĩa của dữ liệu.Có người chỉ ra rằng đây không phải mã nguồn mở; do có các hạn chế dựa trên cách sử dụng nên có lẽ nên gọi là “source available”.
Đây là một lĩnh vực thú vị và đúng chỗ tôi quan tâm, nhưng tôi không nghĩ đó là một câu hỏi phức tạp, mà chỉ là một câu hỏi phân tích cơ bản.
Cũng như nhiều ứng dụng AI khác, nó rất tốt khi dùng làm "hạt giống" ban đầu, đặc biệt khi gợi ý những ý tưởng như nhóm theo phạm vi.
Những người nói rằng vì nó chỉ chính xác 75% nên vô dụng cần cân nhắc hai điều sau:
Tôi tò mò không biết nó hoạt động thế nào trên Bird, một benchmark phức tạp và thực tế hơn.
Dựa trên kinh nghiệm làm việc trong lĩnh vực dữ liệu, nhiều người nhận câu hỏi từ cấp quản lý, phải hiểu đủ rõ data warehouse để viết SQL trả lời câu hỏi đó, và đôi khi còn phải trình bày câu trả lời theo cách đẹp mắt.
Thật sự rất hay, dù giấy phép không phải loại tiêu chuẩn nhưng trông vẫn giống mã nguồn mở.
Rất hay, tôi tự hỏi giấy phép này có thể dùng cùng với Vanna hay không.