Tôi có phần đồng cảm với ý kiến của John hơn.
Có lẽ điều cốt lõi là không nên vô điều kiện làm theo lời của hai người như một giáo điều, mà phải hiểu vì sao lại như vậy rồi tiếp tục tiến lên.
Có vẻ như chỉ nên dùng biểu tượng trong những tình huống có thể hiểu ngay trong một cái nhìn, và nhất thiết phải có tính năng nhấn giữ để hiển thị văn bản hỗ trợ.
Cá nhân tôi đang dùng Clojure và rất đồng cảm với nội dung trong bài.
Trong công việc, tôi chủ yếu dùng Python và Java(Type)Script, nhưng chỉ cần lơ là quản lý một chút là rất dễ không theo kịp sự thay đổi của chính ngôn ngữ và các thư viện, khiến mã nhanh chóng trở thành legacy code. Điều tôi rất hài lòng ở Clojure là dù nhìn lại đoạn mã đã viết sau một năm, việc chỉnh sửa và phát triển tiếp vẫn rất dễ dàng ngay lập tức.
Từ đó về sau, cho mục đích cá nhân, trừ khi bị ràng buộc bởi một thư viện cụ thể, tôi vẫn ưu tiên dùng Clojure.
Rất đắt, không có tỷ lệ giá/hiệu năng tốt. Trong sử dụng thực tế thì có vẻ o3-mini còn tốt hơn, nhưng nếu dùng cho lập trình thì vì cần bước suy luận ngắn và phải giải quyết token trung gian nên xét riêng cho mục đích đó có vẻ là tốt nhất. Giá thì cũng..
Tôi là hahnlee, người từng phát triển hwp.js (https://github.com/hahnlee/hwp.js) :)
Khi phát triển dự án đó, và cả bây giờ nữa, tôi không thực sự thích HWP lắm. Đặc biệt là về mức độ công khai của nó.
Tuy vậy, tôi phần nào đồng ý với ý rằng "định dạng HWP có những yếu tố thuận lợi cho việc huấn luyện AI".
Nói từ kinh nghiệm khi xây dựng RAG, ở Hàn Quốc người ta đặc biệt dùng bảng rất nhiều. Với PDF, vì đây là định dạng được tạo ra với giả định để in ấn, nên trong PDF không có khái niệm "bảng". Chỉ có các đoạn thẳng và văn bản mà thôi.
Vì vậy, việc trích xuất dữ liệu từ thông tin bảng phức tạp trên tài liệu PDF là rất khó. Đặc biệt là cả trong trường hợp bảng kéo dài sang trang khác.
Nói ví von một cách thô thì nếu HWP giống như một loại tài liệu rich text, thì PDF cho cảm giác như tài liệu txt. Tất nhiên đây chỉ là câu chuyện giới hạn trong phạm vi "bảng".
Nhưng nếu hỏi đó có phải là ưu điểm đặc trưng của định dạng HWP hay không, thì tôi nghĩ là không. Những gì đơn giản thì Markdown là đủ, còn nếu phức tạp hơn thì tôi nghĩ định nghĩa bằng HTML sẽ tốt hơn.
Và quan trọng nhất là docx hay odt cũng có cùng những ưu điểm đó.
Tôi không thích hwp và cũng không thể nói tốt về các sản phẩm của công ty Hancom hiện nay, nhưng tôi nghĩ rằng ngày trước bản thân sản phẩm này là phần mềm xuất sắc hơn Word rất nhiều.
Để trả lời chính xác thì ngay cả cùng một cuốn sách, nếu định dạng khác nhau thì phải được cấp ISBN riêng. Thậm chí ebook epub và pdf cũng phải có ISBN riêng.
Để trả lời ý của bạn phía trên, trong trường hợp ebook ở Hàn Quốc, như đã đề cập trong bài, đó là khái niệm mua “quyền dịch vụ”, nên hơi khác với khái niệm sở hữu chính nội dung. Ngoài ra, mỗi nhà sách cũng áp dụng DRM khác nhau. Vì vậy, ebook đã bỏ tiền mua lại không thể sử dụng thuận tiện trong mọi môi trường, nên cần có luật phù hợp với thời đại. Buồn thật.
Cá nhân tôi thì mong rằng, giống như MyData trong ngành tài chính, tài liệu số dù mua ở đâu cũng có thể được tôi sử dụng theo hình thức mình mong muốn.
Tôi có phần đồng cảm với ý kiến của John hơn.
Có lẽ điều cốt lõi là không nên vô điều kiện làm theo lời của hai người như một giáo điều, mà phải hiểu vì sao lại như vậy rồi tiếp tục tiến lên.
Việc tái sử dụng cách giải quyết xung đột thật hay.
Đúng là điều quan trọng vẫn là sự vừa phải.
Khi xem diff, tôi có dùng
git-deltađể xem theo kiểu TUI.Nếu ngại cả cái này lẫn cái kia thì dùng
tigvậy.... hahaCó gì hay hơn nữa không nhỉ...?
Rất hữu ích 👍🏻
Dù vậy, tôi vẫn muốn thử.
Dù nhìn kiểu nào thì cũng có cảm giác như đang giải một bài toán dễ theo cách quá phức tạp...
Tôi đã đọc bài này rất thú vị.
Mọi người thật tuyệt vời. :)
Tôi cứ tưởng Công đảng Anh đứng về phía cánh tả hơn Đảng Bảo thủ chứ, ha ha~
Obsidian♡
Có vẻ như chỉ nên dùng biểu tượng trong những tình huống có thể hiểu ngay trong một cái nhìn, và nhất thiết phải có tính năng nhấn giữ để hiển thị văn bản hỗ trợ.
Cá nhân tôi đang dùng Clojure và rất đồng cảm với nội dung trong bài.
Trong công việc, tôi chủ yếu dùng Python và Java(Type)Script, nhưng chỉ cần lơ là quản lý một chút là rất dễ không theo kịp sự thay đổi của chính ngôn ngữ và các thư viện, khiến mã nhanh chóng trở thành legacy code. Điều tôi rất hài lòng ở Clojure là dù nhìn lại đoạn mã đã viết sau một năm, việc chỉnh sửa và phát triển tiếp vẫn rất dễ dàng ngay lập tức.
Từ đó về sau, cho mục đích cá nhân, trừ khi bị ràng buộc bởi một thư viện cụ thể, tôi vẫn ưu tiên dùng Clojure.
Bạn viết hay quá.
Tôi đã đọc rất thích!
Rất đắt, không có tỷ lệ giá/hiệu năng tốt. Trong sử dụng thực tế thì có vẻ o3-mini còn tốt hơn, nhưng nếu dùng cho lập trình thì vì cần bước suy luận ngắn và phải giải quyết token trung gian nên xét riêng cho mục đích đó có vẻ là tốt nhất. Giá thì cũng..
So với flash 2 thì chênh lệch giá quá lớn để đem ra so.. đúng kiểu nằm giữa o1pro và o3-mini.
Tôi là hahnlee, người từng phát triển hwp.js (https://github.com/hahnlee/hwp.js) :)
Khi phát triển dự án đó, và cả bây giờ nữa, tôi không thực sự thích HWP lắm. Đặc biệt là về mức độ công khai của nó.
Tuy vậy, tôi phần nào đồng ý với ý rằng "định dạng HWP có những yếu tố thuận lợi cho việc huấn luyện AI".
Nói từ kinh nghiệm khi xây dựng RAG, ở Hàn Quốc người ta đặc biệt dùng bảng rất nhiều. Với PDF, vì đây là định dạng được tạo ra với giả định để in ấn, nên trong PDF không có khái niệm "bảng". Chỉ có các đoạn thẳng và văn bản mà thôi.
Vì vậy, việc trích xuất dữ liệu từ thông tin bảng phức tạp trên tài liệu PDF là rất khó. Đặc biệt là cả trong trường hợp bảng kéo dài sang trang khác.
Nói ví von một cách thô thì nếu HWP giống như một loại tài liệu rich text, thì PDF cho cảm giác như tài liệu txt. Tất nhiên đây chỉ là câu chuyện giới hạn trong phạm vi "bảng".
Nhưng nếu hỏi đó có phải là ưu điểm đặc trưng của định dạng HWP hay không, thì tôi nghĩ là không. Những gì đơn giản thì Markdown là đủ, còn nếu phức tạp hơn thì tôi nghĩ định nghĩa bằng HTML sẽ tốt hơn.
Và quan trọng nhất là docx hay odt cũng có cùng những ưu điểm đó.
Sau khi Netscape bị IE đánh cho tơi tả, rồi mới tung mã nguồn ra các kiểu và cuống cuồng gõ nhịp trễ mất rồi.
Tôi không thích hwp và cũng không thể nói tốt về các sản phẩm của công ty Hancom hiện nay, nhưng tôi nghĩ rằng ngày trước bản thân sản phẩm này là phần mềm xuất sắc hơn Word rất nhiều.
Để trả lời chính xác thì ngay cả cùng một cuốn sách, nếu định dạng khác nhau thì phải được cấp ISBN riêng. Thậm chí ebook
epubvàpdfcũng phải có ISBN riêng.Để trả lời ý của bạn phía trên, trong trường hợp ebook ở Hàn Quốc, như đã đề cập trong bài, đó là khái niệm mua “quyền dịch vụ”, nên hơi khác với khái niệm sở hữu chính nội dung. Ngoài ra, mỗi nhà sách cũng áp dụng DRM khác nhau. Vì vậy, ebook đã bỏ tiền mua lại không thể sử dụng thuận tiện trong mọi môi trường, nên cần có luật phù hợp với thời đại. Buồn thật.
Cá nhân tôi thì mong rằng, giống như MyData trong ngành tài chính, tài liệu số dù mua ở đâu cũng có thể được tôi sử dụng theo hình thức mình mong muốn.