1 điểm bởi GN⁺ 2023-12-01 | 1 bình luận | Chia sẻ qua WhatsApp

Quá trình phát hiện và khắc phục một lỗi kỳ lạ

  • Trong ca trực on-call của nhóm công cụ nội bộ, những người dùng sử dụng phần mềm nội bộ của Gusto đã gặp sự cố trình duyệt Chrome bị crash.
  • Sự cố này gây ra nhiều gián đoạn cho bộ phận dịch vụ khách hàng.
  • Để xử lý vấn đề, tác giả đã nhờ đến sự hỗ trợ của các đồng nghiệp giàu kinh nghiệm, nhóm hạ tầng sản phẩm và nhóm IT.

Manh mối đầu tiên

  • Tác giả cố gắng tìm ra điểm chung giữa những người dùng bị ảnh hưởng.
  • Không phải toàn bộ nhân viên Gusto đều bị ảnh hưởng, và phần mềm phục vụ khách hàng bên ngoài thì không gặp vấn đề.
  • Các trang web phần mềm nội bộ khác vẫn hoạt động bình thường.
  • Việc crash xảy ra không nhất quán, và không xuất hiện trên Safari hay Firefox.

Manh mối thứ hai

  • Tác giả đưa ra giả thuyết rằng phiên bản Chrome có thể là nguyên nhân.
  • Với một số người dùng, vấn đề có vẻ được giải quyết sau khi cập nhật Chrome, nhưng không được khắc phục hoàn toàn.
  • Tác giả cũng nghi ngờ tiện ích mở rộng Chrome là nguyên nhân, nhưng lỗi vẫn tái hiện ngay cả khi không có extension.

Khó khăn trong việc tái hiện lỗi

  • Nhóm hạ tầng đã yêu cầu toàn bộ kỹ sư thử tái hiện vấn đề.
  • Ngoài hai kỹ sư ở Thổ Nhĩ Kỳ, phía đội ngũ kỹ sư không có thêm báo cáo nào về việc Chrome bị crash.
  • Tính năng báo cáo crash của Chrome bị vô hiệu hóa vì lý do bảo mật, khiến việc xử lý vấn đề trở nên khó khăn hơn.

Bước ngoặt may mắn

  • Một kỹ sư ở Denver báo rằng vấn đề bắt đầu xảy ra sau khi tải ứng dụng desktop Grammarly.
  • Họ phát hiện rằng xóa ứng dụng Grammarly và khởi động lại máy tính thì vấn đề được giải quyết.

Tiến triển

  • Khi đã có thể debug, tác giả thử nhiều cách để tìm ra nguyên nhân của vấn đề.
  • Ứng dụng nội bộ chính được xây trên nền ActiveAdmin, nhưng các phần mới dùng React lại không bị crash.
  • Trong lúc điều tra phần mã dùng chung, tác giả phát hiện menu thả xuống My History là nguyên nhân gây ra vấn đề.

Giải quyết vấn đề

  • Tệp ảnh loader-spinner.gif được xác định là thứ gây ra lỗi.
  • Khi thay GIF đó bằng một ảnh khác, trang không còn bị crash nữa.
  • Không rõ là Grammarly hay Chrome đã sửa vấn đề, vì hiện tại GIF gốc cũng không còn làm Chrome bị crash nữa.

Kết luận

  • Một ảnh GIF động ngoài dự đoán lại chính là lời giải cho quá trình debug.
  • Vấn đề được giải quyết nhờ sự tò mò và hợp tác.
  • Gusto mang đến cơ hội làm việc cùng những con người hợp tác tốt và giàu tính tò mò.

Ý kiến của GN⁺

Điểm quan trọng nhất của bài viết này là mô tả chi tiết quá trình phát hiện và xử lý một lỗi có nguyên nhân hoàn toàn bất ngờ. Bài viết cho thấy sự phức tạp và khó lường của kỹ thuật phần mềm, đồng thời nhấn mạnh tầm quan trọng của tinh thần đồng đội và khả năng giải quyết vấn đề một cách bền bỉ. Đây là một ví dụ thú vị về cách các nhóm kỹ thuật phối hợp để xử lý một vấn đề hóc búa, và sẽ là câu chuyện rất hấp dẫn với những ai quan tâm đến lĩnh vực kỹ thuật.

1 bình luận

 
GN⁺ 2023-12-01
Ý kiến trên Hacker News
  • Sự ngạc nhiên và hoài nghi về lỗi do một tệp GIF cụ thể gây ra

    Một người dùng cho biết thật khó tin rằng một chuỗi những sự trùng hợp trong mã lại có thể gây ra lỗi do một tệp GIF cụ thể. Người này cũng bày tỏ sự nghi ngờ với ứng dụng Grammarly, và ngạc nhiên khi rất nhiều người cài một ứng dụng gần như spyware chỉ để nhận gợi ý ngữ pháp, còn công ty thì lại cho phép điều đó.

  • Vấn đề in gạch chân khi làm bài báo nghiên cứu của một giáo sư đại học

    Một giáo sư đại học gặp lỗi phần gạch chân trong văn bản không được in ra khi đang làm bài báo nghiên cứu, và sau đó phát hiện nguyên nhân là do sự kết hợp giữa một driver card màn hình cụ thể và driver máy in.

  • Chia sẻ trải nghiệm lỗi liên quan đến Grammarly

    Một người dùng chia sẻ rằng trước đây họ từng gặp lỗi tương tự trong một bộ phận có cài tiện ích mở rộng Grammarly. Lỗi chỉ xảy ra với URL của môi trường staging, và do một biểu thức chính quy sai nên trang bị treo.

  • Bày tỏ sự thất vọng về việc sửa lỗi

    Một người dùng nói rằng họ đã thích thú theo dõi quá trình sửa lỗi như đọc tiểu thuyết trinh thám, nhưng cuối cùng lại thất vọng vì không thể biết chính xác nguyên nhân của lỗi.

  • Vấn đề âm thanh khi dual-boot Windows và Linux

    Có trường hợp sau khi khởi động lại từ Windows thì Linux không có âm thanh, và nguyên nhân được phát hiện là do Windows không tắt hẳn thiết bị âm thanh mà chỉ chuyển nó sang chế độ chờ.

  • Sự thú vị về việc lỗi vẫn xuất hiện trong môi trường web năm 2023

    Một người bày tỏ sự hứng thú với kiểu lỗi phát sinh do sự kết hợp phức tạp của nhiều công nghệ, đồng thời thắc mắc không biết lỗi của Chromium đã được sửa chưa.

  • Chia sẻ trải nghiệm lỗi liên quan đến công cụ accessibility của Chrome

    Một người chia sẻ rằng họ từng gặp lỗi tương tự do công cụ accessibility của Chrome gây ra, và cho rằng Grammarly có thể đang phụ thuộc vào các công cụ accessibility của Chrome.

  • Chia sẻ sự nhầm lẫn do cài đặt dịch trang

    Có trường hợp người dùng khẳng định câu chữ của thông tin họ nhập bị thay đổi khi lưu, nhưng sau đó hóa ra nguyên nhân là do tùy chọn "Dịch trang này" của Chrome đang được bật.

  • Chia sẻ trải nghiệm desktop Linux bị crash do CSS của website

    Một người chia sẻ rằng CSS của trang tìm kiếm Yahoo từng làm desktop của họ trên Red Hat Linux bị crash, đồng thời đề xuất nên báo bug cho nhóm phát triển Chrome.

  • Ý kiến rằng việc giải quyết lỗi này có thể trở thành một lỗ hổng bảo mật quan trọng

    Một người nêu ý kiến rằng nếu có thể khai thác hoặc giải quyết được lỗi này, nó có thể trở thành một lỗ hổng bảo mật rất giá trị.