1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Khi các công ty chuyển từ thử nghiệm với một mô hình đơn lẻ sang hệ thống production đa mô hình, nhu cầu về lớp định tuyến·gateway ngày càng tăng
  • OpenRouter là lớp đảm nhiệm định tuyến, độ ổn định, tối ưu chi phí, tuân thủ giữa agent và nhà cung cấp mô hình
  • Trong 6 tháng gần đây, lưu lượng xử lý hàng tuần đã tăng từ 5 nghìn tỷ token lên 25 nghìn tỷ token, và với tốc độ tăng hiện tại, khối lượng xử lý năm nay được dự báo sẽ vượt 1.000 nghìn tỷ token
  • Hiện nền tảng hỗ trợ hơn 8 triệu nhà phát triển xây dựng trên hơn 400 mô hình, thúc đẩy quá trình chuyển AI sang các ứng dụng production và agent
  • Nguồn vốn sẽ được dùng cho mở rộng hạ tầng, tăng cường tính năng doanh nghiệp và đầu tư vào định tuyến thông minh, nhằm xây dựng lớp nền tảng cho kỷ nguyên AI đa mô hình

113 triệu USD Series B

Chỉ số tăng trưởng và quy mô sử dụng

  • Lưu lượng xử lý hàng tuần của OpenRouter đã tăng từ 5 nghìn tỷ token lên 25 nghìn tỷ token trong 6 tháng gần đây
  • Xét theo tốc độ tăng trưởng, khối lượng xử lý năm nay được dự báo sẽ đạt hơn 1.000 nghìn tỷ token
  • OpenRouter đang hỗ trợ hơn 8 triệu nhà phát triển xây dựng trên hơn 400 mô hình
  • Khi AI chuyển từ giai đoạn thử nghiệm sang các ứng dụng production và agent, nhu cầu về hạ tầng có thể vận hành ổn định trên nhiều nhà cung cấp, modality và use case ngày càng tăng

Chuyển sang production đa mô hình

  • Khi các tổ chức chuyển từ thử nghiệm với một mô hình đơn lẻ sang hệ thống production đa mô hình, họ cần một lớp định tuyến và gateway để xử lý sự phức tạp
  • OpenRouter là lớp đảm nhiệm định tuyến, độ ổn định, tối ưu chi phí, tuân thủ giữa agent và nhà cung cấp mô hình
  • Thành phần nhà đầu tư lần này chủ yếu là các công ty hạ tầng và nền tảng, cho thấy lớp này đang trở thành một thành phần quan trọng trong AI stack

Các tính năng chính

  • Suy luận đa phương thức

  • Kiểm soát cho doanh nghiệp

  • Định tuyến thông minh

    • Cung cấp failover ở cấp nhà cung cấp, tối ưu chi phí và độ trễ, cùng định tuyến nhận biết chất lượng vượt ra ngoài cân bằng tải đơn thuần

Kế hoạch tiếp theo

  • Nguồn vốn lần này sẽ được dùng cho mở rộng hạ tầng, tăng cường tính năng doanh nghiệp và tiếp tục đầu tư vào định tuyến thông minh
  • OpenRouter có kế hoạch tiếp tục mở rộng lớp hạ tầng của kỷ nguyên AI đa mô hình, giúp tìm ra mô hình và nhà cung cấp phù hợp cho từng yêu cầu

1 bình luận

 
Ý kiến Hacker News
  • Tôi đã mất khá nhiều thời gian mới chấp nhận OpenRouter. Lúc đầu tôi không hiểu vì sao lại đặt thêm một proxy phía trước LLM, nhưng trên thực tế nó mang lại giá trị khá lớn

    1. Ít ma sát nhất khi hỗ trợ và thử nghiệm mọi mô hình
    2. Cung cấp giới hạn thanh toán. Nếu gắn vào một dịch vụ công khai, một hard limit để ngăn ai đó lạm dụng và đốt hết 1 triệu USD chỉ sau một đêm là cực kỳ hữu ích
    3. Bảng xếp hạng cũng có khuyết điểm, nhưng vẫn là một tín hiệu thú vị để xem mô hình nào đang phổ biến. Phần lớn người dùng OpenAI/Anthropic không đi qua OpenRouter, và cũng có hạn chế là khó phân biệt liệu nhiều người dùng đã chuyển đổi hay chỉ có một khách hàng lớn thay đổi
      Trong bối cảnh chi phí API đang tăng lên mức đáng kể ở nhiều công ty, những dịch vụ như OpenRouter, giúp đo lường chi tiêu và dễ dàng thử nghiệm/chuyển đổi nhà cung cấp, có vẻ rất có giá trị
    • Một điểm hay khác là họ công khai trạng thái cache theo giờ cho mọi tổ hợp mô hình/nhà cung cấp. Dựa vào đó tôi đã xem qua danh sách xếp hạng nhà cung cấp và phát hiện ra rằng khá nhiều dịch vụ host bên thứ ba dựa trên mã nguồn mở thực ra chỉ thuộc nhóm cuối bảng https://dirac.run/posts/cache-hit-rates-agents
    • Ít nhất với tôi, điểm giảm ma sát lớn nhất là thanh toán hợp nhất, giúp tránh thêm thủ tục quan liêu trong môi trường doanh nghiệp. Chuyển đổi/trừu tượng hóa API thường tạo ra nhiều vấn đề hơn là giải quyết
      Tôi thích cách hợp nhất thanh toán nhưng vẫn cho phép dùng trực tiếp API của nhà cung cấp, hoặc dùng qua một kiểu proxy “HTTP thô”. Có nhiều API gateway hợp nhất rồi, nhưng tôi vẫn chưa thấy sản phẩm nào chỉ thêm lớp thanh toán/xác thực phía trước API gốc của nhà cung cấp
    • Bạn có biết là nếu nạp tiền vào tài khoản OpenAI thì số tiền đó sẽ hết hạn sau 1 năm không? Khi điều đó xảy ra với tôi, nó biến mất như credit khuyến mãi, không hoàn tiền cũng không cảnh báo, cực kỳ bực mình
      OpenRouter tốt ở chỗ nó đặt một lớp ngăn cách giữa nhà cung cấp và người dùng, trong khi các nhà cung cấp lẽ ra nên hành xử như một tiện ích công cộng. Nếu cứ để OpenAI như hiện tại, tôi có cảm giác họ sẽ hành xử như nhà mạng viễn thông
    • Những điểm rất hay. Việc thử nghiệm dễ dàng có ích cho phát triển, nhưng khi quy mô lớn lên, tôi vẫn thận trọng khuyên nên chuyển sang API bên thứ nhất về mặt giá cả
      OpenRouter cũng là nơi tốt để tìm quyền truy cập LLM miễn phí, nhưng có điều kiện đi kèm. Phải xem đầu vào và đầu ra đều sẽ đi vào cơ sở dữ liệu huấn luyện của ai đó. Nếu có khả năng chi trả thì nên dùng mô hình trả phí có bảo vệ quyền riêng tư, nhưng các mô hình miễn phí vẫn rất tuyệt cho học tập và thử nghiệm. Đặc biệt phù hợp với người học còn trẻ chưa có thẻ tín dụng hay tiền để học lập trình API và LLM
    • Hiện tại với DeepSeek V4 thì họ làm hỏng caching, trong khi ở V4 caching là tính năng giá cốt lõi
      https://news.ycombinator.com/item?id=48319827
  • Tôi là đồng sáng lập kiêm COO của OpenRouter. Có rất nhiều câu hỏi về việc vì sao chúng tôi gọi vốn
    Trước hết, OpenRouter vẫn là công ty do nhà sáng lập điều hành và kiểm soát, và chúng tôi có ý định tồn tại lâu dài bằng cách xây dựng sản phẩm tốt cho các builder trên toàn thế giới. Về cơ bản chúng tôi là những người thích mày mò, thích tạo ra thứ gì đó, và khi làm thứ gì đó với AI, chúng tôi cố tạo ra thứ mà chính mình muốn dùng
    Về việc gọi vốn, chúng tôi tin rằng một công ty mạnh nên có bảng cân đối kế toán vững chắc. Chúng tôi xử lý các khoản chi tiêu quy mô lớn và có những cam kết chi tiêu lớn trên toàn hệ sinh thái. Việc đảm bảo có đủ tiền mặt để trụ vững trước bất cứ điều gì xảy ra trong tương lai là một cách giảm rủi ro có trách nhiệm, và khiến công ty có độ bền rất cao
    Điều đó cũng gửi tín hiệu tới các khách hàng lớn và đối tác nhà cung cấp rằng chúng tôi sẽ còn phục vụ lâu dài và có thể thanh toán hóa đơn. Chúng tôi không cần vốn đầu tư mạo hiểm để tiếp tục mở rộng, và trên thực tế doanh nghiệp đang khỏe mạnh, nhưng chẳng ai muốn đi gọi vốn 100 triệu USD vào đúng lúc thực sự cần nó
    Với nhân viên hiện tại và tương lai, đây cũng là một sự xác nhận tốt rằng giá trị mà chúng tôi đang cùng nhau xây dựng là có thật. Chúng tôi cũng nghiêm túc với nghĩa vụ tạo lợi nhuận cho nhà đầu tư, chứ không chỉ tối đa hóa định giá, và có đặc quyền được chọn mình sẽ làm việc với ai. Điều này không được nói đến nhiều trong toàn ngành startup, nhưng tôi nghĩ nó rất quan trọng

    • OpenRouter định dùng 100 triệu USD vào việc gì? Bạn nói là để “khiến công ty rất bền vững”, “là một sự xác nhận tốt cho nhân viên”, nhưng có vẻ vẫn có những việc thú vị hơn nhiều để làm với 100 triệu USD
    • Tôi thích sản phẩm. Thanh toán/xác thực hợp nhất giải quyết một nỗi đau lớn, nên xin cảm ơn
      So với chuyện đầu tư, tôi tò mò hơn về chiến lược dài hạn. Trong 3–5 năm tới, bạn hình dung OpenRouter sẽ ở đâu, và hiện tại canh cược sản phẩm nào khiến bạn hào hứng nhất? Đợt gọi vốn này có khiến bạn muốn mở rộng sang các mảng liền kề không?
    • Liệu có thể giữ thanh toán hợp nhất mà vẫn cho truy cập thô vào API của nhà cung cấp không? API hợp nhất rất tuyệt khi nó hoạt động tốt, nhưng với các trường hợp sử dụng khác thường hay tính năng API mới, nó thường gây phiền toái
    • Tính năng còn thiếu lớn nhất với tôi là phân biệt nhà cung cấp không lưu giữ dữ liệu và khả năng đánh giá xem một mô hình có đáp ứng các quy tắc do tôi định nghĩa hay không. Hiện giờ không có cách nào để ẩn những nhà cung cấp không phù hợp với quy tắc ZDR
    • Tôi đã thử OpenRouter trong thời gian ngắn. Khoảng 1 năm trước tôi có thử sản phẩm, nhưng qua OpenRouter tôi không thể lấy được structured output từ mô hình Gemini của Google
  • Với góc nhìn của một người dùng OpenRouter rất nhiều, vài ngày trước tôi cũng vô tình viết cả một bài mang tính quảng bá cho nó https://news.ycombinator.com/item?id=48317294, nhưng để thử các model mới mà không phải đụng vào API khác nhau của từng nhà cung cấp — một vấn đề lặp đi lặp lại dạo này — thì đây đúng là cách tốt nhất
    Tuy vậy, tôi thật sự không hiểu những người chạy toàn bộ xương sống agent trên OpenRouter bằng các model đắt đỏ như Claude Opus. Ở mức chi phí đó, phí 5% tăng lên đủ đáng kể để việc dùng API gốc của nhà cung cấp sẽ hợp lý hơn. Dù vậy rõ ràng vẫn có người dùng, và đó là doanh thu thuần

    • Mấy thứ như vậy có vẻ nên được triển khai bằng thư viện mã nguồn mở nơi các nhà cung cấp phát hành patch hỗ trợ thì tốt hơn. Tôi không hiểu vì sao phải có một công ty đóng vai trò proxy, thay vì chỉ chạy một lớp mỏng tương đối đơn giản trên máy của tôi
      Ngay cả từ góc nhìn của một lập trình viên hệ thống ngớ ngẩn làm việc trong nội bộ AI, tôi vẫn hiểu là có rất nhiều phần mềm bề ngoài trông không cần thiết nhưng lại bán được chỉ nhờ chút tiện lợi. OpenRouter có đơn giản chỉ là kiểu đó không? Tôi tò mò liệu họ có tự host model không, hay chỉ tập trung hóa thanh toán của nhiều nhà cung cấp
    • Hiện tại có rất nhiều chi tiêu token ngớ ngẩn. Cũng có một xu hướng là cứ cố dùng tối đa token. Bầu không khí sợ bị tụt lại khiến chi phí kinh tế của token không được đánh giá cẩn thận. Nhưng mọi người đã bắt đầu nhận ra điều đó, và kiểu chi tiêu này không bền vững nên sẽ quay đầu lại
    • Thời gian hoạt động có thể tốt hơn. Vì nó sẽ được định tuyến qua một trong các lựa chọn như Anthropic, Amazon Bedrock, Claude Platform của AWS, Google Vertex Europe hoặc Google Vertex
    • Trả thêm 5% để có thanh toán hợp nhất và giới hạn mức sử dụng là chấp nhận được. Mọi thứ đơn giản hơn
    • Sự tiện lợi luôn có giá cộng thêm
  • “Open” trong OpenRouter có mang nghĩa giống “Open” trong OpenAI không? Tôi không tìm thấy kho mã hay mã được host nào. Tôi cứ nghĩ đó là một công cụ mã nguồn mở, có thể tự host, kèm sản phẩm đám mây, nhưng có vẻ chỉ có vế sau

    • Tôi cũng tưởng là mã nguồn mở, nhưng kiểm tra lại thì không phải. Họ nói gọi là “Open” vì nó định tuyến tới các model mở của bên thứ ba. Lại thêm một lớp vớ vẩn kiểu VC nữa sao
    • Chữ Open trong OpenRouter giống chữ Open trong OpenSea. Vì cùng một nhà sáng lập. Còn hiểu theo hướng nào thì tùy mỗi người
    • Thành thật mà nói, bất kỳ ai cũng có thể dùng Claude Code làm ra thứ như OpenRouter chỉ trong vài đêm
      Nó chỉ là một proxy
    • Open ở đây có nghĩa là một lớp API duy nhất cho phép bạn thay đổi model bên dưới
  • Chừng nào còn nhiều thử nghiệm trong mảng LLM, và “model đang hot ở thời điểm hiện tại” vẫn liên tục thay đổi giữa nhiều phòng lab frontier, thì OpenRouter có lẽ vẫn sẽ cực kỳ phổ biến
    Khi tình hình bắt đầu ổn định, cả model frontier lẫn model mã nguồn mở nhiều khả năng sẽ được hợp nhất. Khi đó độ hữu ích của OpenRouter sẽ giảm đi. Khi bạn muốn thử 20 model từ 10 phòng lab thì overhead 5% hoàn toàn đáng giá, nhưng nếu bạn chỉ cần 5 model từ 2 nhà cung cấp và có thể tinh chỉnh các tùy chọn API của từng bên để rẻ hơn, thì mức đó sẽ khó chấp nhận hơn

  • Một trong những việc OpenRouter làm cho dễ hơn là quản lý API key. Tôi ước gì các nhà cung cấp khác cũng hỗ trợ hoặc làm dễ hơn việc tạo key mới, đặt ngày hết hạn/giới hạn theo từng key
    Có rất nhiều chỗ để dùng, như khi chia sẻ tính năng AI/trợ lý ra bên ngoài. Bạn vẫn có thể cho dùng tính năng đó, nhưng nếu key bị chia sẻ hoặc bị dùng sai mục đích thì thiệt hại có thể được giới hạn, và cũng đỡ phải dựa vào những quy trình vòng vo mong manh hơn như một loại hàng rào bảo vệ

  • Thật sự cần tiền VC chỉ để dựng một proxy phía trước API của người khác sao? Chính xác là tiền được dùng vào đâu? Marketing à? Nó vốn đã nổi rồi, còn muốn marketing thêm cái gì
    Hạ tầng? Một proxy yêu cầu có cần thêm nhiều hạ tầng đến vậy không? Cứ trả tiền cho Cloudflare là được mà
    Muốn tuyển thêm kỹ sư? Nhưng chẳng phải chính các anh lại là những người bán thuốc rắn giỏi nhất về chuyện không còn cần kỹ sư nữa sao
    Vậy thì 100 triệu đô đó được dùng vào việc gì

    • Họ gọi vốn vì họ có thể gọi được. Vì nó hoạt động như bằng chứng xã hội, giúp thuyết phục khách hàng rằng họ đang tạo ra thứ gì đó có giá trị sâu hơn. Trên thực tế, tiền đó sẽ được dùng để phát triển kênh phân phối và chuẩn bị cho tương lai nơi khách hàng cùng dữ liệu khách hàng giao phó sẽ trở thành sản phẩm
    • Có vẻ câu trả lời này từ đồng sáng lập OpenRouter có liên quan: https://news.ycombinator.com/item?id=48340940
  • Một tính năng hay của OpenRouter mà tôi chưa thấy ai nhắc ở đây là meta-model của OpenRouter. Nó tự động định tuyến prompt tới model có mức hiệu năng phù hợp
    Nhờ vậy bạn không phải gửi mọi thứ sang Opus nên tiết kiệm được rất nhiều tiền, đồng thời khi hỏi những thứ phức tạp hơn thì nó sẽ tự động chuyển sang Opus, giúp tránh kết quả tệ

  • “Trong 6 tháng qua, lưu lượng xử lý hàng tuần của OpenRouter đã tăng từ 5 nghìn tỷ token lên 25 nghìn tỷ token
    Wow, tức là hơn 41 triệu token mỗi giây. Với một đội nhỏ chỉ khoảng 48–50 người thì quy mô này thật sự khổng lồ

    • Nếu giả sử đó là chi phí token upstream, và còn tính cả hệ số token xử lý trên mỗi truy vấn, thì nhiều lắm cũng chỉ có thể là vài nghìn request mỗi giây. Vẫn ấn tượng, nhưng với một startup 50 người đang tiêu vài triệu đô mỗi tháng thì cũng có vẻ cỡ đó
      Nếu một nhà cung cấp email nhận vài nghìn tin nhắn mỗi giây, rồi còn đẩy chúng lên upstream để phát hiện spam, thì có ấn tượng y hệt không? Trong trường hợp đó số token thậm chí có thể còn cao hơn, nhưng dù đúng hay sai thì trên HN chắc người ta sẽ khá thờ ơ
      Một mặt nó cho thấy ngành này đã đi xa đến mức nào về quy mô, mặt khác cũng cho thấy ngay cả những request danh nghĩa là đơn giản giờ đã kéo theo lượng dữ liệu và xử lý bùng nổ đến mức nào. Dù vậy, rõ ràng đội ngũ này rất giỏi, và đây là một thành tựu đáng khen
    • Để dễ hình dung, nếu xem một token là 4 byte thì lưu lượng rơi vào khoảng 164 MB/s. Nhìn theo cách đó thì nghe có vẻ bớt choáng hơn một chút
  • Sẽ rất thú vị nếu được xem bảng tính tài chính của thương vụ này. Thông thường nhà đầu tư vòng B kỳ vọng gần lợi nhuận gấp 10 lần. Liệu OpenRouter có thể biện minh cho mức định giá 1,1 tỷ đô không? Với vai trò “quản lý”/trung gian thì thật sự có vẻ rất cao. Tất nhiên đây là AI nên vậy, nhưng tôi cũng đủ già để nhớ thời mà công ty dotcom nào cũng được định giá 1 tỷ đô

    • Nếu họ có thể dễ dàng định tuyến phần lớn token của thế giới thì có thể. Điều gì xảy ra nếu một ngày nào đó 5% lại do nhà cung cấp trả, còn OpenRouter chiếm nhiều hơn ở phần hạ tầng/định tuyến. Có rất nhiều cách để trở thành một công ty 10 tỷ đô
    • Như mọi khi, về dài hạn thì dữ liệu người dùng sẽ là sản phẩm