Trình duyệt AI tái cấu trúc cổng vào Internet Cuộc chiến trình duyệt lần thứ ba bắt đầu

Trình duyệt AI: chiến trường mới tái cấu trúc cổng vào Internet

Cuộc chiến trình duyệt lần thứ ba đang âm thầm diễn ra. Nhìn lại lịch sử, từ Netscape và IE của Microsoft vào những năm 90, đến tinh thần mã nguồn mở của Firefox và Chrome của Google, cuộc chiến trình duyệt luôn là biểu hiện tập trung của quyền kiểm soát nền tảng và sự chuyển biến của các mô hình công nghệ. Chrome đã chiếm vị trí thống trị nhờ tốc độ cập nhật và sự liên kết sinh thái, trong khi Google thông qua cấu trúc "đôi độc quyền" giữa tìm kiếm và trình duyệt, đã hình thành một vòng tròn khép kín cho cổng thông tin.

Tuy nhiên, hôm nay, tình hình này đang bị lung lay. Sự trỗi dậy của mô hình ngôn ngữ lớn (LLM) đã khiến ngày càng nhiều người dùng hoàn thành nhiệm vụ trên trang kết quả tìm kiếm mà không cần nhấp chuột, hành vi nhấp chuột vào các trang web truyền thống đang giảm. Đồng thời, tin đồn về việc Apple có ý định thay thế công cụ tìm kiếm mặc định trong Safari càng đe dọa nền tảng lợi nhuận của Alphabet, thị trường đã bắt đầu bộc lộ sự bất an đối với "chính thống tìm kiếm".

Trình duyệt cũng đang đối mặt với sự tái định hình vai trò. Nó không chỉ là công cụ hiển thị trang web, mà còn là một tập hợp các khả năng như nhập dữ liệu, hành vi người dùng, danh tính riêng tư, v.v. Mặc dù AI Agent rất mạnh, nhưng để thực hiện các tương tác phức tạp trên trang, gọi dữ liệu danh tính cục bộ và kiểm soát các phần tử trang web, vẫn cần phải dựa vào ranh giới tin cậy và hộp chức năng của trình duyệt. Trình duyệt đang chuyển từ giao diện của con người thành nền tảng gọi hệ thống cho Agent.

Chìa khóa của trình duyệt trong tương lai nằm ở việc thiết kế cho AI Agent - không chỉ có khả năng đọc, mà còn viết và thực thi. Những dự án như Browser Use đang cố gắng làm cho cấu trúc trang trở nên có ngữ nghĩa, biến giao diện trực quan thành văn bản có cấu trúc có thể được LLM gọi, đạt được sự ánh xạ từ trang web đến lệnh, giảm thiểu chi phí tương tác một cách đáng kể.

Các dự án chủ đạo trên thị trường đã bắt đầu thử nghiệm: Perplexity xây dựng trình duyệt gốc Comet, sử dụng AI thay thế kết quả tìm kiếm truyền thống; Brave kết hợp bảo vệ quyền riêng tư với suy diễn cục bộ, sử dụng LLM để tăng cường chức năng tìm kiếm và chặn quảng cáo; trong khi các dự án gốc Crypto như Donut nhắm đến việc tạo ra lối vào mới cho tương tác giữa AI và tài sản trên chuỗi. Những dự án này có đặc điểm chung là: cố gắng tái cấu trúc đầu vào của trình duyệt, chứ không phải làm đẹp lớp đầu ra.

Đối với các nhà khởi nghiệp, cơ hội nằm trong mối quan hệ tam giác giữa đầu vào, cấu trúc và đại lý. Trình duyệt như giao diện gọi thế giới của Agent trong tương lai, có nghĩa là ai có thể cung cấp các "khối năng lực" có cấu trúc, có thể gọi và đáng tin cậy, người đó sẽ trở thành một phần của nền tảng thế hệ mới. Từ SEO đến AEO(Agent Engine Optimization), từ lưu lượng trang đến gọi chuỗi nhiệm vụ, hình thức sản phẩm và tư duy thiết kế đều đang được tái cấu trúc. Cuộc chiến trình duyệt lần thứ ba diễn ra ở "đầu vào" chứ không phải "hiển thị"; ai quyết định thắng thua không còn là người nắm bắt ánh nhìn của người dùng, mà là ai giành được lòng tin của Agent, có được lối vào để gọi.

Lịch sử phát triển của trình duyệt

Vào đầu những năm 90, khi Internet chưa trở thành một phần trong đời sống hàng ngày, Netscape Navigator xuất hiện như một chiếc thuyền buồm mở ra lục địa mới, mở ra cánh cửa vào thế giới số cho hàng triệu người dùng. Trình duyệt này không phải là cái đầu tiên, nhưng là cái đầu tiên thực sự hướng tới đại chúng, định hình trải nghiệm Internet. Vào thời điểm đó, mọi người lần đầu tiên có thể dễ dàng duyệt web qua giao diện đồ họa, như thể cả thế giới bỗng chốc trở nên trong tầm với.

Tuy nhiên, sự rực rỡ thường chỉ là tạm thời. Microsoft nhanh chóng nhận ra tầm quan trọng của trình duyệt và quyết định buộc Internet Explorer phải được tích hợp vào hệ điều hành Windows, khiến nó trở thành trình duyệt mặc định. Chiến lược này được coi là "vũ khí sát thủ của nền tảng", trực tiếp làm sụp đổ vị thế thống trị của Netscape trên thị trường. Nhiều người dùng không phải tự nguyện chọn IE, mà là vì hệ thống mặc định đã chấp nhận nó. IE nhờ vào khả năng phân phối của Windows, nhanh chóng trở thành ông lớn trong ngành, trong khi Netscape rơi vào con đường suy tàn.

Trong hoàn cảnh khó khăn, các kỹ sư của Netscape đã chọn một con đường quyết liệt và lý tưởng - họ đã công khai mã nguồn của trình duyệt, kêu gọi cộng đồng mã nguồn mở. Quyết định này, như một "sự nhượng bộ kiểu Macedonia" trong giới công nghệ, báo hiệu sự kết thúc của một thời đại cũ và sự trỗi dậy của sức mạnh mới. Đoạn mã này sau đó trở thành nền tảng cho dự án trình duyệt Mozilla, ban đầu được đặt tên là Phoenix( có nghĩa là Phượng hoàng trỗi dậy ), nhưng đã trải qua nhiều lần đổi tên do vấn đề thương hiệu, cuối cùng được đặt tên là Firefox.

Firefox không chỉ đơn thuần là một bản sao của Netscape, mà còn đạt được nhiều bước đột phá trong trải nghiệm người dùng, hệ sinh thái plugin, và độ an toàn. Sự ra đời của nó đánh dấu chiến thắng của tinh thần mã nguồn mở, đồng thời thổi một luồng sinh khí mới vào toàn ngành. Có người mô tả Firefox là "người kế thừa tinh thần" của Netscape, giống như Đế chế Ottoman đã kế thừa ánh sáng còn sót lại của Byzantine. So sánh này tuy có phần phóng đại, nhưng lại rất có ý nghĩa.

Nhưng trong những năm trước khi Firefox chính thức được phát hành, Microsoft đã phát hành sáu phiên bản của IE, với lợi thế về thời gian và chiến lược đóng gói hệ thống, khiến Firefox ngay từ đầu đã ở vị trí phải đuổi theo, định mệnh cuộc đua này không phải là một cuộc cạnh tranh công bằng ở vạch xuất phát.

Trong khi đó, một người chơi sớm khác cũng đang âm thầm xuất hiện. Năm 1994, trình duyệt Opera ra đời, nó đến từ Na Uy, ban đầu chỉ là một dự án thử nghiệm. Nhưng kể từ phiên bản 7.0 vào năm 2003, nó đã giới thiệu động cơ Presto tự phát triển, đi đầu trong việc hỗ trợ CSS, bố cục thích ứng, điều khiển bằng giọng nói và mã hóa Unicode cùng các công nghệ tiên tiến khác. Mặc dù số lượng người dùng hạn chế, nhưng về mặt công nghệ, nó luôn đi đầu trong ngành, trở thành "sự yêu thích của những người đam mê công nghệ".

Cùng năm, Apple đã ra mắt trình duyệt Safari. Đây là một bước ngoặt đầy ý nghĩa. Thời điểm đó, Microsoft đã đầu tư 150 triệu USD vào Apple đang trên bờ vực phá sản, nhằm duy trì bề ngoài cạnh tranh và tránh sự kiểm tra chống độc quyền. Mặc dù công cụ tìm kiếm mặc định của Safari từ khi ra đời là Google, nhưng mối quan hệ lịch sử này với Microsoft tượng trưng cho mối quan hệ phức tạp và tinh tế giữa các gã khổng lồ internet: hợp tác và cạnh tranh, luôn đi đôi với nhau.

Năm 2007, IE7 được ra mắt cùng với Windows Vista, nhưng phản hồi của thị trường chỉ ở mức trung bình. Ngược lại, Firefox đã tăng trưởng thị phần ổn định lên khoảng 20% nhờ vào tốc độ cập nhật nhanh hơn, cơ chế mở rộng thân thiện hơn và sức hấp dẫn tự nhiên đối với các nhà phát triển. Sự thống trị của IE đang dần bị lung lay, xu hướng đang thay đổi.

Google thì là một cách tiếp cận khác. Mặc dù đã bắt đầu ấp ủ việc phát triển trình duyệt riêng từ năm 2001, nhưng phải mất sáu năm để thuyết phục CEO Eric Schmidt phê duyệt dự án này. Chrome ra mắt vào năm 2008, được xây dựng trên dự án mã nguồn mở Chromium và động cơ WebKit mà Safari sử dụng. Nó bị gọi là trình duyệt "cồng kềnh", nhưng nhờ vào khả năng sâu sắc của Google trong việc quảng cáo và xây dựng thương hiệu, nó đã nhanh chóng nổi lên.

Vũ khí chính của Chrome không phải là chức năng, mà là nhịp độ cập nhật phiên bản thường xuyên ( mỗi sáu tuần một lần ) với trải nghiệm đồng nhất trên tất cả các nền tảng. Vào tháng 11 năm 2011, Chrome lần đầu tiên vượt qua Firefox, chiếm 27% thị phần; sau sáu tháng, lại vượt qua IE, hoàn thành sự chuyển đổi từ kẻ thách thức thành người thống trị.

Trong khi đó, Internet di động của Trung Quốc cũng đang hình thành hệ sinh thái của riêng mình. Trình duyệt UC thuộc sở hữu của Alibaba đã nhanh chóng nổi lên vào đầu những năm 2010, đặc biệt là ở các thị trường mới nổi như Ấn Độ, Indonesia và Trung Quốc, nhờ vào thiết kế nhẹ, nén dữ liệu tiết kiệm băng thông và các đặc điểm khác, đã thu hút sự ưa chuộng của người dùng thiết bị giá rẻ. Năm 2015, thị phần trình duyệt di động toàn cầu của nó đã vượt qua 17%, có lúc lên tới 46% ở Ấn Độ. Nhưng chiến thắng này không kéo dài. Khi chính phủ Ấn Độ tăng cường kiểm tra an ninh đối với các ứng dụng Trung Quốc, UC đã buộc phải rời khỏi thị trường quan trọng, dần dần mất đi hào quang ngày xưa.

Bước vào thập niên 2020, vị thế thống trị của Chrome đã được xác lập, thị phần toàn cầu ổn định ở khoảng 65%. Đáng lưu ý là, mặc dù công cụ tìm kiếm Google và trình duyệt Chrome đều thuộc Alphabet, nhưng từ góc độ thị trường, chúng lại là hai hệ thống độc quyền độc lập - cái trước kiểm soát khoảng chín mươi phần trăm lối vào tìm kiếm toàn cầu, trong khi cái sau nắm giữ "cửa sổ đầu tiên" mà hầu hết người dùng truy cập vào mạng.

Để duy trì cấu trúc độc quyền kép này, Google không tiếc tiền đầu tư. Năm 2022, Alphabet đã trả cho Apple khoảng 20 tỷ USD, chỉ để giữ vị trí tìm kiếm mặc định của Google trên Safari. Có phân tích chỉ ra rằng, khoản chi này tương đương với 36% doanh thu quảng cáo tìm kiếm mà Google thu được từ lưu lượng truy cập Safari. Nói cách khác, Google đang trả "phí bảo vệ" cho hào thành.

Nhưng hướng gió lại một lần nữa thay đổi. Với sự trỗi dậy của các mô hình ngôn ngữ lớn (LLM), tìm kiếm truyền thống bắt đầu bị ảnh hưởng. Năm 2024, thị phần tìm kiếm của Google giảm từ 93% xuống 89%, mặc dù vẫn chiếm ưu thế, nhưng đã xuất hiện những vết nứt. Điều gây rối hơn là tin đồn về việc Apple có thể ra mắt công cụ tìm kiếm AI riêng - nếu Safari chuyển đổi tìm kiếm mặc định sang hệ sinh thái của chính mình, điều này không chỉ thay đổi cấu trúc sinh thái mà còn có thể đe dọa trụ cột lợi nhuận của Alphabet. Thị trường phản ứng nhanh chóng, giá cổ phiếu của Alphabet giảm từ 170 đô la xuống 140 đô la, phản ánh không chỉ nỗi lo sợ của các nhà đầu tư mà còn là sự bất an sâu sắc về hướng đi tương lai của thời đại tìm kiếm.

Từ Navigator đến Chrome, từ lý tưởng nguồn mở đến thương mại hóa quảng cáo, từ trình duyệt nhẹ đến trợ lý tìm kiếm AI, cuộc chiến trình duyệt luôn là một cuộc chiến về công nghệ, nền tảng, nội dung và quyền kiểm soát. Chiến trường liên tục di chuyển, nhưng bản chất chưa bao giờ thay đổi: ai nắm giữ cổng vào, người đó sẽ định nghĩa tương lai.

Trong mắt các VC, dựa trên nhu cầu mới của con người đối với công cụ tìm kiếm trong thời đại LLM và AI, cuộc chiến trình duyệt lần thứ ba đang dần diễn ra. Dưới đây là tình hình huy động vốn của một số dự án nổi bật trong lĩnh vực trình duyệt AI.

Kiến trúc cũ của trình duyệt hiện đại

Khi nói đến kiến trúc của trình duyệt, kiến trúc truyền thống cổ điển như hình dưới đây:

Khách hàng - Cổng vào phía trước

Tra cứu để gửi đến Google Front End gần nhất qua HTTPS, hoàn thành giải mã TLS, lấy mẫu QoS và định tuyến địa lý. Nếu phát hiện lưu lượng bất thường (DDoS, tự động thu thập ) có thể bị giới hạn hoặc thách thức ở tầng này.

Tra cứu hiểu biết

Phía trước cần hiểu ý nghĩa của các từ mà người dùng nhập vào, có ba bước: chỉnh sửa chính tả thần kinh, sửa "recpie" thành "recipe"; mở rộng từ đồng nghĩa, mở rộng "how to fix bike" thành "repair bicycle". Phân tích ý định, xác định truy vấn là thông tin, điều hướng hay ý định giao dịch, và phân bổ yêu cầu Vertical.

Ứng cử viên được triệu hồi

Công nghệ truy vấn được Google sử dụng được gọi là: chỉ mục đảo ngược. Trong chỉ mục theo thứ tự, chúng ta có thể chỉ định một ID để lập chỉ mục vào tệp. Tuy nhiên, người dùng không thể biết nội dung mong muốn nằm ở số thứ tự nào trong hàng trăm tỷ tệp, vì vậy họ đã sử dụng chỉ mục đảo ngược rất truyền thống, để tìm kiếm các tệp có từ khóa tương ứng thông qua nội dung. Tiếp theo, Google sử dụng chỉ mục vector để xử lý tìm kiếm ngữ nghĩa, tức là tìm kiếm nội dung có ý nghĩa tương tự với truy vấn. Nó chuyển đổi văn bản, hình ảnh và các nội dung khác thành vector nhiều chiều (embedding) và tìm kiếm dựa trên sự tương đồng giữa các vector này. Ví dụ, ngay cả khi người dùng tìm kiếm "cách làm bột pizza", công cụ tìm kiếm cũng có thể trả về kết quả liên quan đến "hướng dẫn làm bột pizza", vì chúng có sự tương đồng về ngữ nghĩa. Trải qua chỉ mục đảo ngược và chỉ mục vector, khoảng hàng trăm ngàn trang web sẽ được sàng lọc ban đầu.

Sắp xếp nhiều cấp

Hệ thống thường sử dụng hàng nghìn đặc trưng nhẹ với hàng triệu chiều như BM25, TF-IDF, điểm chất lượng trang, để lọc hàng trăm nghìn trang ứng cử xuống còn khoảng 1000 trang, tạo thành tập ứng cử viên ban đầu. Các hệ thống này được gọi chung là máy gợi ý. Chúng phụ thuộc vào hàng triệu đặc trưng được tạo ra từ nhiều thực thể, bao gồm hành vi người dùng, thuộc tính trang, ý định tìm kiếm và tín hiệu ngữ cảnh. Ví dụ, Google sẽ tổng hợp lịch sử người dùng, phản hồi hành vi của người dùng khác, ngữ nghĩa trang, ý nghĩa truy vấn và các thông tin khác, đồng thời cũng xem xét các yếu tố ngữ cảnh, chẳng hạn như thời gian ( trong ngày, ngày cụ thể trong tuần ) và các sự kiện bên ngoài như tin tức thời sự.

Học sâu thực hiện phân loại chính

Trong giai đoạn tìm kiếm ban đầu, Google sử dụng các công nghệ như RankBrain và Neural Matching để hiểu ngữ nghĩa của truy vấn và lọc ra các kết quả liên quan ban đầu từ khối lượng tài liệu khổng lồ. RankBrain là hệ thống học máy mà Google giới thiệu vào năm 2015, nhằm hiểu rõ hơn ý nghĩa của truy vấn người dùng, đặc biệt là những truy vấn mới xuất hiện lần đầu. Nó chuyển đổi truy vấn và tài liệu thành các biểu diễn vector, tính toán độ tương đồng giữa chúng để tìm ra kết quả liên quan nhất. Ví dụ, đối với truy vấn "cách làm bột pizza", ngay cả khi tài liệu không có từ khóa hoàn toàn khớp, RankBrain vẫn có thể nhận diện nội dung liên quan đến "cơ sở pizza" hoặc "làm bột".

Neural Matching là một công nghệ khác mà Google ra mắt vào năm 2018, nhằm hiểu sâu hơn về mối quan hệ ngữ nghĩa giữa truy vấn và tài liệu. Nó sử dụng mô hình mạng nơ-ron để nắm bắt các mối quan hệ mơ hồ giữa các từ, giúp Google khớp tốt hơn giữa truy vấn và nội dung trang web. Ví dụ, đối với truy vấn "tại sao quạt máy tính xách tay của tôi kêu to", Neural Matching có thể hiểu rằng người dùng có thể đang tìm kiếm thông tin khắc phục sự cố liên quan đến quá nhiệt, bụi bẩn tích tụ hoặc mức sử dụng CPU cao, ngay cả khi những từ này không xuất hiện trực tiếp trong truy vấn.

Sắp xếp lại sâu: Ứng dụng của mô hình BERT

Trong bước sàng lọc ban đầu

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 9
  • Chia sẻ
Bình luận
0/400
MoonlightGamervip
· 07-10 09:24
Chrome không chịu nổi à
Xem bản gốcTrả lời0
AirdropHunterXMvip
· 07-10 07:24
Tìm cái quái gì vậy, ai đến rồi
Xem bản gốcTrả lời0
ApeWithNoChainvip
· 07-10 02:02
Không thể chịu đựng được nữa, trình duyệt lại bắt đầu cuộn lên.
Xem bản gốcTrả lời0
0xSoullessvip
· 07-07 10:13
呵 又 một đợt đồ ngốc chơi đùa với mọi người盛宴
Xem bản gốcTrả lời0
DaoTherapyvip
· 07-07 10:12
Đừng làm nữa, để Google hiểu rõ.
Xem bản gốcTrả lời0
CryptoCross-TalkClubvip
· 07-07 10:10
Hãy gọi tôi, phía trước có ký hiệu đô la, đồ ngốc trong thế giới tiền điện tử ba năm, mỗi tối lúc 8 giờ chính xác bắt đầu nói chuyện hài.
Xem bản gốcTrả lời0
HypotheticalLiquidatorvip
· 07-07 10:09
Một cú sập hệ thống nữa sắp diễn ra
Xem bản gốcTrả lời0
GweiTooHighvip
· 07-07 09:48
Ngày cũng có lúc Google thất bại.
Xem bản gốcTrả lời0
ser_ngmivip
· 07-07 09:47
Lại là AI lại là chiến tranh, thật là một trò đùa.
Xem bản gốcTrả lời0
Xem thêm
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)