HTTPSを通じて最近のGoogle Front Endに到達し、TLSの復号化、QoSサンプリング、地理的ルーティングを完了します。異常なトラフィック)DDoSが検出された場合、ここで流量制限やチャレンジを自動的に行うことができます。
クエリの理解
フロントエンドは、ユーザーが入力した単語の意味を理解する必要があります。3つのステップがあります:神経スペル修正、"recpie"を"recipe"に修正します。同義語の拡張、"how to fix bike"を"repair bicycle"に拡張します。意図解析、クエリが情報、ナビゲーション、または取引意図であるかを判断し、Verticalリクエストを割り当てます。
AIブラウザがインターネットの入り口を再構築 第三次ブラウザ戦争が始まる
AI ブラウザ:インターネット入口の新たな戦場を再構築する
第三のブラウザ戦争が静かに展開されている。歴史を振り返ると、90年代のNetscape、MicrosoftのIE、そしてオープンソース精神のFirefoxとGoogleのChromeに至るまで、ブラウザの争いは常にプラットフォームの支配権と技術のパラダイムシフトを集中的に反映してきた。Chromeは更新速度とエコシステムの連携によって支配的な地位を獲得し、Googleは検索とブラウザの「二頭体制」によって情報の入り口のクローズド・ループを形成した。
しかし今日、この構図は揺らいでいる。大型言語モデル(LLM)の台頭により、ますます多くのユーザーが検索結果ページで「ゼロクリック」でタスクを完了し、従来のウェブページのクリック行動が減少している。同時に、AppleがSafariでデフォルトの検索エンジンを置き換える意向があるという噂は、Alphabetの利益基盤にさらなる脅威を与え、市場は「検索の正統性」に対する不安を示し始めている。
ブラウザ自体も役割の再構築に直面しています。それは単なるウェブページを表示するツールではなく、データ入力、ユーザー行動、プライバシーアイデンティティなどのさまざまな能力の集約容器です。AIエージェントは強力ですが、複雑なページインタラクションを完了したり、ローカルアイデンティティデータを呼び出したり、ウェブページ要素を制御したりするには、依然としてブラウザの信頼の境界と機能サンドボックスを利用する必要があります。ブラウザは人間のインターフェースから、エージェントのシステムコールプラットフォームに変わりつつあります。
未来のブラウザの鍵は、AIエージェントの設計にあります - 読むだけでなく、書いて実行することもできるのです。Browser Useのようなプロジェクトは、ページの構造をセマンティックにし、視覚的インターフェースをLLMが呼び出せる構造化されたテキストに変換し、ページから指示へのマッピングを実現し、インタラクションコストを大幅に削減しようとしています。
市場の主流プロジェクトが試験的に動き出しました: PerplexityはネイティブブラウザCometを構築し、AIを使って従来の検索結果を置き換えています; Braveはプライバシー保護とローカル推論を組み合わせ、LLMを使用して検索とブロック機能を強化しています; そしてDonutなどのCryptoネイティブプロジェクトは、AIとチェーン上の資産との相互作用の新しい入り口を狙っています。これらのプロジェクトの共通の特徴は、ブラウザの入力端を再構築しようとしていることであり、出力層を美化することではありません。
起業家にとって、機会は入力、構造、エージェントの三角関係の中に隠れています。ブラウザーは未来のエージェントが世界を呼び出すインターフェースとして、誰が構造化され、呼び出し可能で、信頼できる "能力ブロック" を提供できるかということを意味しており、そうした者が新しい世代のプラットフォームの構成部分になるのです。SEOからAEO(エージェントエンジン最適化)まで、ページトラフィックからタスクチェーンの呼び出しまで、製品の形態とデザイン思考は再構築されています。第三次ブラウザ戦争は"入力"の中で起こり、"表示"ではありません。勝敗を決定するのは、もはや誰がユーザーの目を引くかではなく、誰がエージェントの信頼を勝ち取り、呼び出しの入口を得るかです。
ブラウザの発展の簡単な歴史
1990年代初頭、インターネットが日常生活の一部となる前に、Netscape Navigatorが登場し、新しい大陸を開く帆船のように、数百万のユーザーにデジタル世界への扉を開きました。このブラウザは最初のものではありませんが、真の意味で一般向けに普及し、インターネット体験を形作った最初の製品です。当時、人々は初めてグラフィカルインターフェースを通じてウェブページを簡単に閲覧できるようになり、まるで世界全体が突然手の届くところにあるかのように感じました。
しかし、栄光はしばしば短命です。マイクロソフトはすぐにブラウザの重要性を認識し、Internet Explorerを強制的にWindowsオペレーティングシステムにバンドルし、デフォルトのブラウザにすることを決定しました。この戦略は「プラットフォームの必殺技」と言われ、Netscapeの市場の支配地位を直接崩壊させました。多くのユーザーはIEを自発的に選んだのではなく、システムのデフォルトで受け入れたからです。IEはWindowsの配布力を借りて急速に業界の覇者となり、Netscapeは衰退の軌道にはまりました。
困難な状況の中で、Netscapeのエンジニアたちは、過激で理想主義的な道を選んだ - 彼らはブラウザのソースコードを公開し、オープンソースコミュニティに呼びかけた。この決定は、技術界における「マケドニア式の譲歩」のようであり、旧時代の終焉と新たな力の台頭を予感させた。このコードは後にMozillaブラウザプロジェクトの基盤となり、最初はPhoenix(と名付けられ、「不死鳥の再生」を意味したが、商標の問題から何度も名前が変更され、最終的にFirefoxと名付けられた。
Firefoxは単にNetscapeをコピーしたわけではなく、ユーザーエクスペリエンス、プラグインエコシステム、安全性などの面で多くの革新を実現しました。その誕生はオープンソース精神の勝利を象徴し、業界全体に新しい活力を注ぎました。FirefoxをNetscapeの「精神的後継者」と表現する人もいますが、これはオスマン帝国がビザンチンの余韻を引き継いだかのようです。この比喩は誇張されているものの、非常に意味深いです。
しかし、Firefoxが正式にリリースされる数年前に、Microsoftはすでに6つのバージョンのIEをリリースしており、時間的な優位性とシステムバンドル戦略により、Firefoxは最初から追いかける立場に置かれ、この競争がスタートラインで平等な公平な競争ではないことが運命づけられていた。
その間、もう一人の初期のプレーヤーもひっそりと登場しました。1994年、Operaブラウザーが登場しました。これはノルウェーから来ており、当初は実験的なプロジェクトに過ぎませんでした。しかし、2003年の7.0バージョンから、自社開発のPrestoエンジンを導入し、CSS、レスポンシブデザイン、音声制御、Unicodeエンコーディングなどの最先端技術をいち早くサポートしました。ユーザー数は限られていましたが、技術的には常に業界の最前線を行き、"ギークの愛好者"となりました。
同年、アップルはSafariブラウザを発売しました。これは意義深い転換点でした。当時、マイクロソフトは破産の危機にあるアップルに1.5億ドルを投資し、競争の表向きを維持し、独占禁止法の審査を回避しました。Safariの誕生以来のデフォルト検索エンジンはGoogleでしたが、このマイクロソフトとの歴史的な絡みは、インターネットの巨人たちの間の複雑で微妙な関係、すなわち協力と競争が常に寄り添っていることを象徴しています。
2007年、IE7はWindows Vistaと共に登場しましたが、市場の反応は平凡でした。一方、Firefoxはより速い更新サイクル、よりフレンドリーな拡張機構、そして開発者に対する自然な魅力を持ち、市場シェアは約20%に安定して増加しました。IEの支配は徐々に緩み、風向きが変わりつつあります。
Googleは別のアプローチを取ります。2001年から自社のブラウザを開発する構想を練り始めましたが、CEOのエリック・シュミットを納得させるのに6年かかりました。Chromeは2008年に登場し、ChromiumオープンソースプロジェクトとSafariで使用されるWebKitエンジンを基に作られました。「重い」と揶揄されるブラウザですが、Googleの広告投資とブランド構築のスキルにより、急速に成長しました。
Chromeのキー武器は機能ではなく、頻繁なバージョン更新のリズム)は6週間ごと(全プラットフォームでの統一体験です。2011年11月、Chromeは初めてFirefoxを超え、市場シェア27%に達しました;6ヶ月後、再びIEを逆転し、挑戦者から支配者への転換を完了しました。
その一方で、中国のモバイルインターネットも独自のエコシステムを形成しつつある。アリババ傘下のUCブラウザは2010年代初頭に急速に人気を博し、特にインド、インドネシア、中国などの新興市場では、軽量なデザインやデータ圧縮によるデータ節約といった特性を活かし、低価格帯のデバイスユーザーから支持を得た。2015年には、世界のモバイルブラウザ市場シェアが17%を突破し、インドでは一時46%に達した。しかし、この勝利は長続きしなかった。インド政府が中国製アプリの安全審査を強化するにつれ、UCブラウザは重要な市場から撤退せざるを得ず、かつての栄光を徐々に失っていった。
2020年代に入ると、Chromeの主導的地位が確立され、世界市場シェアは約65%で安定しています。注目すべきは、Google検索エンジンとChromeブラウザは同じAlphabetに属していますが、市場の観点から見ると2つの独立した覇権システムであるということです - 前者は世界の約90%の検索エントリを制御し、後者はほとんどのユーザーがインターネットにアクセスする「第一のウィンドウ」を掌握しています。
この二重独占構造を守るために、Googleは多額の資金を投入しています。2022年、AlphabetはAppleに約200億ドルを支払い、GoogleがSafariでのデフォルトの検索エンジンの地位を維持できるようにしました。分析によれば、この支出はGoogleがSafariのトラフィックから得る検索広告収入の36%に相当します。言い換えれば、Googleは城の堀を守るために"保護料"を支払っています。
しかし、風向きが再び変わった。大規模言語モデル)LLM(の台頭に伴い、従来の検索が影響を受け始めている。2024年、Googleの検索市場シェアは93%から89%に下落し、依然として支配的ではあるが、ひびが入ってきた。さらに破壊的なのは、Appleが独自のAI検索エンジンを発表する可能性についての噂である - Safariのデフォルト検索が自社の陣営に変更される場合、これはエコシステムの構図を書き換えるだけでなく、Alphabetの利益の支柱を揺るがす可能性がある。市場は迅速に反応し、Alphabetの株価は170ドルから140ドルに急落し、投資家の恐慌だけでなく、検索時代の未来の動向に対する深い不安を反映している。
NavigatorからChromeへ、オープンソースの理想から広告の商業化へ、軽量ブラウザからAI検索アシスタントへ、ブラウザの争いは常に技術、プラットフォーム、コンテンツとコントロールの戦争である。戦場は常に移動するが、本質は変わらない: 入口を握る者が未来を定義する。
VCの視点から見ると、LLMとAIの時代における人々の検索エンジンへの新たな需要を背景に、第三次ブラウザ戦争が徐々に展開しています。以下は、一部の有名なAIブラウザトラックのプロジェクトの資金調達状況です。
現代ブラウザの古いアーキテクチャ
ブラウザのアーキテクチャについて言及すると、従来のクラシックなアーキテクチャは以下の図に示されています:
クライアント - フロントエンド入口
HTTPSを通じて最近のGoogle Front Endに到達し、TLSの復号化、QoSサンプリング、地理的ルーティングを完了します。異常なトラフィック)DDoSが検出された場合、ここで流量制限やチャレンジを自動的に行うことができます。
クエリの理解
フロントエンドは、ユーザーが入力した単語の意味を理解する必要があります。3つのステップがあります:神経スペル修正、"recpie"を"recipe"に修正します。同義語の拡張、"how to fix bike"を"repair bicycle"に拡張します。意図解析、クエリが情報、ナビゲーション、または取引意図であるかを判断し、Verticalリクエストを割り当てます。
候補の呼び戻し
Googleが使用しているクエリ技術は、逆インデックスと呼ばれています。順序インデックスでは、IDを与えられればファイルをインデックスできます。しかし、ユーザーは何千億ものファイルの中から目的の内容がどの番号にあるかを知ることはできないため、非常に伝統的な逆インデックスを採用しており、内容を通じてどのファイルに対応するキーワードがあるかを検索します。次に、Googleはベクトルインデックスを採用して意味検索を処理します。つまり、クエリの意味に類似した内容を探すことです。テキストや画像などの内容を高次元ベクトル(embedding)に変換し、これらのベクトル間の類似性に基づいて検索を行います。たとえば、ユーザーが「ピザ生地の作り方」を検索しても、検索エンジンは「ピザ生地制作ガイド」に関連する結果を返すことができます。なぜなら、それらは意味的に類似しているからです。逆インデックスとベクトルインデックスを経て、約10万レベルのウェブページが初期選別されます。
マルチレベルソート
システムは通常、BM25、TF-IDF、ページ品質スコアなどの数千次元の軽量特徴を通じて、10万規模の候補ページを約1000件に絞り込み、初期候補セットを構成します。このようなシステムは推奨エンジンと総称されます。これらはユーザーの行動、ページ属性、クエリの意図、文脈信号など、さまざまなエンティティから生成される膨大な特徴に依存しています。例えば、Googleはユーザーの履歴、他のユーザーの行動フィードバック、ページの意味、クエリの意味などの情報を総合的に考慮し、また、時間(の一日の中の時間帯、一週間の特定の日)、リアルタイムニュースなどの外部イベントといった文脈要素も考慮します。
深層学習による主なランキング
初期の検索段階では、GoogleはRankBrainやNeural Matchingなどの技術を使用してクエリの意味を理解し、膨大な文書の中から初期的に関連性のある結果を絞り込みます。RankBrainは2015年にGoogleによって導入された機械学習システムで、特に初めて登場するクエリの意味をよりよく理解することを目的としています。クエリと文書をベクトル表現に変換し、それらの間の類似性を計算することで、最も関連性の高い結果を見つけ出します。たとえば、「ピザ生地の作り方」というクエリに対して、文書内に完全に一致するキーワードがなくても、RankBrainは「ピザの基礎」や「生地の作り方」に関連する内容を識別することができます。
Neural Matchingは、2018年にGoogleが導入した別の技術で、クエリとドキュメント間の意味的関係をより深く理解することを目的としています。これは、単語間の曖昧な関係を捉えるために神経ネットワークモデルを使用し、Googleがクエリとウェブコンテンツをより適切にマッチングできるようにします。たとえば、クエリ「なぜ私のノートパソコンのファンの音が大きいのか」に対して、Neural Matchingは、ユーザーが過熱、ほこりの蓄積、または高いCPU使用率に関するトラブルシューティング情報を探している可能性があることを理解することができ、これらの単語がクエリに直接現れていなくても対応できます。
ディープリアレンジ:BERTモデルの適用
最初のスクリーニングアウトで