AI技術の進化は、検索エンジンのあり方を大きく変えつつあります。
これまでの検索エンジン最適化(SEO)が「一覧表示での順位」を競うものであったのに対し、生成AIを活用した新たな検索エンジン(Generative Engines, GE)では、コンテンツの可視性を高めるための全く新しい最適化手法が求められています。
それが「GEO(生成エンジン最適化)」です。
GEOは、ChatGPT、GeminiやPerplexity、GoogleのAI Overviewsなどの生成AIを活用した検索エンジンにおいて、コンテンツの可視性を高めるための最適化手法です。
従来のSEOが特定のキーワードでの検索結果ランキングを対象としていたのに対し、GEOは、生成された文章内に引用としてどのように露出するか、を最適化の対象とします。
つまり端的にいうと、
「いかにAIに見つけてもらい、表示してもらえるか』
のために行うべき施策ということです。
GEは、大規模言語モデル(LLM)を組み込んでおり、複数の情報源を要約して即座に回答を生成します。
これにより、ユーザーは個別のサイトへ遷移しなくても情報を得られるようになりますが、サイト運営者にとっては露出とトラフィックが激減する恐れがあります。
この、ブラックボックス化したGEに対して、制作者が自ら可視性をコントロールする手法としてGEOが注目されています。
GEOと密接に関連する概念として、「LLMO(Large Language Model Optimization)」があります。
時に混同される2つの概念ですが、どう異なるのか?それぞれの特徴と違いを挙げてみます。
ChatGPT、Perplexityなどの生成AIによる検索エンジンでの可視性を高めることを目的とします。
主な流入ルートは、AIの回答内での引用や参照です。
LLMを利用する際のWebサーチでの回答がこちらにあたります。
ChatGPTやGeminiなどの大規模言語モデル(LLM)に対して、コンテンツが効果的に取り込まれ、適切に応答に利用されるよう最適化する手法です。
主な流入ルートは、LLMの学習データとして取り込まれ、回答に利用されることです。
通常のLLMでの回答はこちらにあたります。
GEOとLLMOの大きな違いの一つが回答への反映速度です。
通常のLLM(例: GPT-4o単体利用など)は、事前に学習したデータに依存するため、Webの新しい記事はすぐには反映されません。
LLMOで最適化した文章がモデルにデータとして学習されるには、次回のモデル更新(数ヶ月~年単位)を待つ必要があります。
しかし、GEは通常、検索+LLMのハイブリッド構成です。
この場合、検索エンジン部が取得した最新のWebページデータをLLMの補助データとして利用するため、比較的即時にコンテンツが反映されます。
例えば、Perplexityでは数日~1週間程度、Bing Chatでは数日程度、Google SGEでは早ければ当日~翌日での反映が行われるとされています。
つまり、GEOの効果は、Web検索+GEのモデルに乗る場合には即時性があり、純粋なLLM自体の学習データに乗る場合には時間がかかる、と理解してください。
従来のSEOとGEOは、最適化の対象や目的が大きく異なります。
GEOでは、AIが情報を生成する際に参照する可能性を高めるため、コンテンツの構造や明確さ、信頼性などが重要となります。
例えば、要約や箇条書きの形式を用いることで、AIが情報を抽出しやすくなるなどです。
GEが回答文を生成する際、引用位置や文量が露出度を左右するため、従来のSEO指標であるランキングとは異なる指標も必要となります。
実際にGEOの施策はどのように進めれば良いでしょうか?
GEOは、LLMの仕組みやデータがそうであるように、いわゆるブラックボックスであり、明確にその施策についても公表されているわけではありません。
本稿では、GEO施策の研究結果を発表した論文、
GEO: Generative Engine Optimization
https://arxiv.org/pdf/2311.09735
から実践方法を探っていきたいと思います。
この論文では、まず、GEOの評価指標として、
「Word Count」
「Position-Adjusted WC」(文章中の先頭付近ほど指数的に重みを上げた語数)
「Subjective Impression」(関連度・影響度・独自性など7要素をGPT-4評価でスコア化)
といった新たな指標が提案されています。
その上で、これら指標を向上させる9つのGEO施策が紹介されています。
1・Authoritative(説得力を高める語調)
2・Statistics Addition(定量データを挿入)
3・Keyword Stuffing(旧来SEO的キーワード増量)
4・Cite Sources(外部出典の追加)
5・Quotation Addition(権威ある引用句の挿入)
6・Easy-to-Understand(平易化)
7・Fluency Optimization(流暢性向上)
8・Unique Words(独自語彙の追加)
9・Technical Terms(専門用語の追加)
実験結果によると、特に
・Quotation Addition
・Statistics Addition
・Cite Sources
が効果があり、Position-Adjusted WCとSubjective Impressionで最大40%の可視性向上が確認されていました。
一方で、旧来SEOで効果的とされているKeyword Stuffingはほぼ効果がなく、場合によっては悪化することが示されています。
また、低SERP順位サイトほどGEOの恩恵が大きく、5位サイトで100%以上の可視性向上例も確認されており、小規模サイトの救済やデジタル格差是正に寄与する可能性も示唆されています。
複合適用では、
・Fluency Optimization + Statistics Addition
が最も高いシナジーを発揮しました。
これらの手法は、AI生成時に「正確・簡潔・論理的な文章」「ジャーナリスティックな文体」「厳密な引用」が求められるGEのプロンプトに適合し、より多く引用に採用されやすいため効果的であると考えられます。
それでは実践例を見てみましょう。
この論文で、特に効果の高いとされている「Fluency Optimization + Statistics Addition」「Cite Sources」の実践例をご紹介します。
手順としては、元の文章(SEO対策がされた人間の文章)を、GEO対策した文章に改変します。
それを元の文章と比較し、GEO指標としてどのくらい改善があったかを定量的に評価する、という流れです。
Fluency Optimizationとは、文法エラーの修正、文のスムーズな接続、余計な語句の削除、簡潔な表現への変換などを行うことで、文章の流暢性を高める手法です。
従来のSEO目的で作られた、キーワードを過度に詰め込んだ文章は、流暢性が低く、GEに引用されにくい「悪い例」とされます。
ちなみに、AI生成の文章は、自然にこの最適化を含んでいるという特徴があります。
そのため意外にもAI生成の文章は、GEOの観点では優れた文章であることが多いです。
また、Statistics Additionとは、文章で述べられている主張を証明するための定量データの挿入です。
数字や統計データは、LLMが回答生成時に引用価値が高いとみなす情報です。
曖昧な表現よりも具体的な数値が含まれている方が、可視性向上につながります。
悪い例(人間が古いSEO目的で作った文章の例)
“Swiss chocolate is the best chocolate. Many people love Swiss chocolate. The secret of Swiss chocolate is its ingredients. Swiss chocolate makers use high-quality milk. The milk is fresh and the chocolate is smooth. Buy Swiss chocolate today!”
問題点: キーワード詰め込み、繰り返しが多い、論理展開が曖昧。
良い例(Fluency Optimization + Statistics AdditionでGEO対策された文章の例)
“Swiss chocolate’s renowned quality stems from the use of fresh Alpine milk and meticulous craftsmanship. According to a survey by the International Chocolate Consumption Research Group, Swiss citizens consume an average of 11-12 kg of chocolate annually, reflecting the product’s domestic popularity and global appeal.”
改善点: 文が論理的につながっている、具体的なデータ(Statistics Addition)が入っている、読みやすく滑らか。
GEは、出典の有無や明示性を非常に重視します。
信頼できる出典の情報を文章に明示的に入れることで、GEはその文章を安心して引用に利用でき、可視性が向上します。
悪い例(Cite Sourcesなしの文章)
“Swiss people love chocolate and consume a lot of it each year.”
問題点: 抽象的すぎてGEが引用として使いにくい。
良い例(Cite Sourcesありの文章)
“With per capita annual consumption averaging between 11 and 12 kilos, Swiss people rank among the top chocolate lovers in the world (According to a survey conducted by the International Chocolate Consumption Research Group).”
良い点: GEはこの文を丸ごと引用できるため、可視性が向上する。
GEのLLMは、引用できる文章や根拠がある文章を好むため、これらの手法は非常に強力です。
人間のユーザーにとってもデータがある方が信頼できる情報と認識されるため、LLMの学習にもそれが反映されていると考えられます。
いかがだったでしょうか?
AI時代における検索最適化は、従来の「検索結果でのランキング」を目指すSEOから、生成AIによる回答内でコンテンツが「引用・参照される」ことを目的とするGEOへと大きく転換しています。
GEOはブラックボックスな部分が多いため、その対策はまだまだ明確な答えはありませんが、この様な研究や実践を経て、少しづつ具体策が見つかっていくように思います。