基本対策は「ウェブサイトの情報充実と定期更新」
顧客が生成AIに「〇〇業界でおすすめの企業は?」と質問したとき、自社の名前が挙がるかどうかは、生成AIがアクセスできる情報の質と量に大きく依存します。
現在の生成AIは、主にインターネット上に公開されている情報を学習データとして利用しています。つまり、自社のウェブサイト、プレスリリース、ニュース記事、SNS投稿、業界レポートなど、パブリックドメインにある情報が、生成AIが参照する主要な情報源となります。
そのため、企業としては公式ウェブサイトの情報を充実させ、定期的に更新することが基本となります。特に、企業概要、製品・サービスの詳細説明、導入事例、技術仕様などの基本情報は、可能であれば構造化されたフォーマットで明確に記載することが重要です。また、外部メディアでのプレスリリース掲載や業界メディアへの露出、SEO対策も生成AIの回答精度向上に寄与します。
生成AIは企業情報を2度参照する
生成AIが企業情報を参照するタイミングは、大きく分けて2つの段階があります。
まず、LLM(大規模言語モデル)の学習段階です。ChatGPTであれば2021年9月まで(GPT-3.5)や2023年4月まで(GPT-4)というように、特定の時点までの情報を大量に取得・学習してモデルを構築しています。この段階で取り込まれた情報は、モデルの「基礎知識」として定着します。この時点までに十分な情報を発信していた企業は、生成AIの回答に登場しやすくなる、といえるでしょう。
次に、最新の生成AIツールは、リアルタイムでのウェブ検索機能を備えています。ChatGPT、Microsoft Copilot、Perplexity AI、Google Gemini、Claudeなどは、ユーザーの質問に応じて最新のウェブ情報を検索し、その結果を回答に反映させることができます。この機能により、最新のプレスリリースや新製品情報も回答に含まれるようになりました。
効果的なSEO対策で回答に引用されやすくなる
私たちが使用する一般的な生成AIツールは、以下のような方法で企業情報にアクセスしていると考えられています。
学習済みデータからの情報抽出が最も基本的な方法です。生成AIは膨大なテキストデータから学習したパターンを基に、関連する企業情報を「思い出す」ように回答を生成します。ただし、この方法では情報の正確性や最新性に限界があり、時として古い情報や不正確な情報が含まれる可能性があります。数年前の生成AIツールが、「現在の日本の首相は?」の質問に対して、過去の情報しか返せなかったのを記憶している方もいるのではないでしょうか。
最新のウェブ検索機能を持つ生成AIツールの場合は、検索エンジンと連携して最新情報を取得します。ユーザーの質問に含まれるキーワードを基に検索を実行し、上位に表示されるウェブページから情報を抽出して回答に組み込みます。このため、SEO対策が効果的に行われている企業サイトは、生成AIの回答に引用されやすくなります。
「○○業界の主要企業」を生成AIに質問してみよう
自社の情報が生成AIにどのように認識されているかを確認することは、デジタルマーケティング戦略を立てる上で重要です。
最も直接的な方法は、実際に生成AIツールに自社について質問してみることです。「〇〇社について教えてください」「〇〇社の主要製品は何ですか」といった質問を投げかけ、回答の正確性や詳細度を確認します。複数の生成AIツールで同様の質問を行い、結果を比較することで、各プラットフォームでの自社の認知度を把握できます。
また、競合他社との比較質問も有効です。「〇〇業界の主要企業を教えてください」といった質問で、自社が言及されるかどうか、どのような文脈で紹介されるかを確認することで、市場における自社のポジショニングを客観的に評価できます。
2025年11月現在、こうした状況を確認するための、各種ツールが登場しています。とくにこれまでSEO対策情報を提供してきたツールが、AI対策の機能を備える傾向があります。生成AI対策を効率的に推進するなら、ツールの活用も検討する必要があります。
「生成AIが自社サイトに来ているか?」を確認する方法
生成AIやそのクローラー(サイトを回遊して情報収集を行う機能・ツール)が実際に自社サイトにアクセスしているかを把握することは、BtoB企業のデジタルマーケティング活動を最適化するうえで、重要な要素になってきています。
まず、サーバーのアクセスログを分析することで、AIクローラーの訪問を確認できます。OpenAIの「GPTBot」、Anthropicの「Claude-Web」、Googleの「Google-Extended」など、主要な生成AI企業は独自のUser-Agent(Webブラウザがサーバーに対して自分自身を識別するために送信する文字列情報)を使用してウェブサイトをクロールしています。これらのUser-Agentを含むアクセスログを定期的にチェックすることで、どの生成AIがいつ、どのページにアクセスしたかを把握できます。
Google AnalyticsやGoogle Search Consoleなどの分析ツールも利用可能です。Search Consoleでは、クロール統計情報からさまざまなボットのアクセス状況を確認できますが、すべての生成AIクローラーが明確に識別できるわけではないため、分析に当たっては不明なボットからのアクセスパターンも注意深く観察する必要が出てくると考えられます。
robots.txtファイルへのアクセス頻度も重要な指標です。robots.txtファイルとは、ウェブサイトの運営者が検索エンジンのクローラーに対して「クロールしてよいページ/してはいけないページ」を指示するためのテキストファイルです。生成AIのクローラーは、サイトをクロールする前にrobots.txtファイルを確認することが一般的です。このファイルへのアクセスログを分析することで、どの生成AIがサイトに興味を持っているかを推測できます。
実験的なアプローチとしては「自社サイトにユニークな情報やフレーズを掲載し、一定期間後に生成AIに質問してその情報が反映されているかを確認する」という方法も考えられます。例えば、独自の製品コードや特殊な用語を使用し、それが生成AIの回答に現れるかどうかをテストすることで、情報の取り込み状況を検証できる可能性があります。