先日、MUVERA(ミューヴェラ)アルゴリズムを6月25日に発表しました。
google:https://research.google/blog/muvera-making-multi-vector-retrieval-as-fast-as-single-vector-search/
本サイトにて詳細が書いてあるので見ていただきたいのですが、内容としてベクトル検索の技術的な内容となっています。
本稿では、マルチベクトル類似度検索を単一ベクトル類似度検索に簡略化する検索メカニズム、MUVERA(MUlti-VEctor Retrieval Algorithm)を紹介する。これにより、マルチベクトル検索に市販のMIPSソルバーを利用できるようになる。MUVERAは、クエリと文書の固定次元エンコーディング(FDE)を非対称的に生成・・・
正直、難しすぎてよくわからないので、例を挙げて解説します。↓
MUVERAアルゴリズム原理とは
具体的な例を挙げて解説します。
🔍【MUVERAを「探し物」に例えてみる】
あなたが本棚を持っていて、そこには何百冊もの本があるとします。
本を探すとき、普通なら「タイトル」や「著者名」など、1つのラベルを使って検索しますよね。これが「単一ベクトル検索」です。
でも最近は、「表紙の色」「ジャンル」「あらすじ」「登場人物」など、いろんな特徴を使って探すともっと正確に見つけられるようになりました。これが「マルチベクトル検索」です。
要は複数の特徴で探すことです。
ただし…それだけ情報(特徴)が多いと、本を探すのにすごく時間がかかるのが難点です。
🧠【MUVERAは“優秀な図書館員”】
MUVERAは、こう言います。
「本の特徴を全部調べるのは時間がかかるから、
その本の“特徴をギュッとまとめたカード”を1枚だけ作っておこう」
この“カード”を作る技術がMUVERAの「FDE(固定次元エンコーディング)」であり、複数の情報を、1つの効率的な情報に変える技術です。
だから探すときは、このカードを使えば速くて、しかもほとんど正確に探し物ができます。
複数の特徴が書いてあるインデックスカードみたいなイメージです。 これを用意しておけば早いという事です。でもこのカード。超膨大な数になります。このカード自体を探すのに手間がかかります。
これをFDEという技術で「特徴は残しつつ、検索しやすい形に整形している」ため早く検索できるわけです。
↓MUVERAのイメージ動画
MUVERA導入によって起きる変化
MUVERAが導入されることにより、これまで以上に深い理解を持った検索結果が体験できるようになります。
項目 | Before(従来) | After(MUVERA導入後) |
---|---|---|
🔍 検索の仕組み | マルチベクトル | 単一ベクトル |
⚙️ 必要な計算量 | 非常に多い | 少ない |
💻 必要なサーバリソース | 高性能マシン/大規模なインフラが必要 | 軽量な構成でも動作可能 |
⏱ 検索のスピード | 遅くなる傾向 | 最大90%のレイテンシ削減 |
📈 見つけたいもの見つける能力 | 候補を沢山出力するので遅い | 同等以上の成果をキープしつつ効率化 |
兎にも角にも、ユーザーが求めている情報精度が上がり、かつサーバーへの負担が軽減され、早くなるという事です。
生成AI検索との違いとは
読めば読むほど、「生成AI、chatGPTやGeminiの検索と何が違うの?」ってなりますよね?
■MUVERA:「欲しい情報がどこにあるかを探す技術」
■生成AI:「その場で答えを作ってくれる技術」
になります。仕組みは大きく違うのですが、一見利用者側からすると変わらない気がします。しかし、検索結果は相違します。MUVERAの場合、加工はしません。あくまで探す技術に特化しています。よって生成AIのように編集した検索結果を出力することはありません。
もちろん両者とも0⇒1で創造することはできません。
また情報を提供するシステムを作っている人からすると大きく違います。MUVERAにはデータがあるが、後者はデータがないため、APIで情報を引っ張ろうとしても後者は不可能となります。
🎯違いのまとめ
特徴 | MUVERA(ベクトル検索) | 生成AI(ChatGPTなど) |
---|---|---|
目的 | 似た情報を探す | 答えや文章を作る |
出力 | 既存データの場所 | 新しく作った文章 |
検索元 | 実際の文書・ページ | 学習済み知識、または外部検索結果 |
得意なこと | 正確な情報の位置特定 | 人間らしい自然な回答や要約 |
生成AIがあるのになぜMUVERAを作ったのか?
生成AIだけでもユーザーの検索ニーズを満たしたものは作り上げられそうに思います。なのになぜGoogleはMUVERAを作り、発表したのでしょうか?
ここからは私の予想ですが、生成AIではカバーしきれないものがまだまだ存在しているのだと思います。
例えば、生成AIは、自然な会話や文章生成が得意ですが、「正確で根拠がはっきりした情報の提示」や「大量データの高速検索」にはまだまだ限界があり、その限界があるが故、ハレーション(嘘情報)を起こしてしまうリスクがあるのだと思います。
MUVERAは、あくまで検索システムです。探す力に特化しており、ハレーションは起こしません。あるものだけ伝えてきます。
つまり、MUVERAで生成AIの足りないクロール力というか探す力、検証力をカバーしてより精度の高い生成AIを作ろうとしているのだと思います。
なので、合わせうちが正しい使い方なのだと思います。
SEO対策としてはどうすればいいか?
これまで以上によりコンテンツを深堀していかないといけないのは間違いありません。
対策内容 | 解説 |
---|---|
1. 検索意図の深掘り | ユーザーが本当に知りたいことに答える構成に |
2.専門性・体験・信頼性の強化 | 医師監修、専門家の体験談、レビューなどを活用 |
3. 構造化データの最適化 | FAQやHowToなど、AIに拾われやすいマークアップが重要 |
4.動画・音声など多様なコンテンツ形式 | AI要約に埋もれないメディア形式で存在感を出す |
5.ブランド検索・指名検索を増やす | 生成AIでは得られない「独自性・ストーリー」を武器にする |
1つのコンテンツを作るのに本当に深く迄考えます。
・ユーザーがなぜそのキーワードで検索するのか
・どんな情報が知りたいのか
・どんなアクションを取りたいのか
・どんな結果を求めているのか
この辺りはすべて網羅しておきたいところです。
まとめ
新しいアルゴリズムMUVERAが導入されました。いままであった小手先のSEO対策はもう効きません。良くなったとしても長続きしないのは予測着くかと思います。
GEOやLLMOもそうですが、ユーザーファーストでコンテンツを作ることが結果につながります。
お金がある大企業はコストをかけながらコンテンツを作れますが、中小企業ではなかなか難しいところです。いかにコスパよくSEOを行うかは今後も大きなテーマとなるでしょう。
弊社では、SEOやWEB集客のコンサルティングを行っています。お気軽にご相談下さい。