Bleeping Computerは1月26日(米国時間)、「Yandex denies hack, blames source code leak on former employee」において、ロシアの最大手検索エンジンである「Yandex」のソースコードリポジトリが漏洩したと伝えた。元従業員によってリポジトリデータの漏洩が行われたと説明されている。

  • Yandex

    Yandex

漏洩したリポジトリには、次の製品に関する技術データおよびコードが含まれていると指摘されている。

  • Yandex検索エンジンおよびインデックスボット
  • Yandex Maps
  • Alice (AIアシスタント)
  • Yandex Taxi
  • Yandex Direct (広告サービス)
  • Yandex Mail
  • Yandex Disk (クラウドストレージサービス)
  • Yandex Market
  • Yandex Travel (旅行予約プラットフォーム)
  • Yandex360 (ワークスペースサービス)
  • Yandex Cloud
  • Yandex Pay (支払い処理サービス)
  • Yandex Metrika (インターネット分析)

研究者のAlex Buraks氏は。分析した結果をYandex検索エンジンのランキングファクタとしてTwitterで指摘している(参考「Alex Buraks / Twitter」)。

指摘されている主な内容は次のとおり。

  • クロールの深さがランキング要素。メインページから1クリックがトップページ、3クリック以下が重要なページ
  • メインページからのバックリンクは、内部ページからのバックリンクよりも重要
  • 検索クエリの数がランキング要素
  • Wikipediaからのトラフィックはランキング要素
  • URLが検索セッションの最後の場合にはランキングに影響を与える
  • ブックマークはランキング要素
  • ショートビデオ(Tiktok、Shorts、Reels)は別途ランキング要素
  • ページにおけるMaps js-apiはランキング要素
  • URLのキーワードはランキング要素(検索クエリから最大3単語まで含めるとよい)
  • リピーターはランキング要素
  • 大文字の割合はランキング要素
  • 直接トラフィックの割合はランキング要素
  • 組み込みビデオはランキング要素(壊れた組み込みビデオは悪い)
  • ソーシャルネットワーク上の検証済みアカウントはほかのURLとは異なるランキング付け対象
  • キーワードのすべての単語がバックリンクアンカーに含まれている方がSEOに効果的
  • よい被リンクと悪い被リンクの比率がランキング要素
  • ドメイン上のテキストの品質がランキング要素
  • ページ上の広告の量がランキング要素(広告が少ない方がランクが高い)
  • Google AnalyticsのJavaScriptがランキング要素(Google Analyticsを使っているサイトの方がよい)
  • PageRankによるトップ100 Webサイトからのバックリンクはランキングに影響する

漏洩したデータからはYandex検索エンジンが行っているページランキングの仕組みを見ることができるとし、SEO関係者から注目を集めている。