Bleeping Computerは1月26日(米国時間)、「Yandex denies hack, blames source code leak on former employee」において、ロシアの最大手検索エンジンである「Yandex」のソースコードリポジトリが漏洩したと伝えた。元従業員によってリポジトリデータの漏洩が行われたと説明されている。
漏洩したリポジトリには、次の製品に関する技術データおよびコードが含まれていると指摘されている。
- Yandex検索エンジンおよびインデックスボット
- Yandex Maps
- Alice (AIアシスタント)
- Yandex Taxi
- Yandex Direct (広告サービス)
- Yandex Mail
- Yandex Disk (クラウドストレージサービス)
- Yandex Market
- Yandex Travel (旅行予約プラットフォーム)
- Yandex360 (ワークスペースサービス)
- Yandex Cloud
- Yandex Pay (支払い処理サービス)
- Yandex Metrika (インターネット分析)
研究者のAlex Buraks氏は。分析した結果をYandex検索エンジンのランキングファクタとしてTwitterで指摘している(参考「Alex Buraks / Twitter」)。
指摘されている主な内容は次のとおり。
- クロールの深さがランキング要素。メインページから1クリックがトップページ、3クリック以下が重要なページ
- メインページからのバックリンクは、内部ページからのバックリンクよりも重要
- 検索クエリの数がランキング要素
- Wikipediaからのトラフィックはランキング要素
- URLが検索セッションの最後の場合にはランキングに影響を与える
- ブックマークはランキング要素
- ショートビデオ(Tiktok、Shorts、Reels)は別途ランキング要素
- ページにおけるMaps js-apiはランキング要素
- URLのキーワードはランキング要素(検索クエリから最大3単語まで含めるとよい)
- リピーターはランキング要素
- 大文字の割合はランキング要素
- 直接トラフィックの割合はランキング要素
- 組み込みビデオはランキング要素(壊れた組み込みビデオは悪い)
- ソーシャルネットワーク上の検証済みアカウントはほかのURLとは異なるランキング付け対象
- キーワードのすべての単語がバックリンクアンカーに含まれている方がSEOに効果的
- よい被リンクと悪い被リンクの比率がランキング要素
- ドメイン上のテキストの品質がランキング要素
- ページ上の広告の量がランキング要素(広告が少ない方がランクが高い)
- Google AnalyticsのJavaScriptがランキング要素(Google Analyticsを使っているサイトの方がよい)
- PageRankによるトップ100 Webサイトからのバックリンクはランキングに影響する
漏洩したデータからはYandex検索エンジンが行っているページランキングの仕組みを見ることができるとし、SEO関係者から注目を集めている。