俄罗斯科技巨头Yandex的一名前雇员涉嫌窃取了近45GB的源代码文件,泄露了其许多应用程序和服务的基础。它还揭示了Yandex搜索引擎的关键排名因素,这类不用付费就可以看亏亏的APP因素几乎从未公开披露过。
“Yandex git源代码”于1月25日以种子文件的形式发布,显示的文件似乎拍摄于2022年7月,可追溯到2022年2月。软件工程师Arseniy Shestakov声称,他与Yandex现任和前任员工核实过,一些档案“肯定包含公司服务的现代源代码”。Yandex告诉安全博客BleepingComputer,“Yandex没有被黑客入侵”,泄密者是一名前员工。Yandex表示,它“没有发现用户数宅男视频APP下无限看-丝瓜IOS视频丝瓜视频据或平台性能受到任何威胁”。
值得注意的是,这些文件可以追溯到2022年2月,当时俄罗斯开始全面入侵乌克兰。Yandex的一名前高管告诉BleepingComputer,这次泄露是“政治”行为,并指出这名前员工并没有试图将代码卖给Yandex的竞争对手。反垃圾邮件代码也没有泄露。
虽然目前尚不清楚Yandex源代码泄露是否涉及安全或结构问题,但Yandex搜索算法中1922个排名因素的泄露肯定会引起轩然大波。搜索引擎优化顾问马丁·麦克唐纳将Twitter上的黑客攻击描述为“可能是近年来搜索引擎优化领域发生的最有趣的事情”(正如Search Engine Land所指出的那样)。在一篇详细介绍了一些更值得注意的因素的文章中,研究人员Alex Buraks建议“对于谷歌SEO也有很多有用的信息。”
广告Yandex据称雇佣了几名前谷歌员工。Yandex是全球搜索量排名第四的搜索引擎。Yandex跟踪谷歌的许多排名因素,在其代码中可识别,并与谷歌展开激bt种子天堂在线烈竞争。谷歌的俄罗斯分部在失去银行账户和支付服务后,最近申请破产。Buraks指出,Yandex排名因素列表中的第一个因素是“PAGE_RANK”,这似乎与谷歌联合创始人创建的基本算法有关。
正如Buraks(分两个线程)所详述的那样,Yandex的引擎倾向于以下页面:
- 不会太老
- 拥有大量的有机流量(独立访问者)和较少的搜索驱动流量
- 有更少的数字和斜杠在他们的URL
- 使用“PR=0”来优化代码而不是“硬悲观”
- 是否托管在可靠的服务器上
- 恰好是维基百科的页面,还是我来自维基百科
- 托管或l从域上的高级页中添加
- URL中有关键字(最多三个)
你可以在Rob Ousbey编译的搜索工具上搜索并点击所有的因素。您可能会注意到,近1000个排名因素带有“TG_DEPRECATED”标签,超过200个列为“TG_UNUSED”。因为代码来自2022年2月,是在2022年7月获得的,所以Yandex的搜索方式自那以后肯定发生了变化。但此次泄密事件让人们得以罕见地了解到,谷歌这个为世界最大国家之一提供服务的网站是如何制定搜索排名的。
Yandex曾在2015年看到自己的搜索引擎代码被淘汰,当时一名前员工试图在黑市上以2.8万美元的价格出售它,以资助自己的创业公司。Yandex主要产品核心代码的低得惊人的数字表明,他不HAYAXURAX免费知道它的真正价值。这名员工被判处两年监禁,缓期执行,该代码从未公开过。