搜索

KaiYun Sports2026世界杯(中国)官方网站 马斯克绝对把X平台给开源了, 但是我却复刻不出来

发布日期:2026-05-16 18:46 点击次数:54

KaiYun Sports2026世界杯(中国)官方网站 马斯克绝对把X平台给开源了, 但是我却复刻不出来

自从马斯克开源X以后,寰球总会挟恨说“马斯克你这东说念主不纯碎,招待开源却莫得开源完好,寰球拿到代码也没方针我方作念个X平台”。

但是当今不错了,X开源仓库页迎来史上最大更新,你真实不错下且归我方造个X平台了。

马斯克第一次公开X保举算法代码,是在2023年3月31日。那时平台还叫Twitter,官方把twitter/the-algorithm和twitter/the-algorithm-ml两个仓库放上GitHub,公开了ForYou时候线背后的部分保举逻辑。

但那次更像一次“代码透明度展示”,外界能看到保举系统的基本运作式样,却拿不到训诫数据、模子权重、告白保举系统等关节部分。

而此次,马斯克玩真实了。

诚然,X并不是全球最大的酬酢平台。它的月活数目为5.7亿,X在2026年的瞻望收入约为29亿好意思元,比马斯克收购前的50.8亿好意思元下落了43%,收购前X的告白收入占比高达90%,收购后告白收入仍占总收入的不到70%。

但是它仍然是全球最首要的酬酢平台之一,每天处理12亿条内容、就业5亿用户的完好坐褥系统。Anthropic、OpenAI这些全球最顶尖的AI公司,皆以X动作第一信息分发平台。

马斯克发出这条X不到24小时,X的开源GitHub仓库须臾冲到了2万颗星星。

马斯克在开源声明中说:“咱们知说念这个算法很笨,需要大幅修订,但至少你不错看到咱们及时且透明地竭力于让它变得更好。莫得其他酬酢媒体公司这样作念。”

保举算法是酬酢媒体的中枢交易好意思妙,是决定用户“看什么、信什么、买什么”的底层逻辑。

在此之前,莫得任何一家主流平台快意把这套逻辑完好地摆到台面上。

马斯克作念了。

01

开源的具体内容?

此次开源的X算法,中枢是一个基于Grok的transformer保举系统。

通盘系统的架构并不复杂,遐想想路很了了:从两个来源取得候选内容,然后用机器学习模子调处转序,临了过滤掉不对适的内容,推送给用户。

两个内容来源分辨是Thunder和PhoenixRetrieval。

Thunder负责“网内内容”(In-Network),也等于你暖热的账号发布的帖子。它是一个内存数据库,及时跟踪所灵验户的最新发帖,反馈速率不错达到亚毫秒级别。

当你刷新信息流时,Thunder会坐窝把你暖热的东说念主最近发的内容拉出来。

PhoenixRetrieval负责“网外内容”(Out-of-Network),也等于你没暖热、但系统以为你可能感敬爱的帖子。

它通过机器学习作念相似度搜索,从全球语料库里找出和你昔时互动内容有关的帖子。这是保举系统最关节的部分,决定了你会不会在信息流里看到生疏账号的爆款内容。

两个来源的候选内容汇总之后,会插足调处的排序阶段。这个阶段的中枢是PhoenixScorer,一个基于Grok的Transformer模子。

这个模子不预测“有关性”,而是预测你对每条内容可能收受的具体行动,比如点赞概率、转发概率、回复概率、点击概率、举报概率、屏蔽概率。

每个行动皆有一个权重,正向行动(点赞、转发)权重为正,负向行动(举报、屏蔽)权重为负。最终得分是所有这个词预测概率的加权乞降。

得分高的内容排在前边,得分低的内容排在背面。

仅此汉典。

X在开源文档里特等强调了少许:咱们一经绝对遗弃了所有这个词手工特征工程和大部分启发式执法。

Grok-basedTransformer承担了所有这个词坚苦的职责,它通过相识你的互动历史,比如你点赞了什么、回复了什么、共享了什么,然后基于此自动判断什么内容和你有关。

这意味着,昔时那些依赖关节词堆砌、标签匹配的运营策略一经失效了。系统当今更注意语义相识,能够深度分析内容的实验价值和用户的真实需求。

开源是开源了,但并不是齐备开源。

起源,模子权重莫得齐备灵通。

GitHub仓库里照实包含了一个预训诫的miniPhoenix模子,256维镶嵌、4个巩固力头、2层Transformer,打包成一个3GB的压缩包,通过GitLFS分发。这个模子不错让路发者径直跑起来端到端的推理历程,不需要我方训诫。

但这仅仅一个“迷你版”。X在坐褥环境里委果使用的Phoenix模子,鸿沟要大得多,参数目、层数、镶嵌维度皆不在一个量级上。开源的这个mini模子,更像是一个教学样本,让你相识系统怎样职责,但不是X委果在用的阿谁。

它像一台教学用小发动机,能让你看懂发动机旨趣,也能真实转起来,但它不是X每天给几亿用户刷ForYou信息流时用的那台委果发动机。

委果的坐褥模子轻率率更大、更复杂、训诫数据更多、调参更多,知说念的用户举止也更多。是以它保举得准不准、反应快不快、能不成扛住真实流量,和这个mini模子不是一个量级。

其次,训诫数据莫得公开。

保举系统的中枢竞争力,一半在模子,一半在数据。X每天处理12亿条内容,积贮了海量的用户举止数据,比如谁点赞了什么、谁屏蔽了谁、谁在什么时候看了哪些内容、看了多久。

这些数据才是Phoenix模子能够准确预测用户举止的压根原因。

但这些数据不可能开源。一方面是阴私问题,另一方面是交易好意思妙。

莫得这些数据,KaiYun Sports2026世界杯(中国)官方网站即使你拿到了完好的模子架构和代码,也训诫不出一个和X相同好用的保举系统。

第三,告白系统只开源了框架,莫得开源策略。

此次开源包含了一个新的ads模块,处理告白注入和定位,包括品牌安全跟踪,会尊重明锐内容鸿沟。但具体的告白竞价逻辑、出价策略、ROI优化算法,这些径直联系到X收入的核神思制,并莫得齐备公开。

第四,内容相识管说念Grox(Grox是X保举系统里,基于Grok构建的内容相识工程就业)只开源了部分本事。

Grox是一个新加入的就业,提供分类器、镶嵌器和任求实行引擎,用于垃圾检测、帖子分类、PTOS计谋实行等内容相识职责。但Grox具体怎样判断一条内容是垃圾、怎样识别违纪内容、怎样实行平台计谋,这些细节并莫得齐备透明。

是以,你诚然不错凭证GitHub开源的这些东西去造一个雷同X的酬酢平台,但你造不出一个和X相同好用的保举系统。

你不错拿到完好的系统架构、候选调回逻辑、排序框架、过滤执法,不错跑通端到端的推理历程。淌若你有浪掷的工程本事,照实不错搭建一个雷同的保举系统。

然则你莫得X的数据、莫得X的坐褥级模子、莫得X在昔时几年里积贮的工程优化和调节策略。也就没方针1比1复刻X平台。

02

为什么要开源?

早在2022年10月收购Twitter的时候,他就公开暗示:“让算法开源以加多信任”是他对这个平台的愿景之一。

2023年3月31日,马斯克完了了第一个快乐。那时还叫Twitter的X平台,在GitHub上发布了部分保举算法的源代码,包括用户时候线里推文保举的算法逻辑。

那次开源激发了高大暖热。

开荒者们第一次看到了Twitter保举系统的里面运作式样,也第一次阐述了一些恒久流传的别传,比如,某些账号照实会被算法降权,某些内容类型照实会被优先保举。

马斯克那时说,提供“代码透明度”一启动会“令东说念主难以置信地难过”,但最终会“导致保举质地的快速栽植”。

他还说:“最首要的是,咱们但愿赢得你们的信任。”

但那次开源并不完好。GitHub仓库里的大部分文献皆来自率先的上传,后续更新很少。好多开荒者挟恨,代码库莫得握续爱戴,文档不够详实,好多关节模块莫得公开。

此次开源,马斯克赫然吸取了训诫。

豪门国际官网娱乐网

更特事理的是,马斯克在X上发布算法更新的那条推文时,他东说念主正在北京。但此次开源的委果策划,是欧洲。

X平台在欧洲濒临着越来越严格的监管审查,而马斯克正在用“透明”和“灵通”动作兵器,去招架监管压力。

2025年7月,法国稽查机关对X平台张开看望,怀疑其算法存在偏见和诈骗性数据提真金不怕火举止。

欧盟委员会也对X发出了文献保留令,条目其提供算法有关内容,看望重心是诞妄信息传播、内容审核不力和信息透明度劣势。

X平台那时拒却合营看望,并指控这是一场“出于政事动机的刑事看望”,威迫到用户的言论解放。

马斯克甚而在欧盟委员会的推文下回复了一个脏话。

但拒却合营赫然不是遥远之计,于是马斯克把算法给开源了。

与其被迫经受监管机构的审查,不如主动把代码公开,让全寰宇的开荒者、沟通者、监管者皆能看到X的保举逻辑。

这样一来,X不错声称我方是“全球最透明的酬酢平台”,任何干于算法偏见、内容支配的指控,皆不错用“代码一经开源,你们我方去看”往来答。

进攻才是最佳的防患。

天然,开源也不是莫得代价的。

起源,竞争敌手不错径直学习X的架构遐想和工程实践。当今别东说念主彻绝对底地沟通X是怎样作念调回、怎样作念排序、怎样作念种种性终结的。

淌若X的某些遐想照实比竞品好,那么这些遐想很快就会被复制。

其次,开起源露了X的短处。

开荒者们一经在GitHubissue区指出了一些问题:为什么某些过滤执法遐想得不够合理?为什么种种性终结的参数扶助得这样保守?为什么告白注入的逻辑这样简便嚚猾?

但马斯克以为,这些代价是值得的。

X当今濒临的最大问题不是技艺,而是信任。用户不信任X的内容审核,告白主不信任X的品牌安全,监管机构不信任X的算法公正性。

开源算法,是重建信任的最径直式样。

它不成处置所有这个词问题,但至少不错领略X莫得在暗箱操作,X的保举逻辑是不错被试验的,X快意经受公众监督。

在一个越来越强调透明度和问责制的时期,这种姿态自身等于一种竞争力。

马斯克在2023年开源Twitter算法时说过一句话:“咱们但愿X成为互联网上最透明的系统,并让它像最盛名、最告捷的开源式样Linux相同遒劲。”

当今看来,他是谨慎的。

X能不成真实造成“酬酢媒体界的Linux”,还需要时候考证。

但至少在开源这件事上KaiYun Sports2026世界杯(中国)官方网站,马斯克一经走在了所有这个词主流酬酢平台的前边。

查看更多