APP推广合作
联系“鸟哥笔记小乔”
马斯克罕见低头:开源推荐算法,自嘲“很烂”不过未来月更
2026-02-21 14:03:50

就现在,很烂GitHub已经能完整看到马斯克开源的克罕推荐算法系统了。

开源文件里明确表示,见低荐算这是头开一个几乎完全由AI模型驱动的算法系统。

  • 我们移除了所有人工设计特征和绝大多数启发式规则。源推月更



消息一出,整个社区立刻沸腾了,很烂最高赞上去就是克罕一顿猛夸:

  • incredible!没有其他平台能做到如此透明。见低荐算



马斯克本人也火速转发了工程团队原帖,不过一向言辞高调的源推月更老马,此番却低调表示:

  • 我们知道这个算法很蠢(dumb),法自需要大幅改进,很烂但至少您可以实时、克罕透明地看到我们为改进它而努力。见低荐算
  • 其他社交媒体公司都没有这样做。



早在2022年收购(原Twitter)之前,马斯克就多次批评该平台过于封闭。

自收购之后,他也兑现承诺多次公开Twitter核心推荐算法,这一次也算是不忘初心了。

原来纯AI驱动的推荐系统,是这样运作的!

话不多说,咱这就扒一扒整套系统的运作机制。

一句话概括这个系统即为:

基于Grok-1同款Transformer架构打造,能通过学习你的历史互动行为(点赞/回复/转发过什么),来决定给你推荐什么内容。

从用户打开“For You”开始,客户端会向服务器发送一个请求,触发整个算法流程。



然后系统会先做一件事——搞清楚你是谁、你最近在干什么、你平时对什么内容有反应。

为实现这一目的,系统会拉取两类用户信息:

  • 行为序列(Action Sequence):一类代表最直接、最强烈的兴趣信号,比如最近点赞、回复、转发、点进、停留过什么。
  • 属性(Features):另一类代表长期属性,比如关注列表、声明的兴趣主题、地理位置、使用设备等。

这一步的目标并不是人工构造特征,而是尽可能真实地构建“实时用户画像”——

以前工程师可能会假设“某些属性很重要”,然后手动编写规则或公式去计算一个“用户兴趣得分”。

但这本质上是工程师的猜想,而非用户真实状态的反映。

于是马斯克的这套算法就决定不做任何预设假设,而是尽可能多地、原始地收集用户最真实的行为反应,然后将这堆数据直接喂给后续的模型,从而让模型自己去从原始数据中学习和发现规律。(即“去人工化”和“端到端”)

而拿到实时用户画像后,系统会接着兵分两路,从整个平台的海量推文中快速筛选出几千条“可能相关”的推文

一条是通过熟人圈。即从Thunder模块,直接抓取你关注的所有人的最新推文。

另一条是通过外部。利用Phoenix Retrieval这一核心检索模块,抓取那些你可能感兴趣、但来自未关注账号的推文。



以上两类来源不同的信息,会在后续阶段被统一对待。

需要提醒,此时筛选出来的还只是推文ID。

于是系统会通过Hydration模块,补全每条候选推文的信息,包括推文全文、作者详情、图片/视频、历史互动数据等,以便后续深度评估。

而且在正式开始计算前,还会进一步通过Filtering模块淘汰那些明显不要的内容,例如:

  • 重复或过期的帖子
  • 用户自己发布的内容
  • 来自拉黑或静音账号的帖子
  • 包含用户屏蔽关键词的内容
  • 已经看过或在当前会话中展示过的帖子
  • 用户无权限访问的订阅内容

记住,这一步只做一件事:回答某条内容“能不能出现,而不是值不值得推荐”。



铺垫到这里,最终剩下来的内容会被逐条送入Phoenix排序模型进行打分。

这个模型是一个基于Transformer的模型,它会同时接收:

  • 用户的行为序列与属性信息
  • 单条候选帖子的内容与作者信息

然后模型会预测用户对某条推文执行各种操作的概率,并将各种概率按照预设权重进行加权组合(如点赞类正向行为加分、拉黑类负向行为减分),并形成最终排序分数。

基于此,系统还会进行少量工程层面的调节——

比如控制作者多样性,避免单一账号在信息流中占据过高比例(防止某一大V刷屏)。

这里也需要提醒,为了保证送入的每条帖子都是独立评分的,所以系统还特意设置了“不允许候选帖子相互看见”(推文之间没有交叉注意力机制)。



所有候选帖子按最终得分排序,系统从中选出Top-K条帖子,作为本次请求的推荐结果。

而且在返回客户端之前,系统还会进行最后一轮校验,确保内容符合平台安全规范——

例如,移除任何已删除、被标记为垃圾信息或包含暴力血腥等违规内容的推文。

最终,经历重重筛选后的信息会根据分数高低,依次展示给客户端用户。



总结下来,这套系统能够成功运转的五大关键在于(官方划重点版):

(1)纯数据驱动,拒绝人工规则

彻底摒弃人工定义“什么内容算好”的复杂规则,改由AI模型直接从原始用户数据中学习。

(2)采用候选隔离机制,独立评分

AI模型在给内容打分时,每条内容“看不见”其他候选内容,只能看到用户信息。这确保了每条帖子的分数不会因为同批次其他帖子而变化,分数一致且可高效缓存复用。

(3)哈希嵌入,实现高效检索

检索和排序都使用多个哈希函数进行向量嵌入查找,提高效率。

(4)预测多元行为,而非单一分数

AI模型不直接输出一个模糊的“推荐值”,而是对多种用户行为同时预测。

(5)模块化流水线,支撑快速迭代

整个推荐系统采用模块化设计,各个组件可以独立开发、测试、替换。

“是的,这算法太烂了”

不过,虽然众人对老马开源的姿态表达了赞赏,但奈何这套算法还是有一些“缺陷”。

有网友就在推荐算法开源后吐槽道:

  • 由于API访问受限且成本高昂,现在屏蔽列表的做法已经很少见了,但以前这种做法非常普遍。
  • 算法必须让较旧的屏蔽列表随着时间推移而逐渐消失,这样这些较旧的屏蔽列表就不会再被恶意利用。

言下之意是,算法代码显示“被大量用户屏蔽”是一个强负面信号,会直接导致账号被“降权”,即内容更难获得推荐,但代码中没有明确看到针对“屏蔽”信号的时间衰减机制

这意味着,历史上的屏蔽记录可能至今仍在影响账号的推荐分数。

此番言论也引得马斯克本人现身评论区吐槽:

  • 是的,这算法太烂了。



但不管怎样,老马想要改变的态度已经明确——

不仅过去开源、现在开源,而且接下来还会持续开源,未来每4周将重复一次开源更新

开源仓库:
https://github.com/xai-org/x-algorithm

百科
分享到朋友圈
收藏
收藏
评分
评论

综合评分:

我的评分

参与评论(0)

社区交流公约

暂无评论,快来抢沙发吧~
登录后参与评论
发布评论
用户社区交流公约

Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
超级nice便签砖
超级超级超级奈斯!
1000羽毛
立即兑换
【新品】办公/外出两用静音充电小电扇
办公桌必备小电扇!
2000羽毛
立即兑换
百科
发表文章5
确认要消耗 羽毛购买
一个模型两个漏斗做好拉新活动吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接