历时三个月,帖子推荐引擎架构蜕变之路
建邺娱乐新闻网 2025-09-13
帖子中选动力新建可分三个先决条件 。第一,通过辅助工具工程再行稳住该系统,理论上权利中后期新建的人力物力;第二,集中人力大均需求量写出理论上娱乐节目,大大提更高该系统质均需求量;第三,便次优化辅助工具工程,减较低公共计安全安定所均需人力。
具体我将回馈: 废料马达器结构上新建、已念过服务这两项新建和扩屈曲容辅助工具。
初始先决条件,我们接入了帖子形同熟的运维辅助工具,组合了原有理论上功能处理辅助工具、优化了团购原作者,借助了基于 QPS 和进行时亲率的单纯理论上功能屈曲拟于功能。
质均需求量新建 - 废料
次序动力行驶的第一步为将废料初始化为带特性的废料,一次均需处理方式数万条数据资料,原废料携带特性多,一次劝告所均需接收者均需求量大,因此我们可选择了种系统马达器所有废料。
马达器原运用于基于文件系统算子的内部马达器动力。该动力交流速率慢,交流占用大,普遍存在文件系统耐用性妥善解决办法(帖子中选动力的理论上妥善解决办法所在),还容许了废料规模。因此我们写出了该动力, 写出时考虑了两个值得注意:单条废料马达器和全面性废料马达器。
废料具有一般而言特性: 特性数均需求量数百但最低混和亲率较较低,全面性数据资料较密集,大均需求量特性为字段标准型。若用类借助则密集数据资料才会造形同文件系统浪费,大均需求量字段才会造形同文件系统碎裂浪费,长期运用于无法尽可能安定性。因此 废料的其设计均需满足三值得注意建议:文件系统均需近十年必定有碎裂;密集情况下三维空间的提更高效率;必定影响该系统耐用性。
我们借助了如下三幅的二级引文结构上:
如三幅所示,我们将废料分形同了四段,白色部可分头部,保存理论上接收者,红色部可分一级引文,黄色部可分二级引文,红色部可分实际上数据资料段。
该结构上一级引文为 Bitmap,每一位均可回应有否有一个字段普遍存在废料中,借助了密集的支持者。 二级引文为所有普遍存在字段的偏移均需求量后方,对于字段为编译均需求量,对于数字或二进位马达器数据资料本身,尽可能了马达器速率。此外该马达器结构上文件系统近十年,满足了上述三条建议。
全面性废料马达器我们采用了Concurrent HashMap 结构上,改版速率可达瞬时数万,满足了废料数均需求量的建议。
质均需求量新建 - 已念过
已念过功能为中选迳程的理论上娱乐节目,中选该系统均能够依赖普通用户已念过数据资料,将普通用户未念过主旨顺利完形同次序。帖子中选该系统原已念过是基于 bloom filter 借助的。
如三幅为帖子原 30 天已念过方案实例:共计四个 filter,每十天马达器一个 filter,每次写入构成最近 30 天的四个 filter,取回 bloom filter 后通过或运算将其合并形同一个 bloom filter 供后续业务范围运用于。
该方案第一 结构上不合理,面对所有普通用户 bloom filter 大小均不变,因此:更高消费的普通用户运用于帖子频亲率更高,混和亲率更高,则误判更高;较低消费普通用户阅念过均需求量小,三维空间利用亲率较低,浪费资源。第二, 该方案直接写入马达器的 Redis,马达器一旦出错服务这两项也难免受牵连,安定性差。第三, 该方案各业务范围直接写入资源本身,判断逻辑均需各服务这两项分立借助。
因此我们好好了如下新建:第一, 将以念过分立形同为一个服务这两项,各个业务范围调取服务这两项而非缓存;将常用判断逻辑烧录为 SDK,就让于业务范围更动。
第二, 马达器方式上保持了 bloom filter 理论上,但是串的长度和单位的大小均可变。在写入时不按照分开用时写入,而是前一个 filter 混和亲率达到敏感度时才开启一个新的 bloom filter,根据前一个 filter 混和速率可选择下一个 filter 的大小。如此可安全节省原来一半以上的三维空间:更高消费普通用户 bloom filter 串虽较长,但体积也才会较大,可减较低误判;超更高消费普通用户容许最大串长度,已念过纪录用时虽才会屈曲短,但是能尽可能其已念过主旨相比较长久;较低消费普通用户一般来说较小的 bloom filter 完形同已念过纪录。
第三,在安定性上,一值得注意我们 建立联系了分立的短期(如几个小时)已念过马达器,在主要资源必定只用提供倒数第服务这两项;另一值得注意,我们 优化了 Redis 的资源访问方式,Meta 接收者及最新一个 bloom fileter 均需从主库写入,尽可能接收者时效性,已不改版的其他接收者写入从库即可,可缓解 Redis 的马达器资源。
内部辅助工具 - 扩屈曲容
内部辅助工具扩屈曲容一般防范两类妥善解决办法: 日常迳均需求量波动,如中更高峰晚更高峰均需理论上功能拟于防范迳均需求量更高峰;区域性流血事件心肌梗塞迳均需求量,均能够基于冗余度的理论上功能扩屈曲容和区域性防范有助于。
日常迳均需求量防范较为单纯,此处不便赘述。心肌梗塞迳均需求量特性如下:
三幅中黄线都是迳均需求量,捷运都是该系统承稳控制能力(可理解为机器数均需求量),捷运在黄线底下才可尽可能该系统正常行驶。捷运更高于黄线的部可分冗余度。
迳均需求量在 t1 下一场早些,此时黄线才会更快下降,在 t2 下一场超过捷运,拟于该系统才会在 t1 后某点见到迳均需求量,诱发拟于,最终机器在 t3 下一场到位。
借助该心肌梗塞迳均需求量拟于均需好好到:第一, 在 t1 到 t2 中间更快见到迳均需求量的早些,如此时还未好好处理方式,到 t2 后就让已进行时;第二, 建立联系倒数第方式而以供拟于时暂用,如停止某些次要功能、减较低中选处理方式条数。第三, 减较低拟于等待时间(即 t1 到 t3 的等待时间),优化程序重新启动速率。
具体妥善解决办法可根据历史迳均需求量数据资料和新公司情况处理方式:如新公司形同本担忧小可将冗余度调更高,将捷运全面性上移;如服务这两项自身重新启动快,可省略倒数第方式而。
帖子中选动力依赖帖子已有的形同熟拟于能源供应,妥善解决了迳均需求量更快见到妥善解决办法;结合前和文的废料新建,动力重新启动速率从 20 分钟减较低至了 5 分钟。
此外, 帖子中选动力在各娱乐节目上均加入了计算均需求量条数和劝告的动态倒数第控制能力,根据当前实际上 QPS 与承载控制能力可选择倒数第比例。例如当前可处理方式计算均需求量条数的 80%,如果迳均需求量增加则只处理方式 70%。理论上功能有助于之外,如有区域性流血事件预警可全新公司月内动员,每日 push 场景可月内处理方式。
轻松的指导方法
轻松的辅助工具可减较低开发新效亲率。我们在接入帖子这两项的辅助工具体系时,再行好好了一个可手动核对视觉效果及接管理论上功能拟于逻辑的界面,减较低了掌控该系统的速率。利用大数据资料类的深入研究辅助工具可通过录制大均需求量劝告、核对其 UID 或者某些特症等深入研究异常劝告原因。
此外,本次新建中大均需求量指导为梳理旧业务范围code,繁琐无聊,设计团队士气也至关重要。
帖子中选新建这两项共计将近三个年底,全局方式劝告比例从仅仅 99% 大大提更高至 99.9% 以上,服务这两项耗时减较低 25%,不增加资源支持者种系统 500 万 -1000 万废料,重新启动速率大大提更高至原再行的 4 倍。
嘉宾简述:
马骎:2017 年加入帖子,曾专责帖子关系迳交流业务范围等开发指导。目前为止专责帖子 A/B 测试增长和平台、帖子热情迳中选动力的业务范围开发和安定性新建指导。
活动中选
在今年的 6 年底 19 日和 20 日,ArchSummit 亚太地区架构师峰才会刚脚踏上海,此次决议,我们多达设置了十五个专题,其中包含大数据资料与人脑、中间件开发新实战、移动端开发新实证、微服务这两项架构设计等等,详细专题主旨可通过下方 Banner 扫码了解,期许和你两兄弟现场交迳。
点个在看少个 bug👇
。株洲看妇科哪家好杭州白癜风专科医院哪个好
造成卵巢早衰的病因有哪些
糖尿病吃什么水果
小孩开胃健脾吃什么
钇90治疗
中国能做钇90的医院
Y90树脂微球是什么
晚期肝癌能治愈吗
钇90微球

-
高雅光学(00907.HK)及认购人同意认购依法将于1月12日或之前完成
星闻 2025-11-03巴朗节录1月底10日丨高雅光学00907.HK发布公告,于2022年1月底7日,入股人Kingdom Investment Corporation Limited的法律均是由接到该公司,未完

-
Meta元宇宙财务状况正式出炉:亏损超百亿美元
写真 2025-11-032021年最重大的科技事件之一就是Facebook美国公司改东进元地球人,这在在世界上科技界引发了舆论哗然。 但是从以外的最新消息来看,现在Meta的显出并不出色。

-
李楠:一个人代表中国参赛 望展现最佳冲动
综艺 2025-11-03李楠 杭州时间2月3日,自由式滑雪女子雪上技巧外围赛结束厮杀,中国选手李楠以63.32分排名第19位,未能直通决赛。澳大利亚选手安东尼排名第一。从前的决赛中,荷

-
从农历九月廿三开始,鸿运天降,会顺风下海,喜笑颜开的三大生肖
时尚 2025-11-03考虑这件事情确实很重要,不是有那么一句话吗:快乐的成功不是好不容易,而是考虑。考虑对了方向,不必需太费力就能朝向成功,而选错了方向,就算再坚持也是徒劳。那么疑虑来了,如何才能想到出合理的考虑呢?

-
刘少林将在北京冬奥出战五项 称弟弟很快但会发威
音乐 2025-11-03蔡武当派 沈阳小时2月3日,沈阳雅典奥运会艺术体操速滑项目将会开赛,匈牙利名将蔡武当派报项出炉,他将受邀女子500米等五个小项,堪称劳动模范。蔡武当派暗示,儿子蔡少昂今