ITBear旗下自媒体矩阵:

飞猪广告外投系统优化记:千亿级请求下超时率骤降的实战之路

   时间:2026-01-24 21:34:50 来源:天脉网编辑:快讯 IP:北京 发表评论无障碍通道
 

飞猪用户增长广告外部投放系统(RTA)自2022年上线以来,已成为支撑头条、小红书、华为等十余家头部媒体广告业务的核心基础设施。该系统日均处理千亿级请求,峰值QPS突破百万级别,对系统稳定性、响应速度和资源利用率提出了严苛要求。随着业务规模持续扩张和策略复杂度提升,技术团队通过系统性架构优化和技术创新,在性能提升与研发效能方面取得突破性进展。

系统架构采用双通道接入模式:通过阿里妈妈广告交易平台(Tanx)实现流量聚合转发,同时支持小红书、vivo等媒体直连调用。整体链路分为网关层与应用逻辑层,前者承担高并发接入与智能路由,后者需在毫秒级时间内完成设备识别、人群定向、策略匹配、频次控制及出价计算等复杂决策。技术团队围绕性能优化与效能提升两大核心目标,构建了覆盖网络、网关、应用、业务的全链路优化体系。

在研发效能升级方面,技术团队首先实施应用架构解耦,将RTA模块从原有混合部署的应用中独立拆分。这一改造基于三个关键考量:RTA业务逻辑相对独立且流量占比超90%;独立部署后更易实施单元化改造;可充分享受Java技术栈升级红利。系统迁移过程中,团队选择保留Java技术体系,但将技术栈升级至JDK21(支持虚拟线程)、SpringBoot 3.x(模块化初始化提升启动速度10-20%)及网络中间件优化方案,有效降低I/O开销与堆外内存使用。

发布流程优化是提升系统韧性的重要举措。通过移除冗余测试卡口、合并发布批次、将Beta环境日志采样改为全量采集等措施,问题发现能力提升300%。基于JDK21与SpringBoot3的升级,应用重启时间缩短80%,配合分钟级故障恢复机制,显著提升系统可用性。在测试环节,团队构建的流量回放系统可自动采集线上请求快照,在预发环境进行全场景验证,使测试周期从72小时压缩至24小时。

性能优化工作从网络层展开深度改造。针对跨地域调用导致的超时问题,技术团队实施三阶段优化:首先启用HTTP长连接复用,将TCP建连耗时从30ms降至零;其次通过改造HTTP客户端,保留首次请求已建立的TCP连接供后续复用;最终实施单元化部署,在深圳、南通等区域机房本地化部署服务,使超时率从30%降至0.01%。网关层优化中,通过启用Tengine后端长连接池、精简配置项、关闭非必要日志等措施,使TIME_WAIT连接数下降99%,服务器集群CPU使用率降低10个百分点。

应用层优化聚焦非核心路径性能瓶颈。日志系统通过协议精简(JSON转紧凑格式)、批量聚合、异步刷盘和分层采样等组合策略,在保持可观测性的前提下,使CPU占用下降9个百分点,日志存储成本降低60%。针对下游服务长尾请求问题,引入主动熔断机制,对关键依赖设置独立超时阈值,有效平滑P99延迟波动。业务逻辑层通过重构召回策略,构建多维身份并行匹配引擎,解决原有单一优先级规则导致的ID不匹配问题,使参竞失败率下降40%。

这些优化措施带来显著业务价值:在QPS提升60%的情况下,服务器资源消耗降低30%;测试周期缩短65%,发布效率提升80%,新渠道接入时间从5天压缩至2天;参竞效率与投放精准度同步提升,无效拉新率下降25%。技术团队正探索将AI能力深度融入系统,通过构建自动诊断与策略优化机制,推动RTA系统向智能决策引擎演进,为业务增长提供更强技术驱动力。

 
 
更多>同类资讯
全站最新
热门内容
网站首页  |  关于我们  |  联系方式  |  版权声明  |  争议稿件处理  |  English Version