选择服务商前应测量什么
可信的代理测试应关注输出质量,而不只是原始速度。保持目标列表、并发、会话设置和测试窗口一致,结果才适合采购决策。
建议的 72 小时测试计划
- 1从真实工作负载中选择 20-50 个代表性 URL。
- 2对每个服务商使用相同并发和会话设置。
- 3测量成功率、p95 延迟、地区匹配、会话连续性和重试量。
- 4结合消耗流量和最低消费,计算每次成功请求成本。
成功率
可用 2xx/3xx 响应数 / 总尝试数
对每个服务商使用相同目标集合,统计可用响应,并单独记录重试次数。单价较低但重试更多时,真实成本会很快上升。
- 使用相同 URL 列表
- 保持相同并发
- 区分目标站错误和代理错误
延迟分布
p50、p90 和 p95 响应时间
平均延迟会掩盖长尾风险。记录 p90 和 p95,因为长尾延迟会影响浏览器自动化、SERP 快照和周期监测任务。
- 测量端到端请求时间
- 区分冷启动与已建立会话
- 按目标国家对比
地区准确性
国家、城市与 ASN 匹配率
住宅代理服务商应提供你请求的地区。信任 SERP 或电商数据之前,先通过 IP 检测端点验证国家、城市和 ASN。
- 检查国家匹配
- 在承诺城市定向时检查城市匹配
- 记录 ASN 和 ISP 漂移
会话稳定性
同一工作流内的 IP 连续性
粘性会话应在登录检查、购物车、表单和浏览器智能体等多步骤流程中保持稳定路由。不要只看首个请求是否成功。
- 运行多步骤流程
- 跟踪 IP 连续性
- 记录会话过期行为
每次成功请求成本
总支出 / 可用响应数
实际成本指标不是 GB 单价。公平比较服务商时,需要计入失败尝试、重试、粘性会话空闲流量和最低消费。
- 计入重试流量
- 计入最低消费承诺
- 比较每个可用结果的成本
测试评分表
| 指标 | 健康信号 | 决策风险 |
|---|---|---|
| 成功率 | 可用输出稳定高于内部阈值 | 高重试量会抬高成本并拖慢任务 |
| p95 延迟 | 目标国家的长尾延迟可预测 | 自动化和监测工作流会变得不稳定 |
| 地区准确性 | 国家/城市/ASN 匹配所选路由 | SERP 和电商数据可能被污染 |
| 会话稳定性 | 粘性会话能跨步骤保持 IP 连续性 | 表单、购物车和浏览器智能体丢失状态 |
| 每次成功成本 | 真实输出成本符合预算 | 便宜 GB 单价掩盖失败输出成本 |
测试常见问题
先测试代理,再比较价格,最后查看 Trust Center,再决定是否扩展工作负载。
代理测试需要多少请求才够?
用于采购决策时,先从小而真实的集合开始:20-50 个真实 URL,在多个小时内重复,并使用你预期的并发。
免费代理应放进同一个测试吗?
只适合低风险对比。免费代理可用于学习,但生产评估应在相同请求和会话设置下比较商业服务商。
最重要的代理指标是什么?
每次成功请求成本通常最实用,因为它同时包含成功率、重试、消耗流量和最低消费。