日常巡检与排障
本文档用于汇总当前租户范围内的高频巡检项、问题入口和建议排查顺序,帮助团队快速判断问题属于登录、权限、应用、联邦还是同步链路。
适用场景
- 用户无法登录
- 权限已配但仍无访问
- 应用跳转失败、回调异常或接入链路不通
- 联邦、
SCIM或同步状态异常
负责角色
- 租户管理员
- 实施支持
- 客户成功
核心边界
- 本主题只覆盖当前租户视角的日常巡检和故障定位
- 如果出现平台级健康异常、跨租户问题或全局配置误变更,应升级到 平台可观测性与健康检查 或 平台问题分流与排障
- 深入运维数据查看可结合 租户可观测性与健康检查 和 租户 MCP 运维入口
每日 / 每次变更后的建议巡检项
- 当前租户后台是否可正常进入
- 是否存在管理员或关键用户无法登录的反馈
- 核心应用能否完成最小登录与跳转
- 联邦、
SCIM、SAML是否出现明显失败提醒 - 品牌、域名提示和登录入口是否仍符合预期
常见任务
- 先判断问题发生在登录前、登录中、登录后还是授权后
- 先查当前租户资料、用户状态、应用状态,再看联邦、
SCIM和审计信息 - 针对登录失败和权限未生效分别使用专题 SOP 收敛排查步骤
推荐排查顺序
- 先确认问题影响的是单个用户、单个应用,还是整个租户
- 先看当前租户状态、管理员反馈和最近变更
- 登录问题优先判断入口可见性、认证结果和回跳结果
- 权限问题优先判断应用访问、角色、
Claim/Scope边界 - 联邦 /
SCIM问题优先看配置状态、最近失败和调用链路 - 如果后台或健康页已经出现平台级异常,立即升级
高频问题分类
用户无法登录
- 可能落在用户状态、密码 /
MFA、租户状态、联邦入口或回跳链路
权限已配但仍无访问
- 可能落在应用访问分配、角色继承、功能权限或应用侧本地鉴权
应用无法跳转或回调失败
- 可能落在应用配置、回调地址、协议参数或联邦 /
SAML链路
同步失败或映射异常
- 可能落在
SCIMtoken、字段冲突、来源限制、联邦映射或租户禁用
推荐证据收集项
- 问题用户、应用、租户和发生时间
- 复现路径、报错文本和页面截图
- 最近是否做过品牌、联邦、
SCIM、应用或权限变更 - 健康页、审计或失败摘要中是否已有对应记录
相关 SOP
何时要升级
- 故障影响多个租户或多个核心应用
- 平台健康检查、后台首页或运维摘要已提示平台级异常
- 需要修改全局开关、宿主配置或平台默认策略
延伸阅读
返回 租户运营配置文档