技术SEO清单
爬取性与索引化
- robots.txt 存在且未屏蔽重要页面
- XML 站点地图存在、有效,并已提交到 GSC
- 站点地图仅包含规范的、可索引的 URL
- 重要页面未被 noindex 元标签屏蔽
- Canonical 标签指向正确的 URL(无自指错误)
- 无孤儿页面(所有页面可从内链到达)
- 重要页面距首页爬取深度 ≤ 3 次点击
- 分页处理正确(rel=next/prev 或无限滚动信号)
核心网页指标 (Core Web Vitals)
| 指标 | 良好 | 需要改进 | 差 |
|---|---|---|---|
| LCP(最大内容绘制) | ≤ 2.5s | 2.5–4.0s | > 4.0s |
| INP(下次绘制交互) | ≤ 200ms | 200–500ms | > 500ms |
| CLS(累积布局偏移) | ≤ 0.1 | 0.1–0.25 | > 0.25 |
HTTPS 与安全
- 所有页面通过 HTTPS 提供
- HTTP 自动 301 重定向到 HTTPS
- SSL 证书有效且未接近过期
- 无混合内容(HTTPS 页面上无 HTTP 资源)
- 已设置 HSTS 头
- 存在安全响应头(CSP、X-Frame-Options 等)
移动端与结构化数据
- 移动端友好(响应式设计或独立移动 URL)
- 存在 viewport meta 标签
- 移动端无侵入式插屏广告
- 关键页面类型有 JSON-LD 结构化数据
- 富媒体摘要测试无错误
- 已设置 Open Graph 和 Twitter Card 元标签
URL 与网站架构
- URL 简洁、描述性且全小写
- 无 URL 参数导致的重复内容
- 所有更改/删除的 URL 有 301 重定向
- 无重定向链(A→B→C 改为 A→C)
- 自定义 404 页面返回 HTTP 404(非 200)
- 多语言站点的 hreflang 标签正确
- URL 格式一致(带或不带末尾斜杠)
robots.txt 示例
User-agent: *
Allow: /
# 屏蔽管理后台和私有区域
Disallow: /admin/
Disallow: /api/
Disallow: /private/
Sitemap: https://example.com/sitemap.xml