• 判断网站操作系统

    • Linux 大小写敏感
    • Windows 大小写不敏感
  • 扫描敏感文件

    • robots.txt
    • crossdomain.xml
    • sitemap.xml
    • xx.tar.gz
    • xx.bak 等
  • 确定网站采用的语言

    • 如 PHP / Java / Python 等
    • 找后缀,比如 php/asp/jsp
  • 前端框架

    • 如 jQuery / BootStrap / Vue / React / Angular 等
    • 查看源代码
  • 中间服务器

    • 如 Apache / Nginx / IIS 等
    • 查看 header 中的信息
    • 根据报错信息判断
    • 根据默认页面判断
  • Web 容器服务器

    • 如 Tomcat / Jboss / Weblogic 等
  • 后端框架

    • 根据 Cookie 判断
    • 根据 CSS / 图片等资源的 hash 值判断
    • 根据 URL 路由判断
      • 如 wp-admin
    • 根据网页中的关键字判断
    • 根据响应头中的 X-Powered-By
  • CDN 信息

    • 常见的有 Cloudflare、yunjiasu
  • 探测有没有 WAF,如果有,什么类型的

    • 有 WAF,找绕过方式
    • 没有,进入下一步
  • 扫描敏感目录,看是否存在信息泄漏

    • 扫描之前先自己尝试几个的 url,人为看看反应
  • 使用爬虫爬取网站信息

  • 拿到一定信息后,通过拿到的目录名称,文件名称及文件扩展名了解网站开发人员的命名思路,确定其命名规则,推测出更多的目录及文件名

  • 常见入口目标

    • 关注度低的系统
    • 业务线较长的系统