GFW主动探测数据

日期:2021年2月9日

整理过后数据见 https://files.geistlib.xyz/sharing/misc/ ,为 finCN.csv

数据说明

  1. 来自两个 v2ray 的服务器约两年间的日志,通过 grep invalid /var/log/v2ray/access.log 并 awk 得到
    • GFW 主动探测还可能因 duplicated session id 被拒绝,少于十分之一,而且 ip 与 invalid user 重复,因此没算进去
  2. 删去了不来自 CN 的 ip,以及2个我知道的 ip
  3. ip 在被 geoiplookup 前经过了 uniq 不是 sort -u,因此可能有重复

统计

Heat map

详细见 https://files.geistlib.xyz/sharing/misc/geoHeatmap.html

自治系统

awk -F, '{print $7}' finCN.csv | sort | uniq -c | sort -rn 输出:

  10153  AS4837
   8992  AS4134
    629  AS17621
    522  AS140726
    314  AS4847
    203  AS17622
     72  AS17638
     54  AS140061
     26  AS9808
     11  AS58563
      3  AS4808
      3  AS38019
      3  AS24444
      2  AS56046
      2  AS56044
      2  AS24445
      2  AS24400
      2  AS134810
      1  AS56047
      1  AS56042
      1  AS56040
      1  AS4812
      1  AS24547