肾域AI KidneySphere AI

使用说明(试用必读 · 面向所有人)

世界级极简 · 科研小白 10 分钟闭环 · 多中心合并 · IgAN MEST‑C · 基因变异长表
科研用途优先:本系统仅用于随访数据登记与研究汇总,不提供诊断/处方/急救指导; 请勿录入姓名/电话/病案号/身份证等可识别个人信息(PII)。
🎯 10 分钟拿到论文核心材料(科研小白也能跑通)
最短路径:后台导出论文包 zip → 本地一键运行 → 自动生成 Table 1 / QC / 趋势图 / 12m 结局 / Methods 草稿。 多中心合并键为 center_code + patient_code
提示:系统导出 CSV 默认带 UTF‑8 BOM,Excel 直接打开一般不乱码;若出现 ###### 多为列宽不足(双击列边界自动适配)。

试用必读(所有人必须看)

试用目的
在 3–10 个中心联动场景下,用最少操作跑通科研闭环:
录入 → 导出论文包 → 一键统计 → QC → 补录 → 再导出 → 固化版本
试用周期(默认建议)
1 个月试用(30 天)(可录入/修改/导出) + 7 天宽限(仅用于导出最终论文包与复核,原则上不再新增/修改)。
以后台显示的到期日为准。
到期后会怎样?
到期后项目进入 只读(保证多中心结果可复现,避免“边分析边改数据”)。
宽限期内仍可导出最终论文包用于 DCC 合并与复核。
合规与去标识化
禁止录入 PII(姓名/电话/MRN/身份证等)。
patient_code 只能是研究编号;各中心本地保存映射表,不上传系统。
试用成功验收(建议)
1) 能稳定生成论文包并跑出输出;2) 至少完成 1 轮 QC→补录→复跑;3) 核心四项(日期/BP/Scr/UPCR)完整率明显提升;4) 多中心合并无冲突;5) 同一导出包重复运行结果一致。

📋 这套系统能做什么科研?(场景举例)

以下均为真实常见科研需求,系统可直接支持,无需额外开发。
IgAN
IgA 肾病多中心队列研究
研究目的:评估 Oxford MEST-C 病理积分与 5 年肾功能进展(eGFR 下降 ≥ 40%)的关联。
参与方:北京/上海/广州 3 家中心,合计 280 例。
做法:各中心用同一 center_code 录入基线(含 MEST-C)+ 每季度随访(BP/Scr/UPCR);后台导出合并包 → 一键跑出 Kaplan-Meier 曲线 + Table 1 + Cox 回归 draft。
投稿方向:JASN / KI / AJKD
LN
狼疮性肾炎诱导缓解疗效比较
研究目的:比较他克莫司 vs. MMF 在 III/IV 型 LN 的 12 个月完全缓解率。
参与方:单中心,120 例。
做法:录入基线用药方案 + 每月随访 UPCR/补体/dsDNA;12 个月时后台一键生成结局表(完全缓解 = UPCR < 0.5 + Scr 稳定)。
投稿方向:ARD / Rheumatology
MN
膜性肾病 PLA2R 滴度与缓解预测
研究目的:分析基线 PLA2R 抗体滴度与 24 个月自发缓解率的关系。
参与方:单中心,80 例。
做法:基线录入 PLA2R 滴度(lab_long 表)+ 每 3 月随访 UPCR;系统自动判断缓解(UPCR < 0.5)并输出缓解时间分布。
投稿方向:JASN / KI
KTX
肾移植术后排斥反应监测
研究目的:描述活体肾移植术后 12 个月内急性排斥发生率及其危险因素。
参与方:单中心移植科,60 例。
做法:使用 KTX 模块,记录供体信息、免疫诱导方案、术后随访 Scr/他克莫司谷浓度;系统自动计算 eGFR 趋势。
投稿方向:Transplantation / AJT
GENERAL
FSGS / ANCA / 糖尿病肾病 / 任意病种真实世界研究
研究目的:例如:评估 FSGS 患者使用 sparsentan 治疗后 UPCR 变化(真实世界观察性研究)。
参与方:1–5 家中心,任意规模。
做法:选 GENERAL 模块 → 录入任何肾病患者的核心四项(日期/BP/Scr/UPCR)+可选药物/检验 → 导出分析。无需适配特定病种字段。
投稿方向:任意肾病/内科期刊
多中心
多中心 DCC 数据合并示例(任意病种)
场景:4 个中心各自独立录入,DCC(数据协调中心)负责汇总分析。
关键:各中心 center_code 不同(BJ01/SH01/GZ01/CD01),patient_code 各自分配;合并时以 center_code+patient_code 作为全局唯一键。
操作:各中心后台分别导出论文包 → DCC 将 4 份 CSV 按中心键合并 → 统一运行分析脚本 → 一键生成合并版 Table 1 + QC + 结局。
RCT
随机对照试验(RCT)干预效果评估
研究目的:比较干预组 vs. 对照组在 12 个月主要终点(UPCR 下降 ≥ 50% 或 eGFR 稳定)的差异。
参与方:单中心或多中心,例如 120 例(干预组 60 例、对照组 60 例)。
做法:创建患者基线时填写"RCT 随机化信息"(干预组别 / 随机号 / 随机化日期)→ 每季度随访 BP / Scr / UPCR → 后台导出论文包,CSV 中含 treatment_arm 分组列,一键出组间比较表 + KM 曲线草稿。
投稿方向:NEJM / Lancet / JASN

🔎 什么是 GENERAL(通用 / 混合)模块?

一句话:GENERAL 是"万能接口"——当你的病种不是 IgAN / LN / MN / KTX 时,或你想混合多个病种放进同一个项目,就选 GENERAL。
什么时候选 GENERAL?
  • 病种为 FSGS、ANCA、IgA 血管炎、糖尿病肾病、高血压肾病、慢性肾脏病(CKD 泛人群)等
  • 研究对象是"所有肾内科住院患者"(混合病种)
  • 跨病种比较(如 IgAN vs. LN 对照组)
  • 只想快速建一个随访数据库,暂时不确定病种分层
  • 科室做质量改进(QI)项目,需要跑全科患者数据
GENERAL 与其他模块的区别
模块适用场景特有字段
IgANIgA肾病研究Oxford MEST-C 病理积分
LN狼疮性肾炎补体/dsDNA
MN膜性肾病PLA2R/THSD7A抗体
KTX肾移植随访供体/手术/排斥信息
GENERAL任意/混合病种无特有字段,全部通用
GENERAL 模块能做什么分析?
核心四项(日期 / BP / Scr / UPCR)全病种通用 → 可自动计算:eGFR 趋势、UPCR 缓解率、12 个月结局、QC 报告、Table 1 基线特征表、Methods 草稿
如需病种特有指标(如补体、抗体)→ 使用 labs_long 表的自由字段追加即可,分析脚本中可自定义读取。
GENERAL 模块举例:全科 CKD 数据库
场景:某肾内科希望建立科室级别的全患者随访数据库(不区分病种),用于年度质量报告和发表真实世界研究论文。
做法:
  1. 后台创建项目,模块选 GENERAL,center_code = 本中心代码
  2. 每位患者录入:研究编号(patient_code)、入组日期、基线 Scr/UPCR/BP
  3. 每次随访录入:日期 + Scr + UPCR + BP
  4. 年底一键导出论文包 → 运行脚本 → 自动生成:平均 eGFR 变化、UPCR 改善率、随访完整率报告
结果:不用 Excel,不用手写脚本,全科一年数据 1 小时出图出表,直接用于年会汇报和论文。
GENERAL 模块举例:混合病种研究(IgAN + FSGS 对照)
场景:研究者想比较 IgAN 与 FSGS 患者对相同治疗方案的反应差异,希望把两组放在同一项目中。
做法:选 GENERAL 模块(而不是 IgAN),在 patients_baseline 的 diagnosis 字段分别填 "IgAN" 和 "FSGS" → 分析脚本按 diagnosis 分层即可。
优势:同一个项目,同一个 center_code,合并导出时不需要跨项目拼接。

🎲 RCT 随机化录入说明(从未做过 RCT 也能一看就会)

RCT 是什么?(给没做过的人)
把符合入组条件的患者随机分成两组,然后比较谁效果更好:

组别接受什么治疗常见叫法
干预组新药 / 新方案试验组、治疗组
对照组常规治疗 / 安慰剂空白对照组
安慰剂组外观相同的无效药三臂试验时用
随机号:统计师提前生成的随机分配表,每个编号对应一个组别,按顺序分配给入组患者。
在本系统里只需做一件事
创建患者基线时,在底部"RCT 随机化信息"框里额外填 3 个字段,其余步骤(随访录入 / 导出 / 分析)与普通观察性研究完全相同

字段名称填什么填写示例
干预组别这位患者被分到哪组干预组
随机号纸质盲底上的编号R-0042
随机化日期患者正式入组当天2024-03-01
⚑ 观察性队列研究 → 三个字段全部留空即可,不影响任何现有功能。
完整操作流程(5 步,含 RCT 专属动作)
步骤谁来做具体操作RCT 额外动作
① 建项目 PI / 管理员 后台 → 新建项目,选病种模块 + 填中心代码 无,和普通研究相同
② 录基线 研究助理 每位患者录入性别、出生年、基线 Scr / UPCR 额外填写"RCT 随机化信息"三个字段
③ 发链接 研究助理 后台 → 患者列表 → 生成随访链接 → 发给患者/随访员 无,和普通研究相同
④ 按时随访 患者 / 随访员 用链接录入:日期 / BP / Scr / UPCR(每季度一次) 无,和普通研究相同
⑤ 导出分析 统计人员 后台 → 一键生成论文包 → 运行脚本 CSV 中自动含 treatment_arm 列,按组分析即可
手把手举例:某 IgAN 双臂 RCT(120 例)从零到出图全流程
研究设计
单中心,IgAN 患者 120 例,由统计师提前生成随机分配表(1:1),患者按入组顺序领取随机号,分配至:
  · 干预组(60 例):恩格列净(SGLT2 抑制剂)10 mg/d + 标准治疗
  · 对照组(60 例):安慰剂 + 标准治疗
主要终点:12 个月 UPCR 下降 ≥ 50%。

① 建项目(管理员,做一次)
后台 → 新建项目 → 项目名称填"IgAN_RCT_BJ01" → 病种模块选 IgAN → 中心代码 BJ01

② 录基线(研究助理,每位患者做一次)——重点看第 4 列起
研究编号性别出生年 干预组别 ⭐ 随机号 ⭐ 随机化日期 ⭐ 基线 Scr基线 UPCR
00011978干预组R-00012024-03-01112 μmol/L1200 mg/g
00021985对照组R-00022024-03-0198 μmol/L950 mg/g
00031990干预组R-00032024-03-02125 μmol/L1450 mg/g
00041972对照组R-00042024-03-0287 μmol/L780 mg/g
00051968干预组R-00052024-03-03140 μmol/L1680 mg/g
…(共 120 行)
黄色列 = RCT 专属;白色列 = 和普通研究完全一样。
③ 每季度随访(录入方式与普通研究完全相同)
后台 → 患者列表 → 点击研究编号 → 复制随访链接发给患者/随访员 → 患者用链接填写:日期 / BP / Scr / UPCR。

④ 导出并分析
后台 → 一键生成论文包 → 解压 → 运行脚本。
导出的 patients_baseline.csv 中自动包含分组列:
patients_baseline.csv(节选,关键列)
patient_code,treatment_arm,randomization_id,randomization_date,baseline_scr,baseline_upcr
0001,干预组,R-0001,2024-03-01,112,1200
0002,对照组,R-0002,2024-03-01,98,950
0003,干预组,R-0003,2024-03-02,125,1450
0004,对照组,R-0004,2024-03-02,87,780
0005,干预组,R-0005,2024-03-03,140,1680
⑤ R 分析示例(按组比较基线特征)
按 treatment_arm 分组分析(R)
df <- read.csv("patients_baseline.csv")

# 查看各组人数(应接近 1:1)
table(df$treatment_arm)
#  对照组  干预组
#    60      60

# 两组基线 UPCR 比较(均值 ± SD)
by(df$baseline_upcr, df$treatment_arm, function(x)
   c(mean=mean(x,na.rm=T), sd=sd(x,na.rm=T)))

# t 检验
t.test(baseline_upcr ~ treatment_arm, data=df)
⑥ Methods 部分参考写法(投稿用)
"Eligible patients were randomly assigned 1:1 to intervention or control using a computer-generated randomization list (randomization_id recorded at enrollment). The primary endpoint was a ≥50% reduction in UPCR at 12 months. All visit data were prospectively recorded in KidneySphere AI (data snapshot archived prior to analysis; Snapshot ID: [填入快照编号])."
注意:本系统适用于研究者发起课题(IIT)和真实世界干预性研究;不适合作为药厂注册临床试验(GCP 稽查路径)的主系统。见下方 FAQ

你属于哪类角色?(点一下只看你需要的)

录入者:3 分钟上手

你只需要记住两句话
  1. 每次随访至少录 4 项:日期 / BP / Scr / UPCR
  2. 不要录入 PII,只用研究编号 patient_code
最短步骤
  1. 打开中心给你的随访链接(token)
  2. 填:日期、血压、Scr、UPCR
  3. 确认无误后提交
录入常见坑(看一眼就避雷)
  • Excel 显示 ######:列宽不足,不是坏数据
  • Scr/UPCR 数值怪:优先怀疑单位/小数点
  • 同一天多条随访:尽量避免,会影响趋势/结局计算

统计者:科研统计 & 论文 Starter Kit(交互教程)

目标:让科研小白“点一下按钮就能写论文”。按步骤推进:生成论文包 → 本地运行 → 看 QC → 补数据 → 复现输出
Step 0 · 准备环境(只做一次)

你只需要一台电脑 + Python 3.10+。科研小白推荐安装 Anaconda

检查 Python 是否可用
python --version
pip --version
如果提示“python 不是内部命令”,怎么办?
  • Windows:重新安装 Python(勾选 Add Python to PATH)或安装 Anaconda。
  • Mac:建议安装 python.org 或 Homebrew 版本。
Step 1 · 在后台一键生成论文包(zip)

后台 /staff 打开项目后点击:「一键生成论文包(zip)」。 系统会打包:去标识化 CSV 长表 + Starter Kit(脚本与模板)。

Step 2 · 解压与目录核对

解压 zip 后,确认包含 analysis/data/analysis/run_analysis.py

目录应类似这样
paper_pack_xxx/
  analysis/
    data/
      patients_baseline.csv
      visits_long.csv
      labs_long.csv
      meds_long.csv
      variants_long.csv
    run_analysis.py
    outputs/
  manuscript/
    METHODS_AUTO_EN.md
Step 3 · 安装依赖(第一次才需要)
安装依赖
pip install -r analysis/requirements.txt
Step 4 · 一键运行(生成 Table1/QC/图/12m结局/Methods)
运行脚本
python analysis/run_analysis.py
Step 5 · 先看 QC,再补数据,再跑一遍

顶刊级研究最重要的是:数据干净、口径统一、可复现。请优先打开 analysis/outputs/qc_report.xlsx

Step 6 · 把输出放进论文
输出用于论文备注
table1_baseline.xlsxTable 1基线特征表
qc_report.xlsx质量控制缺失/异常/重复/中心汇总
plot_*.pngFigure趋势图
outcomes_12m.csvResults12 个月结局
METHODS_AUTO_EN.mdMethods 草稿PI 最终审阅

PI/管理员:多中心治理要点(务实)

合并键
center_code + patient_code(必须全局唯一)
去标识化
系统不存身份信息;各中心本地受控保存映射表
口径统一
最少四项(日期/BP/Scr/UPCR)+ 单位一致性
试用到期
到期后只读,避免边分析边改数据,保证可复现
IgAN 病理
支持 Oxford MEST‑C(常用于分层/预测/敏感性分析)
基因
支持 variants_long(如有:ACMG、zygosity、HGVS 等)
RCT 随机化
基线可录入干预组别 / 随机号 / 随机化日期;导出 CSV 含 treatment_arm 分组列,可直接用于组间比较分析

常见问题(FAQ)

Excel 打开 CSV 显示乱码怎么办?
建议使用 Excel「数据 → 从文本/CSV」导入并选择编码 UTF‑8。系统导出的 CSV 已带 UTF‑8 BOM,直接打开通常不会乱码。
Excel 里日期显示 ###### 是数据坏了吗?
不是。通常是列宽不足。双击列边界自动适配即可显示日期。
脚本运行报错:ModuleNotFoundError
说明依赖没装好。执行:pip install -r analysis/requirements.txt
同一患者同一天多条随访怎么办?
通常视为重复记录。建议保留一条(或合并),否则趋势/结局会受影响。
为什么强调不录入 PII?
为了合规与多中心协作。系统用研究编号即可完成随访与分析;身份映射表由各中心本地受控保存。
RCT 研究怎么录入随机化信息?导出后如何按组分析?
录入:后台 → 创建患者基线 → 在底部"RCT 随机化信息"框中填写三项:
· 干预组别:选"干预组"或"对照组"(也可手动输入自定义文字)
· 随机号:如 R-0001(与纸质盲底对应)
· 随机化日期:随机化当天日期

导出:后台 → 导出基线数据 → CSV 中即含 treatment_armrandomization_idrandomization_date 三列。

分析(R 示例):
df <- read.csv("patients_baseline.csv")
table(df$treatment_arm) # 查看各组人数
by(df$baseline_upcr, df$treatment_arm, summary) # 组间基线比较

观察性研究的患者三个字段留空即可,不影响任何现有功能
这套系统可以直接用于药厂 1/2/3 期注册临床试验吗?
不建议直接作为注册试验主系统(eCRF/EDC)。当前系统定位是科研随访与论文产出加速工具,适合观察性研究、真实世界研究(RWS)或研究者发起课题(IIT)的数据整理与分析。
若用于药厂 I/II/III 期注册路径,通常还需满足 GCP 稽查追踪、21 CFR Part 11 / 电子签名、完整审计追踪、受控变更、冻结锁库、角色分离、医学编码(MedDRA/WHODrug)、SDTM/ADaM 规范输出等要求。
最后更新:2026-02-21。可直接分享链接作为中心培训:/guide#trial/guide#research