欧盟MDR临床评价里的 State of the Art（SOTA）实践指南

2026年01月03日

10 min read

今天我们来一起聊一聊欧盟临床评价的 “重灾区--SOTA”，希望可以给同行带来一些思考，少走弯路：

写在前面：很多团队一提到 SOTA，就会出现两种“模糊写法”：要么像教科书一样堆概念、堆指南；要么像文献综述一样把检索到的文章全抄进来。

但审核员真正想看的，其实更具体：你有没有把“现在业内普遍认可的治疗/诊疗水平”和“你这个器械的定位与风险”连接起来？你是不是基于证据做了取舍？你写出来的东西，能不能支撑后面每一个临床评价结论？

这篇文章的目标很明确：用更少的术语、更接近实操的语言，把 MDR + MDCG 2020-13 Section C 里对 SOTA 的期待拆开讲透，并提供你可以直接套用的目录、段落写法和自检清单。

一、先把“审评语境”说清楚：SOTA 到底是什么？

我们在项目里常把 SOTA 当成“临床评价的地基”。地基没打好，后面的等同性、临床证据充分性、风险-收益都会变得摇摇晃晃。

在 MDR 语境下，SOTA 不是一句口号，也不是一堆参考文献。它更像一张“行业共识地图”，回答三类问题：

疾病/适应症的现状：患者人群、诊疗路径、临床需求未满足点。
现有可选方案的水平：药物、手术、非手术治疗、同类器械/替代器械的疗效与安全性“通常能做到什么程度”。
评价标尺：关键临床终点 (safety and performance endpoint/parameters and Acceptance Criteria)、并发症/不良事件、可接受的阈值、随访时长、亚组差异、与标准治疗比较的合理方式。

换句话说：SOTA 是你为“这台器械应当如何被评价”设定的合理标尺，明确器械的“临床问题句”，用一句话写清楚：谁（人群）在什么场景下，用你的器械解决什么问题，替代/补充什么方案。

二、审核员在 SOTA 里最容易“卡你”的点

我们帮企业处理过不少关于SOTA的发补- NB 审评问答，SOTA 被挑战的方式虽然各有不同，但是主要逻辑“万变不离其宗”，还是会围绕MDR和MDCG的法规边界要求，不够不同审核员问的深度可能有所不同，总结部分如下：

1. 选的“对照/替代方案”是不是业内公认？有没有遗漏更常用、更先进或更相关的选择？

2. 描述的疗效/安全性水平有没有数据支撑？数据来源是否可靠、是否适用于你的目标人群？

3. 基于 SOTA 得出的“临床预期”是否合理？后文的临床证据是否足以达到这个预期？

4. 有没有讨论similar device相关的情况？

5. 临床评估似乎并非以方法学上合理、全面且客观的方式进行，未考虑到公认的现有技术水平

6. 关于现有技术水平的文献综述方法似乎并不恰当，无法实现系统性、全面且客观且可追溯的方式进行

7. 考虑到现有技术水平，评估中的器械其获益 - 风险比的可接受性标准未在临床文件中明确规定

8. 临床文档未包含具体且可衡量的safety and performance parameters/objectives，clinical Benefits, Clinical Risk, Benefits-Risk Ratio等未考虑到当前技术水平。

在项目经验里，SOTA 的常见“扣分项”总结如下：

· 只写“指南推荐”，但不写“推荐背后的证据等级/关键结局指标”。

· 只写“同类器械很多”，但不把主流产品、关键技术路线、差异点讲清楚。

· 把所有文献都放进来，结果读完仍然不知道“业内通常能做到多少”。

· 把“最理想数据”当作“普遍水平”，导致临床预期被抬得不合理。

· SOTA 与器械适用人群/使用场景脱节（例如把住院人群的证据拿来解释门诊人群）。

三、一个经得起审评的 SOTA，通常包含哪些内容？

3.1 适应症与目标人群

· 疾病定义、分期/分级、流行病学（用“量级”即可，不必堆数据）。

· 当前诊疗路径：患者从诊断到治疗的关键节点。

· 未满足的临床需求：哪些问题仍然没有被很好解决。

3.2 现行标准治疗与替代方案

· 药物/手术/保守治疗/其他器械：按“临床路径”顺序呈现。

· 每类方案的适用人群、主要获益、主要风险/局限。

·如果有地域差异（EU/US/本地），点明差异对评估的影响。

· 现行标准治疗与替代方案各自的优点和局限，各处于什么水平，为什么你想证明你的器械或者说你如何证明你的器械是满足当前的技术水平的，这个背后的法规的考量，实际是想评估你的器械，是落后于当前技术水平，还是超前于当前技术水平，还是可代表当前技术水平，以上关键考量的“目的”是考虑器械的“水平”给患者带来的Benefits and Risk/Ratio 究竟如何？？？

3.3 同类器械与技术路线

· 主流技术原理、关键性能/结构差异。

· 市场上代表性产品或类别（不必做“竞品报告”，但要让审评员知道你没有考虑全面）。

· 与本器械相关的关键风险点与失效模式（用于衔接后面的风险-收益）。

3.4 临床结局指标与可接受水平

· 关键有效性终点：临床上“最看重”的是什么（功能改善？生存？疼痛？影像？）。

· 关键安全性终点：并发症/不良事件的类型、严重度、发生时间窗。

· 随访时长与复发/再干预：行业通常随访多久、为什么。

· 亚组与边界条件：哪些人群效果会不同、哪些情况下风险更高。

3.5 基于 SOTA 的“临床预期”与评价策略

· 把“普遍水平”转化为可检验的预期（例如：主要终点达到××范围；严重并发症低于××范围）。

· 说明为何选择这些对照/基准：指南、系统综述、真实世界数据或注册数据等。

· 为后续临床证据策略搭梯子：等同性、文献临床数据、PMCF/临床试验等。

3.6 证据来源与检索方法（简明但透明）

· 检索范围、时间窗、数据库、纳入/排除逻辑（读者能复现即可）。

· 证据分层：指南/HTA、系统综述、关键 RCT、注册研究、真实世界数据。

· 关键数据的选取原则：证据等级/权重、代表性、外推性、最新性。

四、“证据来源”怎么选才恰到好处

很多团队担心：SOTA 的来源到底写到多细？我们的建议是：把“可复现”放在第一位，把“面面俱到”放在第二位。

通常按下面的优先级来，会比较稳：

· 临床实践指南/共识（EU 或你主要市场相关）：用于确定标准治疗、终点与路径。

· HTA/系统综述/Meta：用于提炼“普遍水平”的区间与异质性。

· 关键 RCT/注册研究：用于补充细节，尤其是安全性时间窗、亚组差异。

· 真实世界数据/注册库（如有）：用于验证“普遍水平”在现实中的表现。

· 标准/规范（如 ISO、专科协会推荐）：用于补充风险、性能与使用条件。

写作技巧上，我们更推荐“少而精，精而准”：把最能支撑你结论的证据作为核心引用，其余作为补充。这样审评员读起来更快，也更容易追溯。

五、审评员会喜欢的“段落写法”

下面这段不是模板化口号，而是一个“可审评的叙述结构”。你可以替换方括号内容。

在[适应症/人群]中：
当前临床实践通常遵循[诊疗路径概述]：
一线/标准治疗主要包括[方案A/B/C]：
其核心获益体现在[关键有效性终点]：
在[随访时长]内通常可达到[范围/量级]：
主要风险集中在[关键并发症]，多发生于[时间窗]，发生率通常处于[范围]：
对于[特定亚组/边界条件]，由于[原因]，疗效/风险表现可能不同，因此在临床评价中需要特别关注[终点/随访/风险控制]：

基于上述业内普遍水平，我们将本器械的临床预期定义为[可检验的预期]，并选择[对照/基准]作为评价标尺。这一设定将用于支撑后续的[等同性/文献评价/PMCF/临床试验]策略。

六、NB 审评常见缺陷清单（交付前checklist）

□ SOTA 是否覆盖了所有主要替代方案？是否解释了为什么某些方案不作为主要对照？

□ 终点是否与指南/临床实践一致？是否存在“选了不常用终点”的风险？

□ “普遍水平”是否用范围/条件表达，而不是单点最优值？

□ 证据是否适用于你的目标人群与使用场景？是否存在外推风险？

□ 是否识别并呈现了关键安全性风险的时间窗与严重度？

□ SOTA 是否清晰导出了临床预期，并与后文证据策略闭环？

□ 检索与证据选取是否透明、可复现？是否说明时间窗与纳入逻辑？

□ 全文是否保持一致：人群、适应症、对照、终点、随访时长不打架？

Reference

[1] Regulation (EU) 2017/745 on medical devices (MDR)

[2] MDCG 2020-13: Clinical Evaluation Assessment Report (CEAR) template

[3] MEDDEV 2.7/1 rev. 4: Clinical Evaluation – A guide for manufacturers and notified bodies

返回文章列表