欢迎来到北京大学健康医疗大数据国家研究院

设为首页 | 加入收藏
杜建团队Nature Biotechnology发表全球生物医学技术转化全景图谱
时间:2026-01-27 14:17:53来源: 点击数:

从实验室到临床应用,一项生物医学突破究竟如何“走出论文、走进发明”?过去我们常用专利来回顾技术演进,但如果从科学论文出发,能否系统回答:哪些基础研究更可能产生技术影响?哪些疾病领域与哪些关键技术“强耦合”?

2026年1月,北京大学健康医疗大数据国家研究院杜建团队在 Nature Biotechnology发表研究论文“Mapping the science-technology translational landscape in biomedicine”,以论文-专利引用为“可计算的转化链路”,系统绘制了全球生物医学“科学-技术”转化全景图谱。



当前的生物医学知识图谱多以科学文献报道的实验结果为数据源,往往忽略一个关键维度:这些知识是否、以及何时被技术体系吸收并转化为可应用的发明。论文指出,专利对期刊论文的引用,为刻画“科学影响技术”的路径提供了直接证据,也为开展大规模、可计算的前瞻性转化分析提供了数据集。
研究团队整合了2012–2021年生物医学领域10万余篇高被引论文(按同年份同学科引用次数排名前1%)及其关联的10万量级施引专利,构建跨越“科学空间(论文)—技术空间(专利)”的关联网络,并在全球、国家、学科、疾病/技术实体等多个层次展开系统分析。
研究显示,全球范围内有27.52%的高被引论文会被专利引用,显著高于一般生物医学论文(Medline收录)平均约4%的水平。这意味着:高影响力基础研究不仅“被同行看到”,也更可能“被技术体系吸收”,在创新链条中发挥更强的源头驱动作用。研究比较了中美在生物医学“科学—技术”转化中的结构差异:在高被引论文占比相近的背景下,美国高被引论文被专利吸收的规模与强度显著更高(79,718件独立专利、平均每篇24.53次),而中国为21,027件独立专利、平均每篇3.76次;此外,引用高被引论文的发明人中,美国占比过半,中国占3.95%。这些结果提示,在将前沿科学系统性嵌入技术开发、形成持续创新能力方面仍有提升空间。
研究基于医学主题词(MeSH)术语体系,利用自然语言处理技术从论文与专利中抽取疾病实体与技术实体,构建“疾病—技术”交互网络,用于区分“通用技术”与“疾病特异技术”。在按过去十年出现频率与重要性、并遵循纳入/排除标准人工筛选的44项核心技术中发现:近半数技术与10个以上疾病领域相关,其中基因编辑、细胞与组织疗法、体外技术等与20个以上疾病类别高度关联,显示出强平台属性与跨领域扩散能力。
图谱同时清晰刻画了当前最活跃的转化耦合链路,例如:肿瘤—细胞与组织疗法(CAR-T、干细胞等)关联最强;肿瘤—液体活检/外显子测序/基因编辑等呈现高强度耦合;神经系统疾病—基因编辑、消化系统疾病—粪菌移植、心血管疾病—经导管主动脉瓣置换、内分泌系统疾病—血糖控制技术等构成紧密转化路径。这些结果为“转化热点在哪里、通用平台技术是什么、疾病领域的关键技术是什么”提供了可视化、可计算的证据基础。
此外,研究突破了对“创新路径”的传统线性认知。通过分析MeSH术语的“入库时间(date of entry)”,研究发现:专利文本中出现的技术术语整体更“新”,不少前沿技术往往先出现于专利体系,随后才进入科学论文体系。这揭示了科学与技术之间可能存在更强的双向促进与协同演进,而非传统认知中的单向线性“论文→专利”。
该成果为生物医学创新研究提供了可复用的数据框架与系统分析工具。
图1:本文采用的论文-专利引用数据和自然语言处理技术
    图2:技术-疾病交互图谱(部分)
    北京大学健康医疗大数据国家研究院杜建为本文通讯作者,博士后赵文静为本文第一作者(目前已就职于华中科技大学医药卫生管理学院)。该研究得到了科技部国家重点研发计划青年科学家项目、国家自然科学基金等项目支持。



    原文链接




     



    北京大学健康医疗大数据国家研究院版权所有 2019-2020