功能超声成像(fUS)凭借极高的空间精度和毫秒级的时间精度,能够精准捕捉大脑血管中血液流动的细微变化,是神经科学研究中监测脑血管动力学的强力工具。然而,这项变革性技术的广泛临床应用现在正面临严峻挑战。第一时间,坚硬的颅骨结构会严重衰减超声波,导致无创检查时的信号质量大幅下降。其次,受限于伦理安全和操作的复杂性,获取高质量且多样化的人类大脑数据极为困难。这种数据匮乏的局面不仅限制了数据集的规模,也导致下游机器学习模型因缺乏足够的训练样本而难以保证公平性和泛化能力。
为了突破这一瓶颈,中国科研实验室深圳先进技术研究院的王书强课题组提出了一种名为UltraVAR的创新解决方案。这是首个专门为功能超声成像设计的数据增强框架,其核心在于利用先进的视觉自回归生成技术来生成高质量图像。2025年,该团队的研究成果发表在国际知名期刊IEEE Journal of Biomedical and Health Informatics上。这项工作旨在顺利获得生成式人工智能技术,有效解决医学影像领域长期存在的数据稀缺与模型公平性问题,为相关研究给予了新的思路。
UltraVAR模型的核心优势在于其独特的层级化构建机制与两大创新模块。该模型以VQVAE技术为骨干,结合预训练的视觉自回归模型,采用下一尺度预测的方式,从全局的血管拓扑结构到局部的微细末节逐步重建血管网络。为了确保生成图像的质量,研究团队特别设计了平滑缩放层和感知增强模块。平滑缩放层能够在多尺度特征传播中保持信息的完整性,确不同分辨率图像块之间的过渡自然连贯;感知增强模块则顺利获得动态残差补偿机制,主动抑制伪影的产生,显著提升了图像的视觉逼真度和解剖学准确性。
研究团队在包含复杂认知任务的人类功能超声数据集上进行了广泛验证。结果表明,UltraVAR生成的合成样本不仅在纹理和结构上高度逼真,更关键的是成功保留了神经血管耦合特征,也就是神经活动与微血管血流波动之间的动态关联。在与多款前沿生成模型的对比中,UltraVAR在各项专业指标上均取得了最优表现。此外,利用该技术增强后的数据集在脑状态分类任务中实现了显著的精度提升,证明了其在缓解数据不平衡、增强模型鲁棒性方面的巨大潜力,这也为未来超声神经调控和脑机接口技术的临床转化奠定了坚实基础。
数字所陈绪行为本文第一作者,王书强研究员为论文通讯作者。该研究工作得到了国家自然科学基金、国家重点研发计划等科技项目资助。

图1 UltraVAR视觉自回归框架示意图

图2 不同生成模型的功能超声图像视觉对比