复旦大学联合上智院发布三项科学数据新基建
创始人
2025-05-01 06:00:47
0

在数据要素价值加速释放的背景下,科学数据的开放共享与协作正成为破解科研难题、推动产业升级的核心引擎。4月29日,第八届数字中国建设峰会科学数据合作分论坛在福州数字中国会展中心举行。会上,复旦大学人工智能创新与产业研究院副院长、上智院院长助理程远作为代表发布了三项科学数据基础设施——生命流体数据集、催化化学反应活性数据集及科学数据标注平台。

血流动力学研究是生物医学领域的重要组成部分,它帮助科学家深入理解生物体内的运动规律,有助于理解心血管系统的功能和疾病机制。通过分析血液在血管中的流动特性及其与血管内壁的相互作用,研究人员能够识别出血压、血管直径、血液粘度等影响血流的因素,这对高血压、心力衰竭、颅内动脉瘤等心脑血管疾病的预防和治疗至关重要。其中,颅内动脉瘤是一类脑部血管畸变,通常无症状,但是一旦破裂却可能导致严重的蛛网膜下腔出血(SAH)。尽管临床实践通常基于动脉瘤的个体因素和形态特征,但其病理生理和血流动力学机制仍存在争议。

生命流体数据集Aneumo基于466个真实颅内动脉瘤的几何形状开发,通过切除和变形操作生成超10000个合成几何形状(含 466 个无动脉瘤几何和 9534 个变形动脉瘤几何),涵盖流速、压力、壁面切应力等关键参数,为研究动脉瘤的发病机制和临床预测提供了宝贵资源。

该数据集将为颅内动脉瘤破裂风险预测提供多场景模拟支持,还可基于血流动力学原理助力优化血管支架、人工血管等医疗设备的设计流程。这将有助于加深对颅内动脉瘤病理特征和血流动力学机制的理解,并支持相关领域的深入研究,加速心脑血管疾病诊疗方案的临床转化。

催化化学反应活性数据集聚焦于解决化学研发中的关键挑战。化学文献中反应数据的记录方式存在显著差异,特别是产率计算标准、催化剂命名规则等关键信息往往缺乏统一规范。通过开发专用的化学信息提取算法与人工校验流程,团队实现了对海量非结构化数据的标准化重构,基于该数据集训练的催化反应预训练模型在Buchwald-Hartwig、Suzuki-Miyaura等关键交叉偶联反应上能实现反应活性的精准预测,预测误差低于10%。

该数据集在微观层面完整记录了反应底物、催化剂、溶剂、添加剂等关键组分,在宏观层面系统整合了制药、化工催化及电池研发等领域的近30类反应类型,包括经典的偶联反应、环加成反应以及前沿的碳氢键活化反应等。数据集提供了超过100万条经过严格校验的反应记录,并建立了从实验室小试到工业化放大的标准化数据桥梁。

会上发布的另一项科学数据成果——科学数据标注平台,则旨在通过人工智能与专业标注工具的结合,提升科研数据处理效率,加速科学发现进程。平台打造了端到端智能文献提取方案,实现自动化采集,加工,标注和落库的一站式自动化方案,大幅度提高质量数据集加工效率。

该平台将提供化学分子式标注、文献表格提取及2D/3D医疗影像标注等多模态工具,通过AI辅助标注功能大幅缩短标注周期、降低专业门槛,并构建安全可信可审计的数据标注环境。平台配备50人以上专业化标注团队,以低培训门槛和高效率服务支持科研需求。

原标题:复旦大学联合上智院发布三项科学数据新基建

相关内容

热门资讯

年内融资30亿,千寻智能为何能... 来源:环球老虎财经app 千寻智能宣布再获10亿元融资,这是其2026年的第二笔融资,此轮由顺为资本...
为何在阿尔忒弥斯二号照片中看不... 为什么在阿尔忒弥斯二号的照片中看不到太空垃圾 在相机上看到太空垃圾的概率极低,尽管太空中存在大量太...
私人订制,3分钟出锅!怀柔来了... 近日,一台智能煎饼机器人亮相怀柔京北大世界物美超市。无需人工操作,扫码就能私人订制口味,连煎饼薄厚、...
宏明电子:公司MLCC产品尚未... 有投资者向宏明电子(301682.SZ)提问,公司产品能不能应用在机器人及机器人相关产业上? 4月7...
Rubber Duck功能缩小... IT之家 4 月 8 日消息,微软 GitHub 官方于 4 月 6 日发布博文,宣布为其 Copi...
荣耀多款新品PC定档,方飞透露... IT之家 4 月 7 日消息,荣耀终端股份有限公司产品线总裁方飞今日发文,谈及荣耀 WIN游戏本即将...
中移动金融科技申请数据交换方法... 国家知识产权局信息显示,中移动金融科技有限公司、中国移动通信集团有限公司申请一项名为“一种数据交换方...
第一批用AI的人,已经染上了A... 文 | 硅基研究室,作者 | kiki 不知道你有没有发现,很多人得了AI疲惫症。 从科技巨头们宏...
原创 带... 文|唐辰 图|央视新闻截图 董宇辉的“品控”难题,俞敏洪能不能解? 近段时间,央视掀了网红保健品品牌...
原创 美... 今年有一份全球创业生态排名悄悄在网上流传,美国拿了254分,中国只有26.9分,分差将近十倍。发布这...