新人工智能模型可精确预测人体细胞基因表达

2025-01-12 16:53来源: 新华网

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  新华社纽约1月11日电 美国研究人员开发出一个新的人工智能模型,经过大量数据的训练后,该模型能精确预测各种人体细胞内部的基因表达情况,将为生物和医学研究带来便利。

  这个名为“通用表达转换器”(GET)的模型由美国哥伦比亚大学和卡内基-梅隆大学等机构研究人员联合开发,其准确性和有效性已得到实验验证,论文发表在新一期英国《自然》杂志上。

  在基因表达过程中,以DNA形式储存的基因“蓝图”转录成为RNA形式的“抄本”,后者指导合成出蛋白质,执行具体的生理功能。参与转录调控的生物分子种类繁多,相互作用极为复杂,此前相关预测模型局限于几种特定的细胞,尤其是癌细胞,缺乏适用于人体多种细胞类型的通用工具。

  研究人员根据转录调控机制的特点设计出机器学习模型,然后用来自1.3万个人体细胞的基因测序和表达数据对其进行训练。这些细胞涵盖213种人类胚胎细胞和成体细胞,都来自没有病变的正常人体组织。

  就像ChatGPT等人工智能工具能根据大量语料总结出通用语法规则,GET模型也能从训练数据中总结出关于转录调控的“语法”,在此基础上能对其没有接触过的细胞类型进行基因表达预测。

  该模型可用于揭示致病基因的作用机制,指导癌症和遗传疾病研究。例如某种儿童白血病的患者携带一个功能不明的变异基因,GET模型预测该基因会扰乱细胞中两种转录因子的相互作用,实验数据证实了这一结论。

  研究人员说,该模型还可用于探寻基因组中“暗物质”的作用。蛋白质编码基因序列只占人类基因组的一小部分,占比达98%的非编码区域就像宇宙中的暗物质一样,其属性和功能目前难以捉摸。

[责任编辑:王焕君]
阅读剩余全文(
为你推荐
7月11日,在位于江西省上饶市横峰县的一处物流转运中心,工人分拣快递。江西省上饶市横峰县地处赣东北,是“四省通衢”之地,沪昆高速、320国道穿境而过,区位优势明显。江西省上饶市横峰县地处赣东北,是“四省通衢”之地,沪昆高速、320国道穿境而过,区位优势明显。
13
7月12日,演员在内蒙古呼伦贝尔市额尔古纳市蒙兀室韦苏木奥洛契庄园的油菜花海中表演节目。
13
7月12日,在山东省临沂市郯城县郯城街道一家舞蹈培训机构,孩子们在练习舞蹈动作  暑假期间,孩子们通过参加形式多样的活动,丰富暑期生活,畅享快乐时光。暑假期间,孩子们通过参加形式多样的活动,丰富暑期生活,畅享快乐时光。
13
当地时间2025年7月11日,在法国巴黎召开的联合国教科文组织第47届世界遗产大会通过决议,将“西夏陵”列入《世界遗产名录》。至此,中国世界遗产总数达到60项。
12
10日中午12时40分,该基地剖腹诞生了第一头克隆牦牛,体重33.5公斤。这头新出生的克隆牛犊个头比正常新生牛犊较大,全身通黑,能够正常行走,目前身体状况良好。
12
入夏以来,湖北省恩施土家族苗族自治州旅游市场持续火热。新华社记者 伍志尊 摄  7月8日,游客在恩施土家女儿城景区体验民族服饰。
12
位于湖北省恩施土家族苗族自治州的宣恩县城是一座“景城一体·主客共享”的国家4A级景区,穿城而过的贡水河两岸夜景远近闻名。位于湖北省恩施土家族苗族自治州的宣恩县城是一座“景城一体·主客共享”的国家4A级景区,穿城而过的贡水河两岸夜景远近闻名。
11
青岛老龙湾海域,船艇列队参加海上巡游活动(7月10日摄,无人机照片)。新华社记者 李紫恒 摄  青岛小麦岛附近海域,市民和游客乘坐帆船参加海上巡游活动(7月10日摄,无人机照片)。
11
近日,沈阳迎来持续高温天气。新华社记者 李钢 摄  7月10日,在沈阳中街,游人从冷饮宣传海报前经过。近日,沈阳迎来持续高温天气。新华社记者 李钢 摄
11
7月9日,在北京航天城,神舟十九号航天员蔡旭哲(中)、宋令东(右)、王浩泽在记者见面会上敬礼致意。新华社记者 厉彦辰 摄  作为我国首位执行出舱任务的“90后”航天员,宋令东感慨:“打开舱门那一刻,就是圆梦时刻。
10
载入更多资讯
返回
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮