据科技日报报道,23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型支持多达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。
人类基因组由30亿对碱基组成。“人类基因组计划”破译了序列,但序列上碱基的具体功能仍需要精准识别和解析。
现有模型大多基于1—2个参考基因组开展训练,难以体现人类遗传资源的多样性。而Genos整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助更全面理解人类遗传多样性。
据悉,Genos模型已在HuggingFace、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
2023年微软商城最佳应用榜单出炉:火狐浏览器F
,微软在今天召开的Build2023开发者大会上,公布了年度Mi...
TrendForce集邦:预估2023年折叠屏手
报告称,折叠手机渗透率上升速度较缓慢主要是碍于高昂售价,目前来看...
梅观高速项目部荣获“青年文明号”称号
近日,共青团中国二十冶集团有限公司委员会对2022年度青年文明号...
“交个朋友”将入驻京东直播,5月31日罗永浩首秀
曲线上市的交个朋友近来动作频频。有消息称,今年618开始,“交个...
中国5G用户数达6.34亿户5G基站总数达273
工信部称,1-4月份,中国信息通信行业整体运行平稳。电信业务收入...
齐商银行出口信用保险融资助力优质企业高质量发展
为深入贯彻党中央、国务院推动外贸企业稳规模优结构的决策部署,落实...