专长:利用人工智能和基因组学加速药物发现。
Engine Biosciences 将人工智能与基因组学相结合,以发现基因相互作用和新型药物靶点。他们的研发管线涵盖肿瘤学和传染病领域的候选药物,展现了人工智能驱动的洞察力在药物发现领域的强大力量。

相关推荐

Deep Genomics

Deep Genomics

<p>专长:RNA 疗法的基因洞察。<br>Deep Genomics 利用人工智能解码基因组数据,并识别 RNA 疗法的靶点。其专有平台 SPIDEX 已为罕见遗传疾病的治疗开发出有前景的候选药物。Deep Genomics 在利用人工智能设计下一代 RNA 药物方面处于领先地位。</p> <p>2015年,Brendan Frey与Hannes Bretschneider等人成立了Deep Genomics。公司有20多名拥有高等学位的团队成员,包括科学、工程、医药和商业领域的专家。</p> <p>该团队在自然、科学、细胞和自然生物技术领域发表了十多篇论文,获得了众多的科学和创新奖,并积累了超过50年的经验,建立了精确结合了基因组生物学的人工智能系统。</p> <p>这个由机器学习专家、基因组学专家和医疗专家组成的团队有着强大的技术支撑,公司在建立伊始就被《科学美国人》、《华盛顿邮报》等知名媒体报道,比作“将深度学习的能量带到基因组学的创业公司”。</p> <p>目前,这家公司已经与医院、生物科技创业公司以及制药公司展开合作,使用基因疾病患者的基因数据测试公司系统。</p> <p>基因组学遇上深度学习</p> <div class="hidden-content"> <p>要推进基因组学,就需要了解基因表达是如何被基因变体所改变。尤其是那些在蛋白质编码区之外的基因,DNA剪接是其表达的关键步骤,它的破坏会导致某些疾病产生,如癌症和神经系统疾病。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/19/1747678286_vV4anFec4D.jpeg"></p> <p>Deep Genomics开发的一种计算机深度学习技术可以计算出遗传变异对DNA拼接的影响。该技术的思路是建立一个数学模型,导入健康人的全基因组序列和RNA序列,对模型进行训练,让它学到健康人的DNA剪切模式,并用分子生物学方法检验模型,加以校正。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747678286_Kbdkv5mKZs.jpeg"></p> <p>“深度学习”揭示了疾病的遗传根源</p> <p>该模型能够准确地对疾病的变异进行分类,并提供异常剪接对疾病影响的见解。</p> <p>除此之外还可将其用于研究多种疾病,如:结肠直肠癌(Colorectal Cancer)和脊髓性肌肉萎缩(spinal muscular atrophy)自闭症(Autism Spectrum Disorder),并确定常见、罕见甚至自发变异的结果。</p> <p>从技术走向产品</p> <p>Frey领导的研究小组开发的第一个深度学习方法,是用于确定疾病的遗传决定因素。他解决的痛点是,人群中的DNA突变(SNVs)数以亿计,其中突变频率大于1%的SNVs也有300万个左右,要挨个调查SNVs与各种疾病的关联难如登天。</p> <p>在前面所述建立数学模型这一思路下,Deep Genomics推出了他们的第一款产品SPIDEX。只需将测序结果和细胞类型导入,SPIDEX便可分析出某一变异(基因组突变)对RNA剪切的影响,并计算出该变异与疾病之间的关系。</p> <p>SPIDEX产品设计思路是:</p> <p>建立计算模型</p> <p>使用“深度学习”算法来推导出一种计算模型,该模型以正常DNA序列作为输入,通过将健康人体组织中具有剪接水平的DNA与DNA片段相关联,来推断剪接的计算模型。</p> <p>假设有一个测试变量,它可能有多达300个核苷酸进入一个内含子,该模型可以用来计算变量的剪接有多少。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747678287_2SgoKEZn15.jpeg"></p> <p>建立计算模型</p> <p>使用模型检测破坏性遗传变体</p> <p>由广泛的疾病和技术引起的遗传变异,可以通过该计算模型被检测和过滤,从而对疾病的遗传进行探索。该模型预测了由于内含子和外显子的变异而导致的大量异常剪接,为理解疾病的遗传决定因素提供了新机会。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/aisite/tinymce/2025/05/20/1747678287_q3hEH7yApG.jpeg"></p> <p>使用模型检测破坏性遗传变体</p> <p>SPIDEX可以将无害的突变与有害的突变区分开来,并帮助科研人员理解它们与其他基因过程的关系。</p> <p>2016年,Deep Genomics为弄明白突变会如何改变细胞,进而给人体造成的影响,用SPIDEX预测了3.28亿个SNVs。不过,预测只是做了初步筛选,而有害突变与疾病的对应关系还尚未建立。</p> <p>如果Deep Genomics的深度学习分析变得足够精确,那么这项技术的贡献就显而易见:直接分析突变频率低的变异与疾病的关系;加速基因组学的研究和药物的开发。</p> <p>然而,目前Deep Genomics的SPIDEX技术只能分析SNVs引起的RNA剪切变异与疾病的关系,对于其他原因导致的疾病无能为力。</p> <p>但即便如此,人工智能在基因分析中的应用仍然值得期待,也许它会成为解码基因与疾病奥秘的一把金钥匙。</p> </div>

Ardigen

Ardigen

<p>专长:人工智能驱动的精准医疗。<br>Ardigen 结合生物信息学、人工智能和微生物组分析,开发用于免疫肿瘤学和基于微生物组的疗法的工具。其 ImmunoMind™ 平台可识别新抗原,从而提高癌症免疫疗法的疗效。Ardigen 的定制解决方案能够应对药物研发中的复杂挑战,尤其是在个性化医疗领域。</p>

PyDESeq2

PyDESeq2

PyDESeq2 是DESeq2方法的 python 实现, 用于对大量 RNA 序列数据进行差异表达分析 (DEA),最初用 R 语言编写。其目的是方便 python 用户进行 DEA 实验。

gget-查询基因组参考数据库

gget-查询基因组参考数据库

gget是一个免费的开源命令行工具和 Python 包,可以高效地查询基因组数据库。gget 由一组独立但可互操作的模块组成,每个模块旨在通过一行代码实现一种类型的数据库查询。

scanpy-Python 中的单细胞分析

scanpy-Python 中的单细胞分析

Scanpy 是一个可扩展的工具包,用于分析与anndata联合构建的单细胞基因表达数据。它包含预处理、可视化、聚类、轨迹推断和差异表达测试等功能。该工具包基于 Python 实现,可高效处理超过一百万个细胞的数据集。

Tangram

Tangram

Tangram 是一个基于scanpy的 Python 包,用PyTorch编写,用于将单细胞(或单核)基因表达数据映射到空间基因表达数据上。单细胞数据集和空间数据集应来自同一解剖区域/组织类型,理想情况下来自同一生物学重复,并且需要共享一组基因。Tangram 通过拟合共享基因的基因表达来在空间上对齐单细胞数据。

CellChat

CellChat

用于从单细胞和空间分辨转录组学推断、可视化和分析细胞间通讯的 R 工具包

spacexr--空间转录组学中的细胞类型识别和细胞类型特异性差异表达

spacexr--空间转录组学中的细胞类型识别和细胞类型特异性差异表达

Spatial-eXpression-R:细胞类型识别(包括细胞类型混合)和空间转录组学的细胞类型特异性差异表达

Stereopy--空间转录组分析工具包

Stereopy--空间转录组分析工具包

Stereopy是一款基础且全面的工具,用于基于空间转录组学数据(例如 Stereo-seq(空间增强分辨率组学测序)数据)进行数据挖掘和可视化。我们将在此添加更多分析工具,这些工具可能来自其他热门工具,也可能由我们自行开发,以满足多样化的需求。同时,我们仍在努力提升其性能和计算效率。

stLearn--空间转录组数据下游分析工具包

stLearn--空间转录组数据下游分析工具包

stLearn旨在全面分析空间转录组学 (ST) 数据,以研究未分离组织内的复杂生物学过程。ST 正在成为单细胞 RNA 测序的“下一代”,因为它为完整组织切片中细胞的转录谱添加了空间和形态背景。然而,现有的 ST 分析方法通常将捕获的空间和/或形态数据用作可视化工具,而不是将其用作模型开发的信息特征。我们开发了一种分析方法,该方法可利用所有三种数据类型:空间距离、组织形态和来自 ST 数据的基因表达测量 (SME)。这种组合方法使我们能够更准确地模拟潜在的组织生物学,并允许研究人员解决三个主要研究领域的关键问题:细胞类型识别、空间轨迹重建以及未分离组织样本内细胞间相互作用的研究。

Cell2location--单细胞和空间转录组学

Cell2location--单细胞和空间转录组学

通过整合单细胞和空间转录组学(细胞2位置模型)全面绘制组织细胞结构图

SPATA2--空间转录组学分析工具箱

SPATA2--空间转录组学分析工具箱

SPATA2 ,一个全面的空间转录组学分析工具箱

Baysor--空间转录组学数据的贝叶斯分割

Baysor--空间转录组学数据的贝叶斯分割

Baysor 是一款用于对基于成像的空间转录组学数据进行细胞分割的工具。它根据细胞的转录组成、大小和形状的可能性来优化分割。该方法可以考虑细胞核或细胞质染色,也可以仅基于检测到的分子进行分割。

SPOTlight

SPOTlight

SPOTlight提供了一个工具,可以从单细胞参考中对细胞混合物进行反卷积。该工具最初是为 10X 的 Visium(空间转录组学)技术开发的,可用于所有输出细胞混合物的技术。它与 Bioconductor 的Single Cell Experiment和Spatial Experiment类以及密集和稀疏矩阵兼容。此外,该软件包还提供可视化工具来评估反卷积的结果。简而言之,SPOTlight它基于通过 NMFreg 模型为每种细胞类型找到主题配置文件签名,然后优化细胞类型比例以拟合我们想要反卷积的混合物。

Spateo

Spateo

Spateo(https://github.com/aristoteleo/spateo-release),这是一个3D时空建模框架,并将其应用于E9.5和E11.5的3D小鼠胚胎发生图谱,捕获了800万个细胞。Spateo支持可扩展、部分、非刚性对齐、多层细化和网格校正,以创建整个胚胎的分子全息图。它引入了数字化方法,揭示了从亚细胞到整个器官的多层次生物学,识别了新兴3D结构(例如,中脑-后脑边界(MHB)等次级组织者)沿正交轴的表达梯度。Spateo进一步联合模拟细胞间和细胞内相互作用,以解剖3D结构中的信号传导图谱,包括丘脑内界带(ZLI)。最后,Spateo 引入了细胞迁移的“形态矢量场”,并整合了空间微分几何,揭示了小鼠心脏器官发生不对称等现象背后的分子程序,将宏观变化与分子动力学联系起来。因此,Spateo 能够在分子水平上研究三维空间中器官生态学随时间的变化。

cellxgene

cellxgene

CZ CELLxGENE Annotate(发音为“cell-by-gene”)是一款用于单细胞数据集(例如来自人类细胞图谱 (Human Cell Atlas)的数据集)的交互式数据探索器。我们利用现代 Web 开发技术,快速可视化至少 100 万个细胞,希望能够帮助生物学家和计算研究人员探索他们的数据。

multimodal-cancer-origin-prediction多模态癌症起源预测

multimodal-cancer-origin-prediction多模态癌症起源预测

基于深度学习的组织学和基因组学多模态整合,以改善癌症起源预测

PathomicFusion

PathomicFusion

组织病理学图像可以使用 CNN 或 GCN 进行处理,以提高参数效率,也可以两者结合使用。该设置适用于将多种组学模式与组织病理学整合,并可用于改进诊断、预后和治疗反应的评估。