当整个世界仍然席卷于ChatGPT令人震惊的生成式技术浪潮时,我们更多地关注政治、文学、经济这些置身于舆论中心的领域,例如马斯克与奥特曼的开源之战。与此同时,一些危言耸听的AI末世论也悄悄抬头,伴携着尚未出世的AGI传播焦虑与恐慌。
就在人们对AI强大的生成能力各执一词时,一家来自阿姆斯特丹的人工智能初创公司Cradle将LLM触角伸向了生物科技领域,尝试用AI来帮助设计和改组蛋白质序列。
/ 01 / 用大模型设计蛋白质
Cradle公司做的事情并不复杂,就是在数十亿蛋白质序列以及实验室生成数据基础上训练一个生成式人工智能模型,该模型用于设计DNA蛋白质序列。
经过多轮实验和经验研究,Cradle推出的模型在提高蛋白质稳定性方面比其他模型高出20%,输出速度是行业基准的两倍。同时,研发团队不断添加新的生物数据训练LLM,提高模型输出的精度和预测能力。
Cradle的上市给很多Novonesis等生物制药公司带来了新的曙光。
采用传统的研发流程,生物制药公司平均需要花费2200万美元和42个月的时间进行研发,才能将一个潜在产品准备好进行临床测试,只有大约35%的项目能进入临床试验阶段。
而Cradle的语言模型可以帮助他们设计修改现有蛋白质的特性,从而加速公司的产品研发周期,大幅降低研发成本。同时,Cradle在生成新型药物和化学品研发领域也展现出了巨大的潜力,强大的AI生成能力能够帮助科学家找到凭借人类现有手段难以找到的蛋白质工程难题的解决方案。
自诞生之日起,Cradle 就与制药、化工、食品和材料领域的行业领导者签署了多项合作协议。
在过去的一年,该公司已经与九家领先的行业合作伙伴建立了合作关系,其中包括强生创新公司、诺维信公司和Twist Bioscience公司。
目前,Cradle正在开展 12 个研发项目,重点关注各种蛋白质模式的工程设计,包括酶、疫苗、肽和抗体等,涵盖所需的各种蛋白质特性,如稳定性、表达、活性、结合亲和力和特异性等。值得一提的是,与传统方法不同,Cradle可在一轮任务中同时处理酶、肽、抗生素、病毒等多个蛋白质设计改组的优化任务,大大提升了研发效率,降低了实验成本。
为了促进学术交流,Cradle还建立了一个类似于谷歌文档或Figma的在线社区平台,科研团队可以在社区中协作,确定研究流程,共享最新的蛋白质研发信息。该平台可以供世界各国的AI工程师和生物科研人员分享信息,交流最新成果。社区成员可以相互关注,达成合作关系。社区内的个人研究也可以作为研究论文的附件。同时,每一位研发成员的数据都被银行级别的保密方法加密,仅有用户和用户邀请的人才可以访问实验数据。
/ 02 / 融资2970美元,创始人立志用AI改变世界
“凭着一己之力将知识生产的边际成本降为零,AI已经在音频视频文字领域展现了巨大的潜力,如果我们把LLM用于DNA序列研发,并将研发成本降低60%呢?”Cradle公司的创始人Grieken脑子里有了一个雏形,这也是他创立Cradle最初的灵感。
Grieken毕业于斯坦福工业工程专业,曾在Google X作为项目经理工作了四年,后作为Google AI的高级项目经理领导研究AI基础设施和机器学习。在Google工作的经历为他积累了丰富的技术经验和人脉资源。
带着将AI和生物科技融合的想法,Grieken成功组成了他的第一支技术团队,团队仅7人并在A轮融资和风投中筹集了来自Index Venture等天使投资人2970万美元资金。
谈及建立Cradle的初衷,Grieken笑道:“我已经是两个女儿的父亲了,我不希望二十年之后当女儿问起我,‘爸爸,你曾经是干什么的时候?’我的答案是‘一事无成’。”
“我想自豪地告诉她们,爸爸曾经是一名用AI改造世界的科研人员。”