一觉醒来AI科技圈发生的大小事儿05月07日

📳从基因组到蛋白质组连续翻译，南开大学开发通用跨模态数据分析方法

南开大学的研究团队提出了scButterfly，一种基于双对齐变分自动编码器和数据增强方案的多功能单细胞跨模态翻译方法。该方法在保留细胞异质性、翻译各种背景数据集和揭示细胞类型特异性生物学解释方面优于基线方法。scButterfly可应用于单模态数据的综合多组学分析、低质量单细胞多组学数据增强以及scATAC-seq数据的自动细胞类型注释。研究人员展示了scButterfly在跨模态翻译、数据增强和细胞类型特异性生物标志物解读等方面的广泛应用，并提出了未来优化方向，包括整合公共数据、扩展适应其他模态和使用先进机器学习技术。

🔗

📳深度学习与化学语言模型结合，用于药物从头设计，登Nature子刊

苏黎世联邦理工学院的化学家开发了一种新的计算机程序，利用基于相互作用组的深度学习方法，从蛋白质的三维表面快速生成活性药物成分。该方法结合了图神经网络和化学语言模型，提供了替代方案用于药物设计。研究成果发表在《Nature Communications》上，介绍了 DRAGONFLY 方法，能够生成具有特定生物活性的化合物库。这种基于相互作用组的深度学习方法为定制的分子设计和创新药物发现提供了新途径。

🔗

📳让机器准确「看懂」手物交互动作，清华大学等提出GeneOH Diffusion方法

清华大学、上海人工智能实验室和上海期智研究院合作发布了一篇名为《GeneOH Diffusion:Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion》的论文，提出了一种新的去噪方法GeneOH Diffusion，用于改善手和物体交互过程中的噪声问题。该方法通过局部接触区域参数化交互信息，设计了一套名为GeneOH的序列表征，并使用扩散模型刻画手物交互信息的分布，实现了先扩散后去噪的方法，最终能够恢复出自然真实的手物交互序列。研究结果表明，GeneOH Diffusion在有限数据集上训练后，能够有效泛化到新的交互序列，包括未见过的物体和复杂噪声特征，展现出了广泛的应用前景。

🔗

📳一块钱100万token，超强MoE模型开源，性能直逼GPT-4-Turbo

DeepSeek AI公司开源了混合专家语言模型DeepSeek-V2，参数量达236B，支持128K token的上下文长度。相比去年上线的DeepSeek 67B，DeepSeek-V2性能更强，节省42.5%训练成本，提升了生成吞吐量。在各项基准测试中表现出色，价格仅为GPT-4-Turbo的近百分之一。模型采用Transformer架构，MLA和DeepSeekMoE架构提高了效率。训练采用高效框架，优化了通信开销。在多种基准测试中表现优异，成为最强的开源MoE语言模型，尤其在中文方面表现突出。

🔗

📳AI在用| 又是一年毕业季，给你找了个论文搭子Kimi+

本文介绍了一个名为Kimi+的AI私人助理，类似于OpenAI的GPTs，提供个性化服务，包括修改简历、制作PPT等。Kimi+支持学术搜索、论文写作助手、论文改写等功能，帮助用户写论文。文章详细描述了使用Kimi+写关于AI视频模型Sora的论文的过程，包括文献搜集、翻译、确定主题、构思大纲、撰写论文和润色。Kimi+在翻译速度快、语言准确流畅方面表现良好，但对图片反应不灵敏。最后强调AI只是辅助工具，仍需人类创造力和深度思考能力。

🔗

古典风资讯网

一觉醒来AI科技圈发生的大小事儿05月07日

文浩Free