• 公司背景:杭州深度求索人工智能基础技术研究有限公司成立于2023年7月17日,由中国对冲基金高毅资产联合创始人梁宏创立并担任CEO。 • 技术特点:以Transformer架构为基础,基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络,同时增加审核、过滤等安全机制。 • 产品及发布时间:2024年1月5日发布DeepSeek LLM;2024年5月7日发布DeepSeek-V2;2024年6月17日发布DeepSeek-Coder-V2;2024年12月13日发布用于高级多模态理解的专家混合视觉语言模型DeepSeek-VL2;2024年12月26日DeepSeek-V3正式发版;2025年1月10日,基于DeepSeek-R1模型的聊天机器人App上线,支持iOS和安卓系统。 • 应用场景:可实现语义分析、计算推理、问答对话、篇章生成、代码编写等任务,应用于智能对话场景,服务企业端客户,也为开发者和个人用户提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景。 • 优势:具有训练成本低、性能卓越、开源等优势。如DeepSeek-R1预训练费用只有557.6万美元,不到OpenAI GPT-4模型训练成本的十分之一;在数学、代码、自然语言推理等任务上,性能比肩OpenAI的GPT-4正式版;还将代码模型支持的编程语言从86种扩展到338种,将上下文长度从16k扩展到128k。
•公司背景:杭州深度求索人工智能基础技术研究有限公司成立于2023年7月17日
琼琼聊趣
2025-02-04 00:50:59
0
阅读:0