从“AI公务员”看AI致用的前景----图一到图四是我让kimi写的，让评论“

从“AI公务员”看AI致用的前景

---- 图一到图四是我让kimi写的，让评论“AI公务员”。四平八稳，但没有思想。还是得自己写，看看我写的和AI的区别是什么。人类作者需要有自己的观点，这是AI写作缺乏的。

环球时报陈经 2025-02-19

2025年初爆火后，多家国内平台陆续接入DeepSeek。2月17日，深圳市福田区也成为其中一员，首批70名基于DeepSeek开发的“AI公务员”正式上岗。这些AI公务员不仅具备通用功能，还能结合实际业务流程，针对公文处理、民生服务、应急管理、招商引资等240个业务场景量身定制。据报道，“AI公务员”公文格式修正准确率超过95%，审核时间缩短90%，错误率控制在5%以内；“AI任务督办助手”跨部门任务分派效率提升80%，按时完成率提升25%。

早在2022年末大模型问世之初，社会上就出现过体验热潮，但多数是将AI作为“陪聊”，渐渐的热情就下降了，真正用于辅助写作、编程等具体场景的相对小众。而此次AI公务员的应用真正唤醒了普通人对于“AI致用”的认识，看到了AI在提升社会运行效率、提高政务场景服务质量的潜力与方向。

作为中国高科技产业聚集地之一，深圳敢于首开先河得益于良好的技术条件。与许多行业大模型类似，政务大模型的开发方法是以开源的“基座大模型”为基础，加入政务场景等行业素材进行专门强化。但包括政务大模型在内，这些行业大模型应用往往受限于“幻觉”等结构性缺陷，必然存在输出质量不稳定的问题，只在少数领域实现了窄范围的应用。这对有极高准确性要求的政务服务而言也是致命性的难题。受限于基座大模型的能力，融入行业素材专门训练只能缓解问题，难以对用户体验实现根本性的提升。其结果就是AI客服等服务型大模型往往存在差错率高、理解力弱、难以完成定制化任务等问题，只能尝鲜，大规模推广应用并不容易。

但随着开源大模型DeepSeek在性能上追平美国最先进大模型的同时，算力效率上还大幅领先，局面已经发生了巨大改变。DeepSeek给出了在有限算力下实现高性能大模型输出的方案，以DeepSeek R1“满血版”作为基座大模型，行业大模型性能正在越过有效应用的临界点，也让大模型发展方向从追求绝对性能向效率革命转变。在新的发展趋势下，借助政务、教育、制造业多样化的场景应用，更高性能的场景化大模型在经历不断使用、反馈迭代之后，其能力将实现高效的升级，更好地满足用户需求，其应用场景也将进一步拓展。

这就是基座大模型的优势。中国本就具备产业链齐全、数字经济繁荣的特点，大模型的潜在应用场景全球最多。一旦大模型性能有突破，再加上开源带来的广泛应用、快速反馈，中国的人工智能应用场景优势就能迅速得以发挥。未来，中国大模型应用有望像电动车、无人机、机器人等领域一样享誉全球。

这将让中美人工智能竞争扩展一个维度。毫无疑问，美国短期内仍会严控高性能GPU出口，甚至将管控机制推广到更多国家，分级管理，从而凭借算力优势，在大模型最高性能的竞争中保持领先。近期，OpenAI一改故作高深的神秘做派，紧急上线了多种大模型以展示能力，力图证明DeepSeek不过是昙花一现，美国很快就能再次掌握主动。

但是，就如多数的工业应用，大模型应用并不需要最高的性能，性价比才是更优先的考量因素。且关键在于，开源的、性能达标的、易得的基座大模型，已经满足了多数场景下的需求，且随着场景化的深入，国产大模型在便利性、灵活性上都具有更大优势。

不仅是AI公务员，许多中国企业都在摩拳擦掌、积极探索应用场景，期待将高水平开源大模型融入自家产品和服务流程。随着中国引领大模型应用场景不断拓宽，基座大模型研发、应用产品开发、应用推广、反馈迭代的完整产业循环即将闭环，相信还有更多AI应用场景和新“AI职业”将被创造出来，带给人们更多惊喜。