从“AI公务员”看AI致用的前景
---- 图一到图四是我让kimi写的,让评论“AI公务员”。四平八稳,但没有思想。还是得自己写,看看我写的和AI的区别是什么。人类作者需要有自己的观点,这是AI写作缺乏的。
环球时报 陈经 2025-02-19
2025年初爆火后,多家国内平台陆续接入DeepSeek。2月17日,深圳市福田区也成为其中一员,首批70名基于DeepSeek开发的“AI公务员”正式上岗。这些AI公务员不仅具备通用功能,还能结合实际业务流程,针对公文处理、民生服务、应急管理、招商引资等240个业务场景量身定制。据报道,“AI公务员”公文格式修正准确率超过95%,审核时间缩短90%,错误率控制在5%以内;“AI任务督办助手”跨部门任务分派效率提升80%,按时完成率提升25%。
早在2022年末大模型问世之初,社会上就出现过体验热潮,但多数是将AI作为“陪聊”,渐渐的热情就下降了,真正用于辅助写作、编程等具体场景的相对小众。而此次AI公务员的应用真正唤醒了普通人对于“AI致用”的认识,看到了AI在提升社会运行效率、提高政务场景服务质量的潜力与方向。
作为中国高科技产业聚集地之一,深圳敢于首开先河得益于良好的技术条件。与许多行业大模型类似,政务大模型的开发方法是以开源的“基座大模型”为基础,加入政务场景等行业素材进行专门强化。但包括政务大模型在内,这些行业大模型应用往往受限于“幻觉”等结构性缺陷,必然存在输出质量不稳定的问题,只在少数领域实现了窄范围的应用。这对有极高准确性要求的政务服务而言也是致命性的难题。受限于基座大模型的能力,融入行业素材专门训练只能缓解问题,难以对用户体验实现根本性的提升。其结果就是AI客服等服务型大模型往往存在差错率高、理解力弱、难以完成定制化任务等问题,只能尝鲜,大规模推广应用并不容易。
但随着开源大模型DeepSeek在性能上追平美国最先进大模型的同时,算力效率上还大幅领先,局面已经发生了巨大改变。DeepSeek给出了在有限算力下实现高性能大模型输出的方案,以DeepSeek R1“满血版”作为基座大模型,行业大模型性能正在越过有效应用的临界点,也让大模型发展方向从追求绝对性能向效率革命转变。在新的发展趋势下,借助政务、教育、制造业多样化的场景应用,更高性能的场景化大模型在经历不断使用、反馈迭代之后,其能力将实现高效的升级,更好地满足用户需求,其应用场景也将进一步拓展。
这就是基座大模型的优势。中国本就具备产业链齐全、数字经济繁荣的特点,大模型的潜在应用场景全球最多。一旦大模型性能有突破,再加上开源带来的广泛应用、快速反馈,中国的人工智能应用场景优势就能迅速得以发挥。未来,中国大模型应用有望像电动车、无人机、机器人等领域一样享誉全球。
这将让中美人工智能竞争扩展一个维度。毫无疑问,美国短期内仍会严控高性能GPU出口,甚至将管控机制推广到更多国家,分级管理,从而凭借算力优势,在大模型最高性能的竞争中保持领先。近期,OpenAI一改故作高深的神秘做派,紧急上线了多种大模型以展示能力,力图证明DeepSeek不过是昙花一现,美国很快就能再次掌握主动。
但是,就如多数的工业应用,大模型应用并不需要最高的性能,性价比才是更优先的考量因素。且关键在于,开源的、性能达标的、易得的基座大模型,已经满足了多数场景下的需求,且随着场景化的深入,国产大模型在便利性、灵活性上都具有更大优势。
不仅是AI公务员,许多中国企业都在摩拳擦掌、积极探索应用场景,期待将高水平开源大模型融入自家产品和服务流程。随着中国引领大模型应用场景不断拓宽,基座大模型研发、应用产品开发、应用推广、反馈迭代的完整产业循环即将闭环,相信还有更多AI应用场景和新“AI职业”将被创造出来,带给人们更多惊喜。