数学模型=领域知识+方法论+数学语言

模型视角 2025-01-03 16:10:14

数学模型,可以作为科学与现实之间的桥梁。我们的生活受益于各种数学模型,虽然我们可能没有察觉,比如天气预报模型帮助我们规划出行,导航系统中的路径优化模型让我们节省时间和燃油,甚至连线上购物推荐系统背后也离不开数学模型的支持。这些模型隐藏在生活的每个角落,默默发挥着作用。

强大的大语言模型如ChatGPT等,无疑可以视为一个杰出的数学模型,因为它融合了庞大的数据集和复杂的数学算法,将自然语言转化为可计算的向量表示,并通过概率推断生成符合上下文的回应。

一个情境:发电量预测

现在有这样一个情境:已知我国1978至2023年人均发电量数据,如何预测未来人均发电量数据?比如2030年?

年份人均发电量(千瓦时)1978268.361980306.351985390.761990547.221995836.391996888.101997923.161998939.661999989.23......20164419.3720174730.2520185108.6020195330.1020205512.7620216042.5420226266.0220236703.32

中国1978-2023年人均发电量(千瓦时)。来自中国统计年鉴(2024)

AI会怎么做?我们又会怎样做?

这是AI的回答:

简单来说是通过数据拟合(包括多项式、指数、逻辑斯蒂函数等)获得趋势规律,进而推测未来值。

当然有一定建模基础的同学也会采用类似的方法,上述回答过程说明AI并不是完全的“小白”,它还有一定的基础。但这个回答是否足够让人满意?至少对于我而言,是不满意的。核心在于,上述模型只考虑了过去的发电量时间序列数据,依据这有限的“样本内”规律,是难以对不确定的未来进行合理预测的。比如我们不能不考虑未来经济和技术可能的走向以及人口变化带来的影响。因此,一个更合理的预测方法,应该是将时间序列模型与其他重要因素相结合,构建一个多变量数学模型。

上述问题的具体模型不是本文的重点,我只想借这个例子引出我对于文章开头问题的观点:

一个好的数学模型=领域知识+方法论+数学语言

数学模型,作为科学与现实之间的桥梁,如果深入拆解,我认为这座桥梁的构成其实可以归结为三个基本要素:领域知识、方法论和数学语言。这三者共同决定了一个模型的质量与实际价值。上面的例子中尤为重要的是缺少对于领域知识的关照,这样的模型也没有“灵魂”。

下面的讨论涉及我对模型复杂性、领域知识以及建模实践的讨论。稍微有点长,为耐心读完的读者点个赞。

领域知识的重要性

对于数学模型而言,领域知识是灵魂。没有领域知识的支撑,再精妙的数学技巧和再炫目的AI算法,也可能只是空中楼阁。

比如,AI模型在医学影像分析中已经表现出超强的能力,但如果没有医学专家的指导,算法很可能把无关紧要的噪声当成关键病灶。再比如,用数学优化运输路径,如果不了解交通规则或实际路况,再好的“最优解”也可能让司机骂街。

说到底,领域知识决定了模型的起点和方向。而方法论和数学语言则是帮助我们高效表达和解决问题的工具。

模型越复杂越好吗?

一个经典的例子是,早期天气预报使用的模型十分简单,但它能预测基本的天气趋势。而如今,我们拥有超级计算机支持的高分辨率模拟,但“晴转多云”有时依然打脸。为什么?因为复杂模型并不等于好模型。模型复杂性应该服务于问题本质,而不是为了“炫技”。复杂模型可能带来精度的提升,但也伴随数据需求的暴涨、计算成本的攀升和解释性的削弱。

举个例子,你让AI帮你算一笔账,给你抛出几十页公式推导(夸张的说法),最后告诉你结果是“100元”。你会服气吗?答案很可能是否定的,因为复杂性掩盖了核心逻辑的透明性。

模型透明度的重要性,常常被忽视却十分关键。在AI建模盛行的今天,黑箱模型虽然强大,却带来了两个主要问题:信任问题  和 调试问题。

如果模型的内部逻辑完全无法解释,用户或决策者很难对其结果产生信任。一个完全黑箱的AI推荐系统告诉你“这是最优解”,你会愿意接受吗?还是更倾向于一个告诉你“为什么这是最优解”的系统?当模型出错时,透明的白箱模型更容易找到问题的根源并进行修正,而黑箱模型可能让人无从下手。

透明度不仅是科学伦理的需求,也是模型实际应用的重要保证。我们需要适度的复杂性。这要求对问题背后的机理有深刻的理解,而这种理解往往来自于扎实的领域知识。领域知识不仅帮助简化问题,还能为复杂性设立合理的边界。

为什么AI模型如此强大,我们还有必要亲自建模?

这个问题听起来有些挑衅(尤其是学生那这个问题问一个建模教师,场面可能会有些尴尬,但不得不说这是一个好的问题),但其实反映了一个时代的焦虑:当AI的“黑箱”模型不断取得惊人的成功,人类的建模能力是否正在变得无用?

答案显然是否定的。尽管AI强大,但它并不能替代人类建模的理解力与创造力。以下是两个核心原因:

AI无法解释“为什么” 。AI模型通过训练海量数据得出结果,但它的推理过程往往像黑箱一样。相反,人类建模师通过领域知识建立的模型,不仅能够预测,还能解释背后的因果关系。

理解模型为什么有效,比仅仅得出一个结果更重要。

AI依赖于现有数据,而人类建模能创造性解决问题 。AI的能力依赖于数据,但当我们面对一个全新的问题或极端场景时,没有数据可以参考,这时依靠的只能是人类的直觉与创造性建模能力。

领域知识+方法论+数学语言

我所提出的公式“数学模型 = 领域知识 + 方法论 + 数学语言”想说的是:一个真正优秀的数学模型,需要兼具对实际问题的深刻洞察(领域知识)、严谨的解决思路(方法论)以及清晰的表达形式(数学语言)。

我们在建模时,既不能迷信技术的“全能”,也不能忽视问题背后的本质逻辑。真理首先需要被理解,而非被计算。

数学建模远不仅仅是工具,它背后要有一套能够说服人的逻辑才行:通过抽象理解现实,通过模型探索未知。面对AI技术的迅猛发展,我们不是要放弃建模,而是更要回归本源,用模型为我们重新理解世界提供透明、可信的框架。当我们在建立和反思模型时,不妨问自己:

“我真的理解这个问题吗?”“我的模型是在服务问题,还只是为了展示技术?”“我的模型能解释清楚背后的逻辑吗?”
0 阅读:0