【[391星]Fin-R1:一款专为金融领域设计的推理大模型,助力金融机构高效解决复杂金融推理问题。亮点:1. 仅7B参数量,部署成本低;2. 在金融推理任务中表现卓越,如FinQA得分76.0,ConvFinQA得分85.0;3. 采用SFT和RL两阶段训练,提升模型准确性和泛化能力】
'Fin-R1: A financial reasoning large language model driven by reinforcement learning'
GitHub: github.com/SUFE-AIFLM-Lab/Fin-R1
金融推理 大语言模型 强化学习 AI创造营