深耕大模型技术,科大讯飞研发的国产ChatGPT上线测试

科技狂客 2023-04-26 12:19:42

今年 “国产大模型”成了AI领域激战的前沿。百度、阿里等大厂纷纷入局,清华、复旦等高校也不肯落伍,在4月21日,复旦Moss大模型宣布开源,更是引发网络无数热议。

素有“人工智能国家队”之称的科大讯飞,近日也放出了重磅消息。

4月20日,科大讯飞官宣“星火”认知大模型将于5月6日正式发布。在晚间的业绩说明会上,相关人员披露了“星火”的最新进展,并介绍了“星火”大模型的先进技术,可谓是吊足了业界胃口。在当日的发布会上,“星火”大模型无疑成了“C位”。

随着发布日期的临近,科大讯飞来了一波“反向跳票”。4月24日晚间,科大讯飞星火认知大模型官网正式上线,填写需求便可获取测试资格,于是我赶紧填写了需求,很快便获得了测试资格,并与“星火”展开了对话。

我首先进行了提问:“星火大模型,技术优势在哪里”。

关于技术优势,“星火”大模型作了一份恰如其分的“自我介绍”,表明自身技术优势主要在大规模数据训练、多任务学习、灵活的架构设计、自适应学习能力,以及高效的推理速度这五个层面。在最后,星火认为自身是一款“具有较高竞争力的自然语言处理模型”。

“你提到星火大模型使用了海量的中文语料库进行训练,是否意味着星火大模型在中文回复速度上会更快,表达方式会更丰富呢?”

对此“星火”表示了肯定。其实在测试过程中,中文反馈速度的流利是肉眼可见的,对于简单的问题,几乎是实时显示,对于一些字数较多、较为复杂的问题,“星火”回复速度稍慢,但并不会出现延迟感。

在中文表达方面,我们采取了 “成语接龙”来测试。

“星火”的成语接龙显然是十分优秀的,即便冷门成语也可以应对自如。

那么“星火”的技术是否只支持对话呢?显然不是的,作为一个“泛用性”很强的模型,经过测试,星火在聊天框内便可以实现代码的编写以及许多办公操作。

“为我生成一份9x8的表格”。

这对于“星火”来说显然不在话下,甚至可以通过表格、或是代码框的形式展现。

不仅是办公操作,专业性的代码同样难不倒“星火”大模型。

“为我生成一份以C#编写的二维贪吃蛇,在Unity中实现。”

“星火”不仅给出了详细的代码,更是给出了原理,在代码这一AI模型应用十分广泛的场景中,“星火”技术也没有落后。

新技术的应用前景往往令人浮想联翩,“星火”大模型也是如此。

“‘星火’认知大模型的应用前景有哪些?”

“星火”表现地十分乐观,其在“智能客服”、“金融风险控制”、“医疗诊断”、“智能教育”和“自动摘要和文本分类”等多个领域,有着广泛的应用前景。而科大讯飞在业绩会上也传达出同样的基调。

值得一提的是,在与其他AI模型技术进行对比时,“星火”表现得十分客观公允。

“相比于Claude,Chatgpt等模型,你的技术特点是什么?”。

在面对这种对比时,“星火”的回答十分谨慎,“针对不同的需求场景,我们都有各自的优势和适用性”。

在科大讯飞4月20日晚的业绩交流会上,科大讯飞对于“星火”认知大模型的技术特点,做出了详细解释:在线“记忆”和“理解”全世界的知识和信息;基于自然对话方式理解任务和执行任务;实时接入互联网;可以快速不间断的学习,不断迭代改进等。

尽管在目前的“抢鲜体验”里,这些技术特点尚未得到充分地展现,但“星火”在中文语言处理、日常办公操作和一些专业性的代码操作中,在国产大模型梯队中表现出优秀的技术水平,结合可观的应用前景,5月6日“星火”的正式发布,也越发让人期待了。

0 阅读:27