用户想要万能的AI法律助手,但创业者大都只愿解决这个「小问题」

第一财经YiMagazine 2024-07-02 11:54:42

Key Points

不少大模型公司都推出——或者其agent市场内出现了面向普通用户的个人法律助手;

但市面上拿到融资的AI法律产品普遍专注于合同场景:审查合同中的风险或者管理合同生命周期,因为这个场景足够标准化且有人买单;

创业者和资本市场的选择可能会让普通用户「拥有一个AI法律专家」的梦想比想象中更远了一点。

ChatGPT发布之后,AGI(通用人工智能)成为热门词汇,一个越来越多人相信的梦想是,未来每个人都可以有一个法律助手、个人医生、金融投资顾问——AI式的。

在美国多州律师资格考试中的初步测试中,GPT-4的准确率超过70%。而摩根大通研究团队的研究表明,GPT-4在给予少量提示的前提下能够通过特许金融分析师考试(CFA)的一级和二级考试。CFA是金融专业人士基准资格考试,2023年8月,人类考生在CFA一级考试中的平均通过率只有37%……这些表现让更多人坚定了「拥有一个AI专家库」的梦想并不遥远。

但到底还有多远?

多项人类考试中,GPT-4表现都超出了80%的人类成绩。

我们采访了把生成式AI用于法律、教育、金融投资、医疗领域的创业者,他们正在构建的产品、取得的成效,以及踩过的坑,可以为梦想与现实的距离给出更精确的度量。

以下为该系列的第一篇,我们采访了幂律智能创始人兼CEO涂存超,他2009年进入清华大学计算机系就读,2018年获得清华大学的博士学位,主要研究领域是人工智能和自然语言处理。博士毕业前一年,他和几位校友共同创立了幂律智能。

不少大模型公司都推出——或者其agent市场内出现了面向普通用户的「法律助手」。比如基于通义、面向法律领域的垂直大模型——法睿,通义在其App内提供聊天式的法律助手服务,除了回答用户法律疑问、提供相应的法律依据和相关判案,这个法律助手还能根据案情描述,自动生成相应的法律文书。此外,同样基于法睿大模型,钉钉还试图「训练」一个叫「法外狂徒张三」的agent,模仿法律名师罗翔的问答风格提供法律问答服务。

秘塔提供面向个人的类案分析功能。

闵可锐创立的秘塔科技旗下的秘塔也提供面向专业个人用户的类案分析功能:输入法律问题,就能检索到公开案例库中的相似判例和相应的法律法规。该服务有免费、个人付费和团队付费3种选择,看上去像是法律人的个人助手。

不过在这些个人律师助手之外,更受资本市场推崇的是面向B端市场而非C端个人用户提供服务的产品。涂存超的幂律智能就属于这一类。

目前,幂律智能已推出两款产品,一款是用于合同审查的「智能审查」工具,另一款是用于合同整个生命周期管理的管理类系统。两款产品都面向企业客户。涂存超说,目前市面上基本都是这类面向B端用户提供合同起草、审查和生命周期管理服务的产品,因为标准化程度够高,而且需求和支付能力稳定。

 

2022年11月,幂律智能对标的Harvey AI获得了OpenAI创业基金领投的500万美元融资,被认为是OpenAI生态的一员。幂律智能也在2023年3月获得了智谱AI的投资,成为智谱AI生态的一员。

模型层公司想要通过agent市场直接服务个人,应用层公司和资本市场却选择面向B端,造成这种分野的根本原因还是模型本身的能力局限。在泰和泰(上海)律师事务所涉外业务部副主任漆艳看来,AI能够为律师初步归纳材料、翻译、完成关键词提取与检索,这类工作的特点是标准化、重复性高,并不涉及太多专业分析与推理。「与客户沟通时,理解对方情绪、表达人文关怀、给出包括伦理道德、商业可行性在内的综合决策,这些都是AI目前无法替代的。」漆艳说,资深律师几十年的经验与思维积累也极难量化,直接投喂给AI。

涂存超认为,像法律、医疗这样数据壁垒和知识壁垒都足够高的领域,通用模型短时间内还很难吃掉,这让他对公司生意拥有一定的安全感。

创业者和资本市场的选择可能会让「拥有一个AI法律专家」的梦想比想象中更远了一点。

以下是「新皮层」与涂存超的对话。

幂律智能创始人兼CEO涂存超。

标准化程度高的领域更适合AI,比如合同管理

新皮层:幂律智能2017年成立,当时为什么考虑选择法律行业去创业?

涂存超:最初我也不是学法律的,当时还调研了金融、教育、医疗等方向,但很多大厂做应用基本都在这些领域,作为一个早期创业团队,我们没有特别多资源。后来我们了解到, 在法律场景里,基本上所有任务都满足「文字输入、文字输出」范式。它与自然语言处理技术,还有大模型技术都高度匹配,这是我当时选择法律场景创业的一个重要原因。

而且当时国内还没有什么真正有AI背景,或者说NLP(Natural Language Processing,自然语言处理)背景的团队做这个领域,我们比较有先发优势。

新皮层:当时有记忆深刻的海外竞品吗?

涂存超:2017年左右,国外已经出现了一批想通过NLP技术做法律科技产品的公司。比如以色列的LawGeex,它用NLP技术审核NDA(Non Disclosure Agreement)保密协议,几十秒时间能审上百份。当时整个法律科技的环境在国外比较火,美国法律服务行业的市场空间,跟国内相比差距蛮大的。

新皮层:幂律智能去年推出了PowerLawGLM大模型,使用了智谱AI的基础模型做微调。训练法律模型时,哪些任务是智谱AI主要做的,哪些是幂律智能重点做的?

涂存超:我们跟智谱的合作是基于它内部没开源的千亿参数版本。 第一步是基座模型的增量训练,这一步智谱提供计算资源、训练资源。法律数据由我们准备,双方共同制定训练策略。下一步由幂律智能做SFT(Supervised Fine-tuning,有监督微调)。做完微调,垂直大模型在法律场景的一些任务上已具备端到端的生成能力,但离最终应用差距还比较远,在此基础上,应用层的工作完全是幂律智能在做。

新皮层:你们在应用层做了哪些工作?

涂存超:法律场景很多任务的逻辑不是端到端的生成逻辑。比如法律咨询,大家天然会认为是一个适合大模型直接生成回答的任务,但实际上大模型生成的方式非常不靠谱。比如问一个端到端生成的大模型,在中国法定结婚年龄是多少?回答16周岁、18周岁、20周岁都有可能。 想回答准确,必须援引法条。先找问题跟哪些法律法条相关,把法条跟问题做综合,才能得到一个靠谱答案。找法条并且根据法条内容来得出结论的过程,就是应用层的工作。

再比如起草法律合同,如果使用GPT-4,看上去它能准确理解意图并输出,但实际上每个条款都很不专业。生成一两页的合同可能还好,生成几十页上百页的合同基本不可能。法律人写合同,为了保证合同高度专业,一定是基于高质量的模板起草。在这个场景,我们使用大模型不是利用它的生成能力,而是利用语义理解能力,通过对话方式描述需求。起草一份什么类型的合同,背后在应用层通过匹配高质量模板,把大模型理解的关键信息填到模板里,再让大模型润色,这种方式更匹配法律人解决任务的逻辑。

新皮层:幂律智能在应用层推出了哪些产品?产品形态如何?

涂存超:一个是智能合同审查产品,提供搭载大模型的合同审查解决方案,自动分析文本并提示风险点。还有一款合同全周期管理的产品,从管理合同范本与条款,到内部起草合同、磋商评审,到最后签署、履约、归档,是一个完整的解决方案。 我们的产品支持通过chat的方式交互。

幂律智能推出的合同审查产品。

幂律智能推出的合同生命周期管理产品。

新皮层:你的产品都跟合同管理相关?

涂存超:我们之前的主要业务就是做「智能合同」这个产品,训练大模型也是以合同文本相关的分析展开的。面向中小企业提供的服务会更广,包含日常法律咨询、法律文书起草、审查等等,合同是很大一块需求,但不是全部,也包括劳动用工、知识产权、股权等多种场景。

新皮层:法律的细分需求很多,为什么你只聚焦合同相关领域?

涂存超:传统律师业务范围还包括民商事诉讼、刑事诉讼、投融资、婚姻家事、破产重组等场景。我们没做的原因主要是,首先这些专项业务案件价值高、案情复杂、专业人员参与程度高,技术目前更适合解决案情相对简单标准化、人员参与程度低的法律服务场景;其次,传统律师业务是存量市场,而常法(注:法律领域中主要指的是固定的法律或制度)是目前渗透率较低的增量市场,市场空间及前景更大。

成为每个人的法律顾问,这个目标还有点远

新皮层:你的客户是B端还是C端普通人?

涂存超:B端企业。大模型都有各种幻觉问题,而法律是一个非常严肃的场景,把问题抛给没有法律背景的C端用户,他们没有分辨能力。我们对产品的定位就是B端用户的辅助工具,比如合同审查,企业内部都有法务,我们不是直接帮客户改好合同,而是会提供建议,最后要不要采纳、是不是有风险,由人来作最后的判断。

我们去年在Q4还开展了新业务,面向初创阶段没有法务团队的小企业,我们组建了内部法律服务团队,借助垂直大模型的能力,为小企业客户提供法律服务。比如客户在企业微信群里问法律问题,我们的法律团队借助大模型能力解决客户需求,然后把产出成果放在群里。面向大企业我们卖的是工具,针对小企业我们卖的是服务。面向小企业,给工具大家用不明白的。

新皮层:企业客户过去是如何解决合同管理问题的?

涂存超:大部分国内企业现状还是只在内部实现了合同部分环节的管理,比如说有OA系统,但是全周期的管理系统并没有。完整的合同管理产品,需要对接公司之前的OA系统,一些销售类合同可能还要对接公司的CRM系统。

确实很多有资金的国有企业已经打造了内部的合同管理产品,针对这种情况,我们会给它推特定模块,比如说智能审查、合同评审管理。

新皮层:你的产品相当于是一种SaaS?

涂存超:我们不是为了做SaaS而SaaS,而是常法服务这个业务场景天然适合SaaS的付费服务方式。常法服务本身是企业每年的持续性需求,而且该业务已经按照年费的方式持续运行,从用户侧到服务侧接受度都较高。

我们另外一块业务面向大型企业提供智能合同系统,因为客户类型、预算制度等原因,就不是SaaS方式,而是OP(On Premise,本地化部署)为主。

新皮层:目前在为这类产品买单的企业是哪些?

涂存超:我们两款产品角色不一样,智能审查是典型的提效工具。 合同管理是比较重的管理类系统,我们尽可能在整个环节嵌入自动化能力,减少繁琐工作。但管理类工具管理属性更强一点,最后买单的是老板,可能会把自由度相对高的一些线下工作搬到线上。

其中民企客户可能更看重效率,他们的法务团队工作压力非常大,但工作压力并不来源于复杂的任务,而是有50%的精力都放在了日常合同的审查工作上。民企客户之前审合同,要从头到尾通读很多遍,现在用工具先做初审,人基于初审结果做最终确认。

另外,我们差不多40%到45%的客户是央企、国企,它们更看重风险防控。B端客户主要还是大B为主,差不多一两百家。

新皮层:to B的产品未来会以App的形式出现吗?比如钉钉?

涂存超:我们会有用户端产品比如App、网页端来承载法律服务,但与钉钉等最重要的区别在于,幂律智能输出的是法律服务而不是单独提供工具,App只是用户接受服务的入口,或者解决部分初级服务需求的平台,后端还是会有服务人员来承接需求。

新皮层:之后会考虑推出面向C端的产品吗?

涂存超:C端优先级可能不是特别高,最优先还是从企业来做。相较于C端,企业需求更高频、更稳定,一个企业只要有日常的生产经营,总要签合同,交易都是通过合同来承载的。此外,B端的获客成本也比C端稳定。

新皮层:未来是否考虑扩展合同之外的场景?

涂存超:应用场景会往服务端来扩,比如说小B的服务偏向合同起草和审查。再扩的话,会往一些专项扩,比如说跟知识产权、劳动用工相关,公司内部制度相关的一些法律服务来扩。

新皮层:相较于通用模型,法律领域已经非常垂直了,但目前为什么没有一款产品可以覆盖所有的法律需求?

涂存超:一是场景细分多,不同场景业务模式差别大,法律、医疗等严肃场景想要在保证效果的前提下覆盖所有需求,技术难度会很高、投入大;二是国内法律场景实际资源投入是很低大。未来可能会有平台或产品cover大部分法律需求,但需要先实现单个高频场景的商业价值验证,形成良性迭代扩展的循环。

「法律数据壁垒高,通用模型短期内很难覆盖」

新皮层:你训练大模型的法律数据从哪里来?

涂存超:数据分两种类型。一种是公开数据,比如裁判文书网上1亿多份裁决书,比如法律法规、偏C端的法律咨询数据、法学书籍等。

另一类是和我们的应用场景相关的私有数据,比如脱敏后的合同数据、合同条款、人工标注数据等。

新皮层:你们怎么降低模型幻觉?

涂存超:我们的产品定位都是辅助工具,幻觉无法完全规避,但最后有人兜底。在技术层面,我们会在应用层尽可能把不同的业务场景知识明确梳理,不会把它做成黑箱。 另外会做好模型外部的数据支撑,维护一个能及时更新的法条库。还有一些高频问题的库,每个问题的回答都经过内部法律人的编辑整理

新皮层:跟公司对接,每个项目组都要有懂法律的人参与其中吗?

涂存超:对,尤其是智能合同审查,理解客户需求做定制,非法律的人搞不定,我们有一个岗位:合同研究员,之前做律师、做法务的同事经验丰富,他们来承担这项工作。我们公司差不多百分之30%-40%的同事都有法律背景,甚至一些销售都有法律背景。

新皮层:通用模型也在试图涵盖不同行业的细分需求,你们是否会有危机感?

涂存超:有一些通用场景,比如营销活动文案是通用模型能力范围内所需要的数据,肯定要被通用大模型的能力cover。但我觉得像法律、医疗,通用模型肯定会非常滞后,短时间内很难被通用模型cover。比如央企、国企的客户,我很难想象,它们把合同不断外传给一些模型。法律有很强的数据壁垒和知识壁垒,至少我们目前不太担心。

而且科技公司一定是通过合作才能推进行业应用的落地,比如OpenAI还投了Harvey,OpenAI和Harvey的合作不是直接把ChatGPT的模型能力提供给Harvey AI,而是也做了大量行业模型层面的定制。

新皮层:幂律智能现在对标的海外公司是哪些?

涂存超:我们跟智谱的合作方式更多在对标Harvey与OpenAI、Robin AI与Anthropic。从智能合同业务的角度,我们对标的是Ironclad、Icertis等CLM(Contract Lifecycle Management,合同全生命周期管理)厂商。

公司档案:

创立时间:

2017年

创始人:

涂存超、张天扬、张惟师

CEO:

涂存超

核心产品:

智能合同审查(MeCheck)

合同生命周期管理(MeFlow)

面向中小企业的法律顾问服务(无忧吾律)

融资历程:

天使轮:2018年3月,完成约千万元人民币融资,投资方为北京华宇科创私募基金投资有限公司;

Pre-A轮:2019年12月,完成数千万元人民币融资,投资方为IMO Ventures、红杉中国、线性资本;

A轮:2021年4月,完成6000万元人民币A轮融资,投资方为源码资本、红杉中国、线性资本、经纬创投、广州华宇科创股权投资合伙企业;

股权融资:2023年3月,完成股权融资,金额未披露,投资方为北京智谱华章科技有限公司;

Pre-B轮:2023年12月,完成8000万元Pre-B轮融资,蓝驰创投领投,源码资本、红杉中国、线性资本、广州华宇科创股权投资合伙企业、北京智谱华章科技有限公司、杭州天谷信息科技有限公司跟投。

估值:

未披露

0 阅读:0