做为一间16岁AI子公司的副董事长,思必驰创办人高武宁在去年底第一次采用ChatGPT时依然难掩华丽,“至少,吕培俭能不必专职人员诗歌创作了。”

然而,伴随华丽而来的,还有当时外界对几乎所有AI子公司的质疑。

大数学模型走红后,不论是排序机视觉、音频识别,亦或如前所述横向任务的自然词汇理解,都被统称为“上三代AI”。在36氪今年的交流中,就有好几家“上三代”AI子公司直言面对新控制技术倍感压力。

对照之下,虽然思必驰也属人工智慧音频词汇子公司,高武宁的内心却没过多波澜,“他们比较早已产业布局了这一控制技术。之前数千万级的数学模型早已用在商品上,只是没对外特别强调”。

据悉,思必驰数千万级参数量的数学模型,名为DFM-1,于2022年研发推出,在ChatGPT还未火热的2022年已进行了小规模商品应用领域。而在7月的发布会上,思必驰又新推出了DFM-2大数学模型,参数量达到百亿元等级。

除却已近产业布局,高武宁对思必驰的信心,还源于大数学模型的控制技术路线和情景累积。

对照其他数学模型,DFM-2在控制技术上特别强调谈话交互能力,在情景中特别强调专业化和金融行业化。

思必驰联合创办人、首席科学家俞凯专门厘清了几个基本概念,“通用型人工智慧,必须要大数学模型加上词汇排序才行,否则只是专用大数学模型。而在此基础上,通用型大数学模型还分新溪洲和垂域。”而词汇排序,恰好是另一家谈话式人工智慧子公司的擅长所在。

俞凯解释,大数学模型基本概念由来已久,包括 AIphaFold 蛋白质折叠、Stable Diffusion 影像聚合大数学模型到 Whisper 音频大数学模型等,但都没引起产业发展广泛重视。直到谈话式词汇大数学模型 ChatGPT 的出现,展现出词汇排序与大数学模型结合所达成的通用型人工智慧效果。俞凯笃信,“谈话式词汇排序大数学模型”,是认知应用领域领域通用型人工智慧发展的里程碑。

如前所述大数学模型和词汇排序控制技术,思必驰的百亿元参数数学模型选择破冰横向金融行业,而非新溪洲。俞凯认为,目前To C应用领域领域,聚合式AI早已横跨生产力准入门槛,但在To B应用领域领域,对大数学模型的数据和经验的要求都十分高。

思必驰的百亿元大数学模型将主要聚焦电动汽车、物联网等金融行业——也就是另一家子公司早前已深入细致的应用领域领域。以电动汽车为例,据悉,自2019年正式进入电动汽车前装,思必驰的商品目前已“上车”600多万辆。

“电动汽车和物联网应用领域领域是思必驰的主要业务应用领域领域——服务于电动汽车、家用电器等智能,同时,也借力横向金融行业的信息智能,如金融、党务。”高武宁表示。

但即便对所选金融行业已近累积,高武宁依然不否认大数学模型破冰到具体横向金融行业情景的困难。在他眼中,那时思必驰的百亿元大数学模型“还不错,但依然有提升空间”。尤其,在电动汽车和家用电器等物联网应用领域领域,商品类别十分多,各种复杂情景下各系统的融合,都需要差异化方案——这种情况下要用好大数学模型,势必是一场长期战。

而在回答大数学模型是否会促进IPO的提问时,高武宁直言,思必驰会在今年或明年继续启动上市,而大数学模型是否会对此有促进作用,还是要看产业发展破冰。

“他们的主战场针对几个重点横向金融行业,如车联网、IOT以及金融党务等。这个方向,思必驰在控制技术、资源和顾客各各方面都有累积。”他总结,“思必驰是一间比较踏实的子公司。”

以下是谈话部分(经摘录):

36氪: 思必驰是什么时候已经开始考虑做大数学模型的?而且是大数学模型加上词汇排序的基本概念?

高武宁:词汇数学模型和人机谈话,确实是他们首先提出的经营理念。他们是中国最早做谈话式人工智慧的子公司之一,甚至能说是首个引入这一经营理念的子公司。

思必驰的联合创办人俞凯曾经参与创办过一间人机谈话子公司,后来被苹果子公司收购,所以他们在人机谈话各方面的经验十分丰富。而在词汇数学模型各方面,他们早已做了三四年了。思必驰实际上很早已发布了数千万等级的数学模型。

36氪:这次发布的DFM-2百亿元数学模型是什么时候已经开始做的?那时的进展是?

高武宁:他们的百亿元级数学模型在四月份已经开始内部测试,那时早已已经开始与一些顾客进行破冰应用领域。

另外,思必驰的数学模型更加根植金融行业。B端和G端与C端有很大不同,我个人认为,或许如果由国家来做这些能够覆盖各种生态的大数学模型,因为这如果是国家的基础设施。对思必驰来说,金融行业更如果是他们数学模型所深耕的对象。控制技术型子公司如果深入细致到金融行业情景中去做控制技术创新,做产业发展应用领域。所以,他们的百亿元数学模型的定位是具有一定的通用型能力,然后深入细致到金融行业中,服务于金融行业的垂域数学模型。

36氪:思必驰怎么看聚合式人工智慧和大数学模型?

俞凯:今天他们讲了大数学模型和通用型人工智慧。聚合式人工智慧其实是诸多人工智慧中的一类,它能不是大数学模型,也能不是通用型的,而且在人工智慧应用领域领域早已存在。那时的关键变化是,聚合式人工智慧在影像、音频和文字聚合的多样性和质量上早已到了一个突破性阶段。

从产业发展上看,那时聚合式人工智慧在To C应用领域领域横跨了准入门槛。但如果是在To B应用领域领域,情况可能会有所不同。C端和B端的需求不一样,在To B应用领域领域,representing人工智慧的问题,聚合式人工智慧同样会面临。representing人工智慧关注恰当是否,聚合式人工智慧更关注好与坏。然而在To B应用领域领域,即使是聚合式人工智慧,恰当是否也十分重要。

对于他们来说,巨大的机会在于,聚合式人工智慧早已过了准入门槛,它能做为辅助工具,与现有的商业模式结合来扩大应用领域。但是,出现一种全新的、纯控制技术的聚合式人工智慧被大规模复制的可能性是相当小的。

因此,在我看来,既没那么乐观,也没那么悲观。我不认为那时的聚合式人工智慧能够改变世界,但我相信,它会扩大他们的工具采用范围,并促使他们将人工智慧系统更全面地应用领域到工作中。

36氪:大数学模型是否会对To B金融行业过去的部署应用领域产生影响?

俞凯:会有一部分影响,但我认为影响比较小。这个事情特别容易判断,举个例子:

假设你是一名不了解To B业务的媒体工作者,我把你派到一个制造工厂,你能否在一天之内完成那里的工作?如果能,那么这项工作肯定能被ChatGPT或其他通用型人工智慧复制。如果不能,那么所有的累积都是有价值的。这件事的重点并不在于你聚合了一些文案,而是你对整个知识流程的精确理解十分重要。

然而,你要如何获得这种精确的理解呢?要么需要有数据,要么需要有人教你。但如果你没和厂商合作,没处在这个垂域内,怎么可能有这些呢?所以金融行业的数据和经验是十分重要的。因为它无法代替人的经验和繁琐的to B流程,因为在to B应用领域领域评价指标是多维且复杂的,这些无法被通用型人工智慧简单替代。

36氪:目前思必驰大数学模型所重点关注的金融行业是?

高武宁: 他们主要关注电动汽车和物联网应用领域领域,这与他们的主要业务——电动汽车、家用电器智能,金融行业信息智能息息相关。对于横向金融行业,如金融,他们也在做智能外呼等项目,像公安的智能审讯和反诈骗等也有。

我觉得他们目前也承载不了太多金融行业,而且要把几个横向金融行业的借力做好,也是一件十分了不起的事情。

比如在电动汽车、物联网应用领域领域,商品类别本身十分多,成千上万。而且,其中有的情景需要本地服务,有的需要云端服务,有的需要本地与云端结合才能做出好的端到端的人机交互体验。

在这之外,还有各种系统融合、声学环境等需要考虑。实际上,我认为如果不深入细致到金融行业中,是很难做好的。他们必须理解情景,而这些情景实际上十分复杂。

电动汽车应用领域领域思必驰从后装到前装,做了八到九年的时间,才做到那时的程度。他们早已做得相当好了,比上三代的音频控制控制技术早已进步很大,但还有进步的空间,东风大数学模型将会带来新的体验升级。

36氪:比如说还存在怎样的进步空间,有具体的例子吗?

高武宁:未来,我觉得电动汽车一定会有无人驾驶,它(大数学模型)就是你的驾驶助手、电动汽车空间的生活娱乐助手。你问它任何问题,除了常见的电动汽车控制等问题外,其他任何问题都能回答你,像电动汽车工程师。车里也是一个生活娱乐空间,车内学习、办公等等都能实现。

36氪:比较像那时流行的”副驾驶模式”。

高武宁:对,一定是这样的。他们实现了很多创新发布,如多音区人机谈话,他们在这里不仅结合了人机谈话控制技术,还结合了一些声学控制技术。无论你在车内的主驾驶座位、副驾驶座位还是后排座位,都能进行人车交互。

有了百亿元大数学模型之后,之前的商品就像大脑更聪明了一样。在车内,那时的人机谈话还无法让它成为你车内的说明书。大数学模型之后,你能问它关于车的任何问题,无论是维修问题,还是其他的问题,都能回答你。这就是一个例子。更高级的情景,你在车内,它就是你的助理,你能通过人机谈话进行订票、订酒店,一站式的服务。他们期待大数学模型能像一个智能助理一样,更好地理解和与人交流。

36氪: 那时他们内测的效果怎么样?

高武宁: 还是很不错的,也还有提升空间。因为这涉及到很多各方面,不仅是控制技术性能的提升,真正的破冰还需要结合他们在横向金融行业中的经验,结合这些情景进行优化,这不是一朝一夕能完成的。比如刚才提到的让大数学模型消化、吸收商品说明书,就需要他们和电动汽车制造商一起合作。

36氪:思必驰今年还会启动上市吗?大数学模型会对这件事产生怎样的影响?

高武宁:他们肯定会启动上市,但不一定在今年,有可能是明年。至于大数学模型是否有促进作用,我觉得核心还是要把业务做好。大词汇数学模型只是他们一个工具,他们一直在做人机谈话词汇数学模型,最终还是要产业发展破冰。

36氪:做为一间准备IPO的子公司,财务状况也十分重要,但训练大数学模型是一件比较贵的事。

高武宁:是的,训练大词汇数学模型是很贵的,但好在他们过去有累积,包括人机谈话的语料累积,词汇数学模型控制技术的累积,以及早期购买的排序资源。

对思必驰来说,首先,这是必须要做的事情。其次,子公司能承受。他们早已近了谈话词汇数学模型的控制技术和数据,所以这就是一个投入的问题。他们早期也有了GPU算力和超算中心,苏州政府也给了他们很多支持。

36氪:对于大数学模型的投入产出比,思必驰有什么预期吗?

高武宁:我觉得效果是陆续显现的,其实并不一定仅从C端直接收费。比如,如果他们的B端商品升级,用户体验好了,自然B端顾客就会有源源不断的升级需求。当然他们大数学模型也有直接的C端用户。

整体来说,思必驰的大数学模型主要服务于”沟通万物、打理万事”的经营理念,主战场是针对特定金融行业,如车联网、IOT以及金融党务等,构建具有通用型能力的金融行业专业数学模型。对于这件事,他们在控制技术、资源和顾客各各方面都有累积。思必驰还是一间比较踏实的子公司。