亚博买球 体验棒 官网入口

亚博买球亚博体育最终打造出了一款 SOTA 的镶嵌模子-亚博买球 体验棒 官网入口
发布日期:2025-08-09 06:41    点击次数:169

亚博买球亚博体育最终打造出了一款 SOTA 的镶嵌模子-亚博买球 体验棒 官网入口

最新音信,斯隆奖得主、姚班学友马腾宇大模子创业效果亚博买球亚博体育,被收购!

收购方是 MongoDB,一家开源数据库上市龙头。

而距离他 2023 年 11 月官宣。那时创业威望相称之留神和豪华,李飞飞曼宁等大佬担任参谋人。

他们主若是作念针对 RAG(检索增强生成)特意优化的镶嵌模子,为智能 AI 期骗表情提供守旧。

在这短短一年多时刻里,模子更新到了第三个版块,达成了首先进的检索精度和向量存储资本的大幅裁减;期间完成了两轮融资,总筹集金额达到 2800 万好意思元。

这次收购,具体金额还未披露。

但在马腾宇公司博客中披露了他们遴荐被 MongoDB 收购的原因。

肤浅来说即是,两者强强聚首,将 AI 检索模子平直引入数据库,在更长入的堆栈下带来更高效的树立体验,还能扶持 AI 期骗表情的性能和准确性。

不少业内东说念主士,在马腾宇推文下面示意了道贺。

5 年时刻作念出 SOTA 镶嵌模子

当初创业时,他们曾披露一个进犯的创业原因是觉得业界对镶嵌模子的喜爱进度远远不够。

镶嵌模子与生成式模子有一定相似之处,但愈加侧重于语义领会,通过神经集会(时常是 Transformer)架构来对语义高下文进行拿获和压缩。

难度上,考试镶嵌模子和生成式模子通常顾惜——考试高质地的镶嵌模子需要在架构、数据、亏空函数等很多方面进行反复实验。

于是,他们用了 5 年时刻,集会了海量考试数据和预 / 后处理标准,最终打造出了一款 SOTA 的镶嵌模子。

而在创业之后,模子的迭代还在接续。

Voyage 发布了诸多系列模子,包括通用镶嵌模子、代码检索镶嵌模子、多模态镶嵌模子,他们齐在往常三个月期间齐纷繁升级到了第三个版块。

通用和多话语镶嵌模子 voyage-3-large:该模子在涵盖 100 个数据集的八个评估领域中名递次一,包括法律、金融和代码,高下文长度为 32K。通过俄罗斯套娃表征学习(MRL)和量化感知考试,守旧更小的尺寸和 int8 和二进制量化,可显然裁减 vectorDB 资本,同期对检索质地的影响最小。

基于代码检索的镶嵌模子 voyage-code-3。在一组 32 个代码检索数据集上,它的性能离别比 OpenAI-v3-large 和 CodeSage-large 平均进步 13.80% 和 16.81%。通过使用 Matryoshka 学习和量化表情(如 int8 和二进制表情)守旧更小的维度,voyage-code-3 还能权贵裁减存储和搜索资本,同期将对检索质地的影响降至最低。

多模态镶嵌模子 voyage-multimodal-3,可用于包含丰富视觉和文本的文档。与现存的多模态镶嵌模子不同,voyage-multimodal-3 能够对交错文本和图像进行矢量化处理,并从 PDF、幻灯片、表格、数字等截图中捕捉要津视觉特征,从而省去了复杂的文档分解历程。在对 3 个多模态检索任务(共 20 个数据集)进行评估时,voyage-multimodal-3 比性能仅次于它的多模态镶嵌模子平均扶持了 19.63% 的检索准确率。

与此同期,还积蓄了一众顶尖的配结伴伴,包括 AWS、Databricks、Anthropic、Harvry、LangChain、Replit 等等着名公司。

这次收购之后,Voyage AI 不错 MongDB 带来什么?

用一张图就不错轮廓之。

以往树立东说念主员需要依靠多样颓败组件来构建 AI 期骗表情,这些组件的次优遴荐(举例镶嵌模子)可能导致数据检索相关性低和生成输出质地低下。这种分散的标准对树立东说念主员来说既复杂又奋斗,着力低下,况兼繁琐。

当前,他们无需实施变通标准或解决单独的系统,而是不错从及时操作数据中生成高质地的镶嵌、存储向量、履行语义搜索并优化驱散 - 扫数这些齐在 MongoDB 中完成。

关于这次收购,MongDB CEO 示意:

AI 有后劲改动每个行业,但其期骗因"幻觉"可能带来的风险而受到放荡。通过将先进的 AI 出手搜索和检索才略整合至咱们高度生动的数据库系统中,MongoDB 和 Voyage AI 将匡助企业浮松构建能够创造要紧业务影响的可靠 AI 期骗。通过这次收购,MongoDB 从头界说了 AI 期间的数据库。

马腾宇则示意:要使 AI 期骗表情进展一齐潜能,企业必须信任其输出驱散,因此需要将检索与操作数据深度集成,以确保其准确性和相关性。加入 MongoDB 使咱们能够将前沿的 AI 检索时期带给更等闲的受众,并将其无缝集成到要津任务期骗中。通过将咱们在镶嵌和重排序方面的专科常识与 MongoDB 一流的数据库相结合,咱们不错匡助组织构建能够大界限提供更准确、更可靠驱散的 AI 期骗,使他们能够自信地将 AI 期骗于高风险用例。

清华姚班学友,和陈丹琦同学

马腾宇,现任斯坦福大学助理西宾,筹算所在包括机器学习、算法过火表面等多项本色。

其学生齐分散在各个顶尖大厂和机构从事科研探索。

他本科毕业于清华姚班,和陈丹琦是同班同学。随后去到普林斯顿攻读博士学位导师是表面算计机科学家、两届哥德尔奖得主 Sanjeev Arora 西宾。

读博期间,马腾宇获取了表面算计机所在的西蒙斯奖等诸多奖项,被导师夸赞"比我方还灵巧"。

博士毕业后,MIT、哈佛、斯坦福等顶尖高校齐给了他助理西宾的 Offer,马腾宇最终遴荐了斯坦福。

2021 年,马腾宇获取了具有"诺奖风向标"之称的斯隆奖,成为继鬲融之后清华姚班又别称获此奖项的学友。

时刻来到 2023 年 11 月,他官宣创业 Voyage。不外创业期间,他弥远还在斯坦福进行一些前沿探索。

比如他与 Google Brain 推理团队创建者 Denny Zhou 联手解说,唯有念念维链满盈长,。通过数学标准,他们解说了 Transformer 有才略模拟大肆多项式大小的数字电路,论文已入选 ICLR 2024。

而就在月初,他还提议了STP, 一种不错无穷臆度息争说的自玩算法,从而达成在有限的数据情况下不休地改良模子。那时他的单元是斯坦福。

至于公司被收购后的下一步产业动向,马腾宇还莫得披露。省略接下来还不错期待更多学术效果 ~

参考趋承:

[ 1 ] https://ai.stanford.edu/~tengyuma/

[ 2 ] https://blog.voyageai.com/2025/02/24/joining-mongodb/

[ 3 ] https://www.mongodb.com/blog/post/redefining-database-ai-why-mongodb-acquired-voyage-ai

[ 4 ] https://x.com/dittycheria/status/1894026445606826095

[ 5 ] https://x.com/VoyageAI

[ 6 ] https://x.com/tengyuma/status/1894029783245451572亚博买球亚博体育



上一篇:亚bo体育网其他新架构比如 Mamba 经常会出现 spike-亚博买球 体验棒 官网入口
下一篇:没有了