܄

大模型太贵太慢?豆包1.6想打破这个“行业幻觉”

【数据猿导读】 近日,在FORCE LINK AI创新巡展武汉站上,火山引擎总裁谭待发布了最新图像创作模型doubao-Seedream-4.0、全新升级支持“分档调节思考长度”的豆包大模型1.6、豆包语音合成模型2.0、声音复刻模型2.0以及智能模型路由等新产品。

大模型太贵太慢?豆包1.6想打破这个“行业幻觉”

“不谈虚的,只做实的!火山引擎模型再升级。

开篇一波多表情小猿发送!百变小猿只需一瞬,多种情绪随意切换,想获得这样的一组图片,只需在豆包最新发布的图像创作模型doubao-Seedream-4.0上上传一张参考图,然后输入你想要的不同表情描述即可。

近日,在FORCE LINK AI创新巡展武汉站上,火山引擎总裁谭待发布了最新图像创作模型doubao-Seedream-4.0、全新升级支持“分档调节思考长度”的豆包大模型1.6、豆包语音合成模型2.0、声音复刻模型2.0以及智能模型路由等新产品。

大模型_豆包1.6_智能模型-1

多功能百变生图,你的灵魂画手

豆包最新发布的图像创作模型doubao-Seedream-4.0大幅提升了文生图、图生图、图像编辑等能力,可以基于参考图生成不同风格的图片,笔者以数据猿logo图为参考图进行了一系列试用。

提示词:根据我给的参考图设计一个手办

大模型_豆包1.6_智能模型-2

(参考图)

模型出图:

大模型_豆包1.6_智能模型-3

豆包几乎瞬间生成了一张立体手办图,保留了参考图的关键元素,将原图片做了立体设计展示。

接下来笔者继续尝试让豆包根据参考图生成多表情组图,只需输入:“根据我给的参考图设计八张不同表情的logo图。”模型就可以在参考图的基础上对小猿的表情进行不同情绪的微调展示,生成开篇图的效果。可以看到豆包在参考图的基础上衍生出了开心、惊讶、哭泣、愤怒等多种表情,且图片没有出现不合理畸变等,doubao-Seedream-4.0不仅可应用在日常生活场景中,也为IP创作、衍生设计、商业营销打开了更广阔的想象空间。

效果与低成本不能兼得?

豆包1.6打破伪命题

在使用大模型时我们可选择开启“深度思考”模式,模型输出效果会大幅提升,但同时成本和模型延迟也会增加,企业用户考虑到使用成本问题,在是否开启“深度思考”上往往更加保守。火山引擎调查发现,在实际应用中深度思考模式的使用占比仅有18%。

对所执行任务的判定并不是非黑即白,有很大一部分任务介于简易与困难之间,属于没有被考虑到的中间地带,不开启深度思考效果不太够,开启深度思考消耗更多tokens又有些浪费。针对这一痛点,豆包大模型1.6全新升级:提供Minimal、Low、Medium、High四种思考长度,平衡企业在不同场景下对模型效果、时延、成本的不同需求,并进一步提升了思考效率。这也是国内首个原生支持“分档调节思考长度”的模型。

以低思考长度为例,相比模型升级之前的单一思考模式,升级后的豆包1.6模型总输出tokens下降77.5%、思考时间下降84.6%,模型效果保持不变。

此外,为进一步满足不同企业的多样化需求,火山引擎正式推出豆包大模型1.6 lite,相比旗舰版本更轻量、推理速度更快。在效果上1.6 lite超越豆包大模型1.5 pro,在企业级场景测评中较豆包1.5 pro提升14%;在使用量最大的0-32k输入区间里,综合使用成本较豆包1.5 pro降低53.3%。

大模型_豆包1.6_智能模型-4

语音模型家族壮大,实现深度语义理解

豆包语音模型家族不断壮大,逐步覆盖了语音合成、语音识别、声音复刻、实时语音、同声传译等不同领域,语音作为AI应用的核心交互方式已经深入到了大家生活的方方面面,手机唤起语音助手,驾车出行时给AI导航发出指令等,目前豆包语音模型已经覆盖了超过4.6亿台智能终端,为广大用户提供便捷的AI服务。

此次火山引擎最新发布了豆包语音合成模型2.0和声音复刻模型2.0。全新升级的语音合成模型2.0此次解决了一个业界老大难问题:复杂公式和符号的朗读,这一点在教育场景中尤其重要。复杂公式里包含了很多特殊符号,一般非专业人士很难把握,大模型也面临同样的问题,市面上的同类模型朗读准确率普遍低于50%,此次发布的语音模型2.0对这一块进行了针对性优化,目前在小学至高中阶段全学科公式的准确率可以达到90%以上。

我们来看一个例子。下图是一个复杂的化学公式,笔者调用已被遗忘许久的化学知识试图朗读失败。

大模型_豆包1.6_智能模型-5

接下来我们来看大模型给出的正确读法:

除了正确朗读之外,声音复刻模型2.0还能做到复刻不同音色来朗读内容,进行更加个性化、多样化的语音创作。

模型路由,你的模型自动挡

谭待表示,火山引擎一直以来的宗旨是希望不断地通过技术创新来帮助企业降本增效。市面上有非常多的模型,各个模型又分为不同的版本,侧重的功能点各有不同,对于企业来说很难筛选到最匹配自身业务需求的模型,火山引擎针对这个特定需求全国首发智能模型路由方案,可以自动帮助企业选择模型。模型路由不仅支持豆包全系列的模型,也支持DeepSeek、Kimi、通义千问等主流的开源模型,选择更加丰富。

目前此功能已经可以在火山方舟平台进行使用,路由支持不同模式,包括平衡模式、效果优先模式、成本优先模式,用户可根据执行任务的具体难易程度等因素自主选择不同模式,以达到效果和成本的最优解。如在智能客服场景下使用DeepSeek-V3.1模型执行任务,当选择成本优先模式时,对比直接使用模型成本下降71%;选择效果优先模式时,对比直接使用模型效果提升14%。

持续创造价值的模型不断前行

去年5月,豆包大模型调用量是每天1200亿Tokens,到今年9月涨到了每天30万亿Tokens,同比实现了253倍的高速增长。谭待表示:Tokens还会持续增长,这个趋势远远没有结束,且Tokens的增长与实际产生的效果并不是线性关系,实际创造价值比Tokens的增长更大。To B端的选择最能说明问题,企业的每一分钱都要花在刀刃上,愿意花钱买Tokens,就是因为Tokens创造了价值,让它的品牌更好,让它的服务效率更高,让它的成本降低,给业务带来了更大的增益。

在企业AI持续推进的今天,与模型能力同等重要的,是对用户的感同身受,从用户的角度出发去发现问题、解决问题,让AI真正成为懂用户的伙伴,成为高效运作的数字员工。真正的智能永不傲慢,持续进步、不断进化,才是在竞争激烈的AI市场中立于不败之地的法宝。产品创造价值的同时,也铺设了一条信任的路径,构筑了企业发展的基石。


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

蚂蚁发布并开源万亿参数思考模型Ring-1T;中国农大发布神农大模型3.0;香港首个自主研发AI机械人平台亮相丨每日大事件
蚂蚁发布并开源万亿参数思考模型Ring-1T;中国农大发布神农大...
DeepSeek-V3.2-Exp发布并开源;蚂蚁开源1T推理大模型;OpenAI据称将发布新版Sora 2丨每日大事件
DeepSeek-V3.2-Exp发布并开源;蚂蚁开源1T推理大模型;Open...
阿里通义7大模型霸榜全球开源前十;中国移动等发布超节点智算应用
阿里通义7大模型霸榜全球开源前十;中国移动等发布超节点智算应...

我要评论

数据猿微信公众号
第22届国际物联网展
返回顶部