܄

一口气发布4个大模型,火山引擎这次真的杀疯了!

【数据猿导读】 近日,火山引擎FORCE原动力大会在北京盛大召开。会上,火山引擎正式发布豆包大模型1.6、豆包・视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。这些新产品在多模态交互、复杂任务处理、内容生成等方面展现出强大功能,如豆包大模型1.6支持多模态理解...

一口气发布4个大模型,火山引擎这次真的杀疯了!

近日,火山引擎FORCE原动力大会在北京盛大召开。会上,火山引擎正式发布豆包大模型1.6、豆包・视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。这些新产品在多模态交互、复杂任务处理、内容生成等方面展现出强大功能,如豆包大模型1.6支持多模态理解和图形界面操作,能高效处理真实世界问题;Seedance 1.0 pro可生成高品质视频,在多项评测中位居前列。

当前,全球AI大模型市场竞争激烈,众多企业纷纷布局。与市面上同类产品相比,火山引擎此次发布的大模型家族凭借全模态、全尺寸、高性价比的特性脱颖而出。例如在多模态能力上,相比部分仅支持单一或少数模态的模型,豆包大模型1.6实现了更广泛的模态融合与深度理解;在成本方面,创新的定价策略也为企业用户带来了显著优势,在激烈的市场竞争中抢占先机。

大模型矩阵“再添新丁”

火山引擎的豆包大模型家族已形成丰富矩阵,涵盖基础语言模型、视觉模型、语音模型等,适用于智能交互、内容创作、数据分析等多元场景。基础语言模型凭借强大的自然语言处理能力,为智能客服、文本生成等场景提供核心支持;视觉模型在图像识别、视频分析等领域发挥关键作用;语音模型则专注于语音交互、语音内容生成,满足不同行业和业务需求。

此次大会上,豆包大模型1.6成为焦点。在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现跻身全球前列。另外,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题,这项能力让豆包进一步具备“行动力”。例如,豆包1.6可以自动操作浏览器完成酒店预订、识别购物小票并整理成Excel表格等复杂任务。

豆包・视频生成模型Seedance 1.0 pro同样表现亮眼。该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度达到行业领先水平。在国际知名评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等优秀模型,为影视制作、广告宣传、内容创作等领域提供了高效的视频生成解决方案。

此外,豆包・实时语音模型的全量上线以及豆包・语音播客模型的发布,也为语音交互带来革新体验。实时语音模型的方言演绎、悄悄话、唱歌等特色效果深受用户喜爱;语音播客模型让双人对话更加自然,具备互相附和、插话、犹豫等播客节奏,可广泛应用于语音内容创作、智能语音助手等场景,进一步完善了豆包大模型家族的全模态能力。

技术撬动“三座大山”

随着大模型智能水平的不断提高,Agent正逐步进入企业核心业务,然而,AI Agent在落地企业核心业务的过程中,仍存在着不少挑战,尤其是AI Agent开发工具的全生命周期管理、多模态数据处理技术以及AI的安全与隐私保护。火山引擎聚焦这些关键问题,在技术层面展开多维度创新,打造出更高效、更安全的AI开发生态。

首先,在智能Agent开发工具方面,火山引擎全新发布的Agent开发套件,实现了从设计、训练到部署的全流程技术革新。以PromptPilot智能提示工具为例,该工具能够深度解析用户意图,并自动构建最优指令路径,将用户模糊的想法通过细致入微的转化过程,系统性地变成AI能够精准执行的专业指令,从而保障模型稳定地输出高质量成果。

其次,多模态数据处理一直是企业面临的棘手难题,火山引擎敏锐地洞察到这一痛点,重磅推出多模态数据湖解决方案,这为企业打造了新一代的AI Native数据基础设施。该方案具备支持GPU+CPU异构计算的强大能力,在数据处理过程中,可显著提升资源的使用效率。同时,它灵活兼容多种开源系统,并融合了Ray、Lance等前沿技术栈,极大地增强了技术实力和应用灵活性。更为关键的是,多模态数据湖能够与火山机器学习平台以及方舟平台实现无缝对接,借助数据智能体的助力,进一步优化分析效率,为企业在数据处理与分析领域带来前所未有的高效体验。

同时,在语义检索增强技术上,多模态数据湖基于向量数据库,运用深度学习中的对比学习算法,将不同模态数据映射到统一语义空间,实现跨模态文献检索效率的答复提升。

第三,在AI安全与隐私保护领域,火山引擎发布的AICC密态计算技术,基于可信执行环境(TEE)技术构建。在CPU/GPU硬件层面,利用英特尔SGX、英伟达NGT等技术,创建受硬件保护的安全区域,实现模型推理全流程密文处理,有效降低了数据泄漏风险。

此外,火山引擎的大模型应用防火墙采用基于深度学习的入侵检测技术,通过卷积神经网络(CNN)对网络请求数据进行特征提取,再利用循环神经网络(RNN)分析请求序列,采用分层漏斗策略,可有效拦截各类prompt注入攻击,提升恶意请求拦截率。

由此可见,火山引擎在智能Agent开发工具、多模态数据处理和AI安全与隐私保护方面都做出了非常全面且有效的探索和落地,不断协助企业实现核心业务的智能化转型。

旧场景新工具

目前,豆包大模型已在汽车、金融、教育等多个行业取得显著应用成果,推动各领域智能化转型。

在汽车行业,梅赛德斯-奔驰与火山引擎展开深度合作。梅赛德斯-奔驰利用火山引擎AI大模型提升智舱信息检索能力及智舱系统反应速度。以往,用户在车内通过语音助手查询信息时,常常面临检索结果不准确、反应迟缓的问题。接入豆包大模型后,通过其强大的自然语言处理和信息检索能力,能够快速准确地理解用户指令,从海量的车辆信息、地图数据、多媒体资源等数据库中精准筛选出用户所需内容,提升了智舱系统的反应速度和信息检索的准确率。此外,在智舱研发环节,借助豆包大模型的数据分析和模拟能力,梅赛德斯-奔驰中国研发团队不断提升“中国速度”,有效缩短了研发周期,降低了研发成本,为客户提供超越期待的体验。

在金融行业,海尔消金联合火山引擎,完成了消金垂直场景下的大模型精调,构建了消费金融垂直大模型,可以满足消费金融场景中90%以上的智能化场景需求,解决了摘录场景下近95%的质量问题。从效率和成本的角度看,日均节约人工1-3小时,客服内容质检率近99%,意图识别准确率超过70%,大幅提高了业务自动化水平和个性化服务的能力,有效降低了金融风险,提升了业务收益。

在教育行业,火山引擎已经与清华大学、北京大学、浙江大学、同济大学、南开大学等超五成985高校达成合作,聚焦大模型在教学、科研、管理和服务等核心场景应用,持续推动高等教育智能化转型。目前,浙江大学依托HiAgent平台,仅用7天时间就高效落地了大模型应用体系——“浙大先生”,该体系集数据整合、文献梳理、科研信息获取与撰写辅助等功能于一体,为师生提供全学科、多语种、多模态数据处理支持,助力高效完成选题分析、资料查找、趋势判断与内容生成,全面提升科研效率与质量。此外,同济大学依托HiAgent平台,搭建校园AI应用创新平台,打造专属智能助手“同济同学”,并基于该平台启动了“同心云”AI应用设计大赛,全面激发师生参与热情,推动AI能力自主开发与场景落地。

除了上述行业内的应用落地之外,随着大模型能力的不断进步,字节跳动内部也已经在探索和上线AI编程产品——TRAE(“The Real AI Engineer”)。

FORCE原动力大会_火山引擎_豆包大模型-1

字节跳动技术副总裁洪定坤

字节跳动技术副总裁洪定坤提到,在字节内部,超过80%的工程师在使用TRAE辅助开发,TRAE的整体月活用户已经超过了100万。这充分展示了火山引擎的技术在实际应用中的强大影响力和广泛接受度。

智能Agent的三个趋势

随着人工智能技术的持续发展,智能Agent作为AI技术与行业应用深度融合的产物,正迎来关键的发展机遇期。Gartner在其2024年发布的相关报告中,将Agentic AI列为2025年十大技术趋势之一,并预测到2028年,至少15%的日常工作决策将借助Agentic AI自主完成。由此可见,智能Agent将成为推动企业数字化转型的核心驱动力之一,其发展将呈现出多模态融合深化、边缘智能协同加强、自主学习与决策能力提升等显著趋势。

第一,多模态融合将呈现从感知到认知的跨越。当前,虽然部分AI模型已具备多模态处理能力,但在模态间信息深度融合、复杂场景理解等方面仍存在局限。有多项研究显示,通过构建统一的多模态表征空间,结合注意力机制与图神经网络技术,智能Agent能够更精准地理解不同模态信息间的关联。未来,智能Agent将实现从“多模态感知”到“多模态认知”的跨越。例如,在智能客服场景中,Agent不仅能处理用户的文本、语音咨询,还可结合用户上传的图片、视频资料,甚至社交媒体上的情绪数据,提供更个性化、全面的解决方案。

第二,边缘智能协同实现实时响应与隐私保护的平衡。随着物联网设备的普及,大量数据在终端产生,将所有数据传输至云端处理不仅面临高延迟问题,还存在数据泄露风险。边缘智能技术使智能Agent能够在靠近数据源的边缘设备上完成数据处理与决策。根据IDC预测,到2026年,全球75%的数据将在边缘侧完成处理。边缘计算环境下的数据本地化处理,有效保障了企业核心数据的隐私安全,符合日益严格的数据合规要求。

第三,从被动执行到主动进化的自主学习与决策。传统Agent多依赖预先设定的规则与训练数据,而新一代智能Agent将结合强化学习、元学习等技术,实现动态环境下的自主学习与策略优化。DeepMind的研究显示,通过基于环境反馈的持续学习,智能Agent在复杂游戏、机器人控制等任务中的表现不断超越人类专家。在商业领域,智能Agent可自主分析市场动态、用户行为数据,实时调整营销策略,为企业创造更大价值。

在本次火山引擎FORCE原动力大会上,众多创新成果的展示令人印象深刻。智能Agent的发展正处于技术突破与行业应用的关键阶段,多模态融合、边缘智能协同、自主学习与决策等趋势将重塑各行业的发展格局。

尽管在技术成熟度、伦理规范等方面仍面临挑战,但随着技术的不断进步与生态的逐步完善,智能Agent有望为全球经济社会发展带来深远变革,成为推动人类社会向智能化时代迈进的核心力量。


来源:数据猿

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

火山引擎发布豆包大模型1.6;阿里千问3登顶全球开源模型榜首;腾讯云数据库TDSQL获得中国专利金奖丨每日大事件
火山引擎发布豆包大模型1.6;阿里千问3登顶全球开源模型榜首...
火山引擎发布豆包大模型1.6,加速Agent大规模应用
火山引擎发布豆包大模型1.6,加速Agent大规模应用
华为:昇腾AI计算平台训练出准万亿MoE模型;百度在山东成立人工智能公司;抖音在杭州成立火山引擎科技公司丨每日大事件
华为:昇腾AI计算平台训练出准万亿MoE模型;百度在山东成立人...

我要评论

数据猿微信公众号
第22届国际物联网展
返回顶部