从东北小城走出的AI语音破局者——魏佳星与云蝠智能的 “背水一战”
原创 俊驰 | 2025-11-27 16:37
【数据猿导读】 近日,在南京VoiceAgent实时语音大会上,云蝠智能带着VoiceAgent 2.0惊艳亮相!虽在众声喧哗的智能语音赛道中音量不算最大,但这家公司的资历与积淀,绝不容小觑。
“在智能语音的世界"声"级打怪!
近日,在南京VoiceAgent实时语音大会上,云蝠智能带着VoiceAgent 2.0惊艳亮相!虽在众声喧哗的智能语音赛道中音量不算最大,但这家公司的资历与积淀,绝不容小觑。
云蝠智能成立于2018年,其名取自自然界的声音大师——蝙蝠,命名之中,已可见其在语音领域的雄心。七年深耕,迎来此次重大产品升级。我们清晰看到,两次AI革命能量正叠加于语音领域:第一次让机器“能听会说”,第二次则让其“能理解、会决策”。
选择:初次创业折戟沉沙
盘锦,一座因石油而兴的东北小城。如果不出意外,年轻的魏佳星将会继续延续父辈的轨迹——成为一名石油工人。然而,命运的齿轮在某个时刻开始转动,“像是基因突变”,这个普通高中的普通学生突然意识到,自己的人生不该只有石油工人这一个选项。

通过全力拼搏,魏佳星考入一所211大学,然而还来不及高兴,他就听到了一个颇具黑色幽默的消息:他所学的印刷工程专业即将被取消,他们将成为该专业的“末代毕业生”。学还上着,专业没了,没有比这更明显的就业前景说明了。魏同学转身就给自己换了剧本——一头扎进代码和设计的世界,凭借一股狠劲,竟自学成才。后来云蝠智能第一代Logo,便出自这位“印刷末代专业”学子之手。
2015年,在阿里巴巴工作的魏佳星,做出了一个让人意外的决定——从阿里离职创业。这个只有22岁的“毛头小子”,一头扎进了当时热火朝天的“双创”浪潮,准备在创业大潮中搏击风浪。
可惜理想很丰满,现实很骨感。第一次创业折戟沉沙,魏佳星第一次尝到了现实的苦涩。2018年,站在人生的十字路口,他没有选择退回职场的老路,而是决定“在哪里跌倒,就在哪里躺一会儿想想”。这一想,竟和当年雷军的顿悟如出一辙:不是拼得不够狠,而是赛道完全选错了。
转身:闯入AI语音赛道
找回沟通的“出厂设置”
可新的赛道究竟在哪里?就在他四下张望之时,时代的聚光灯,正巧打在了“人工智能”的舞台上。
那一年,AI世界热闹非凡:
技术上,最后一届ImageNet挑战赛刚落下帷幕,深度学习神经网络大放异彩,AI的技术路径已然清晰,就像一场“毕业典礼”,标志着AI正式出师。
产业上,AI不再只是实验室里的炫技,而是大步走进了寻常百姓家。尤其是智能语音,它化身为智能音箱,像亚马逊的Echo、谷歌Home,以及国内小米、天猫精灵等产品,纷纷叩开了千家万户的门。
“人工智能+语音”这道时代的光,不偏不倚,正好照进了魏佳星迷茫的世界里。
“语音是人类最自然的交互手段,它剥离了所有额外的交互层,直达沟通的本质。在传统的人机交互中,无论是命令行、图形界面还是触摸屏,人类都需要学习和适应机器的规则。唯独语音不需要。”魏佳星如是说。
想想看,无论是面对命令行、图形界面还是触摸屏,人类总得“迁就”机器的规则,得学习、得适应。但语音不一样,它甩开了所有中间环节,不需要额外设备,也不用记任何操作逻辑。
只有语音,能够让人类能够以最自然、最直接的相处方式,与机器相处。
于是,在身无分文、只剩三个人的情况下,他决定背水一战——做智能语音交互。
有了第一次的失败,“东山再起”的魏佳星多了一份从容和坚定。2019年,他拿到了鼎鼎大名的陆奇博士的投资。当时陆奇向他抛出了一个开放式的问题:“通用人工智能什么时候会来?”答案是“2030年”。魏佳星想,就算等到2030年,自己也才38岁,等得起。但幸运的是,这项技术提前8年到来——2022年,大模型时代开启了。
事实上,再次出发的魏佳星冥冥之中,精准地踩在了智能语音技术与产业“双爆发”的节奏上。一方面,人工智能技术正在经历从机器学习到大模型的时代交替,另一方面,智能语音的消费级市场发展得风生水起,从苹果Siri启蒙市场,到小米、百度等智能音箱,再到汽车、手表、电视、冰箱纷纷嵌入语音助手,智能语音已经深度渗透人类社会。
从此,魏佳星带领着云蝠智能的团队,在智能语音的赛道猛扎下去,一走就是七年。
突破:VoiceAgent 2.0
从“听见”到“听懂”
近日,在南京VoiceAgent实时语音大会现场,云蝠智能迎来了发展历史上一次重大升级,VoiceAgent 2.0版本重磅发布!

据介绍,本次版本更新主要在技术底层(延迟、拟人、识别)、智能体(幻觉控制、注意力、工具调用)、操作性(CUI界面、AI FDE、Voice IDE)和渠道(C端个人助手及网页客服)进行了全栈升级。
云蝠智能2.0版本在以下维度实现全面升级:
语音识别与合成
•支持四川话、粤语等多种方言
•声音延时接近一档标准,情感表达涵盖高兴、悲伤、害怕等多情绪
•实现边输入边思考的并行计算模式
对话理解与记忆系统
•构建基于上下文和用户记忆的复杂业务处理能力
•AI具备“职业记忆”、“关系记忆”,形成个性化知识库
•可处理医疗、客服、催收等高复杂度场景
自动化构建与测评体系
•用户只需上传PPT或资料,即可自动生成AI客服
•系统自动抽取业务实体、构建知识库、生成提示词逻辑
•引入多AI平行测试机制(通义千问、豆包、DeepSeek等),对对话体验进行客观打分与优化
全渠道部署能力
•不仅限于电话端,还可集成至网页、企业微信、钉钉、飞书等平台
•支持C端个人手机部署,实现全天候电话接听与信息处理
重构:AI重塑业务与商业模式
☆业务模式:让“不划算”的生意成为可能
如果说技术革新是这场变革的表象,那么业务模式的创新和商业模式的颠覆才是其真正的内核。
在业务模式上,最直观的变化在于:AI正在让原本“不划算”的生意,成为一门好生意。
魏佳星一语道破天机:“所有单次沟通利润低于100元的事情,在过去根本无法通过人工完成。”那些曾被判“商业死刑”的场景——催缴30元停车费、接听利润仅二三十元的收废品电话,如今在AI这里重获新生。
这背后是AI独特的盈利逻辑——“单笔收益虽低,但海量规模就可实现薄利多销”。这个不知疲倦的数字员工可以7×24小时持续工作,用规模化覆盖弥补单次收益的微薄。
在我们尚未察觉时,这种模式已悄然渗透进生活的各个角落:
比如政务热线领域,AI轻松实现了人工座席难以企及的“全天候待机”;医疗系统中,AI外呼更是大显身手——某医疗系统的实战数据显示,人工月通话146通,AI上岗后直接飙到360+通,效率翻倍不说,还从不抱怨。
VoiceAgent 2.0展现出了“情绪稳定”的绝对优势——直接将回款率从人工的36%-48%拉升到72%。魏佳星分析说:“人类接线员面对日复一日的压力和难缠的对话,难免会有情绪波动,容易挂断电话;而AI能始终保持耐心,不管对方言词多么激烈和难听,AI都能心平气和地说,‘您慢慢想,您慢点说’,显著提升留存率。”
☆商业模式:从软件销售到效果付费
软件行业的收费模式经历了两次进化:从传统本地部署的“买断制”,到SaaS时代的“订阅制”。但无论哪种模式,软件商都无需为使用效果负责。
而今,AI正在催生第三次变革——“结果即服务”(Results as a Service, RaaS)。这种模式下,服务提供方需要承担系统建设与技术更新的全部责任,客户只需为最终效果付费。这不仅是收费方式的变化,更是风险共担、收益共享的全新合作范式。
云蝠智能毅然摒弃传统软件销售模式,全面转向按效果付费。在金融场景中,他们承担所有软件成本、运营商费用和人力交付成本,客户只需为成功收回的款项支付佣金。
“这本质上是‘劳动力’的报价逻辑,而非‘软件’的报价逻辑。”魏佳星强调。这种模式彻底重构了客户与供应商的价值分配机制,将双方利益紧密捆绑。
进化:从“数字员工”到“数字组织”
这种“合伙人”模式,对科技公司提出了前所未有的能力要求。它们不再仅仅是工具提供者,而是要化身为一支可按需调用、按效果付费的“虚拟团队”。这倒逼企业必须完成三大蜕变:
•重构研发体系,从固定工作流向Agent驱动的智能架构演进
•重塑人才能力,工程师必须懂业务、近用户,否则将被AI替代
•转变服务视角,交付的不再是冰冷工具,而是“即插即用、高度专业的虚拟员工”
云蝠智能的愿景,正是推动AI从单个的“数字员工”向一个完整的“数字员工组织”进化。未来的AI呼叫中心,将不再是一个简单的工具集合,而是一个高度智能的有机体——前台的客服AI、销售的AI、甚至老板的AI决策官,基于工作流深度协同,形成一套高效运转的数字公司。
“我们预见,三年内,纯粹的‘打电话’类职业将不再需要人类担任。”魏佳星预测,当沟通仅依赖声音通道,且工作内容高度流程化时,AI没有理由做不到。
魏佳星始终将自己定位为产品经理而非CEO,强调“如果你从劣币开始,就应该把这件事情做成一个你自己想要做好的事情”。
梦想:梦想不辜负热血
从七年前写下“计算,为了无法计算的情感;声音,终将无处不在”,到如今VoiceAgent 2.0正式发布,魏佳星带领云蝠智能走过了从“被托举”到“自驱动”的历程。2022年,ChatGPT让知识获取成本趋近于零;2025年,新模型让“能动性”成本趋近于零。在这个知识价值递减的时代,云蝠智能正致力于让AI从“会说话的工具”进化为“有思想的生命体”。
正如魏佳星所说:“儿时的热血梦想,总不愿被时光辜负。”在AI浪潮中,这位从东北小城走出的创业者,正用自己的方式,让世界听到中国语音智能的声音。
来源:数据猿
我要评论
不容错过的资讯
大家都在搜
















