十年磨一剑:智象未来如何用原生全模态重新定义世界模型
2015年,当我第一次接触生成式AI时,行业还在讨论GAN与VAE的优劣。十年后的今天,智象未来用超5亿元融资和一套独创的原生全模态世界模型,向世界证明了中国AI的技术厚度。这不是一篇普通的融资报道,而是一次技术路线的深度拆解。
从图像生成到世界建模的技术跃迁
智象的技术演进史,就是一部多模态生成的技术简史。2024年5月,公司上线全球首个开放使用的视频生成DiT架构模型,比行业主流玩家早了整整半年。更关键的是,智象在全球首次推出“扩散自回归”(Diffusion+AR)模型架构,将生成质量、时序一致性与可控性推向新的行业上限。
HiDream-I1开源图像生成模型在ArtificialAnalysis榜单上线24小时内登顶,成为首个取得领先位置的中国自研生成式视觉模型。HiDream-E1.1图像编辑模型进入第一梯队,多项指标超越Flux.1Kontext。全球社区下载量超过200万次,业界将其视为图片模型领域的DeepSeek。
原生全模态:下一代竞争的核心战场
当前行业存在一个致命误区:用视频生成模拟物理世界。智象认为这是错误的起点。真正的下一代大模型,必须以统一架构对真实物理世界进行“原生性”和“全模态”的统一建模。
原生全模态世界模型不是简单叠加图像、视频、语音或文本能力,而是围绕真实世界的表达、理解与生成,构建同时具备三大核心能力的新一代世界模型:全模态表达、因果推演、物理世界构建。这三个能力缺一不可,共同构成真正的世界模型底座。
商业闭环:从技术领先到营收爆发
技术领先不等于商业成功,但智象做到了两者兼顾。公司构建的"1+1+3"商业化全景已见成效:以HiDream系列大模型为底座,TokenHub平台提供标准化输出,商业营销、影视创作、社媒内容三大场景全面覆盖。
2026年第一季度营收已超去年全年,多条业务线高速增长。TikTok官方前五大AI合作伙伴、5000分钟短漫剧制作、3000万专业用户、百万级付费用户——这些数字背后是技术产品化的完整闭环验证。
生态布局:构建AI时代的护城河
单点技术突破容易被复制,生态壁垒才是真正的护城河。HiHarness平台整合算力+模型+工具,TokenHub接入全球主流生态大模型实现统一调度,创新的Skills体系将企业行业经验封装为可复用智能体能力单元。
具身智能领域与诺亦腾机器人合作解决VisionGap问题,生命科学领域与百图生科共建虚拟细胞模型,从宏观世界到微观分子、从虚拟生成到真实交互的物理AI应用版图已经展开。
这轮融资的真正意义不在于资金本身,而在于资本市场用真金白银投票认可了一个事实:智象未来的技术路线,是通往下一代AI的正确路径。

