DeepSeek的流行就像一颗超新星爆发,释放出巨大的能量,瞬间照亮了中国的AI星系。稀宇科技是上海人工智能的明星(MiniMax)是相当亮眼的那一个。
DeepSeek擅长文字,而MiniMax则在文字、视频和语音多模态技术领域处于领先地位。MiniMax的海螺AI视频网站在今年1月的全球AI视频产品榜上排名第一。这家上海公司如何在世界上竞争最激烈的领域,一步步提高竞争排名,在细分赛道上超越顶级同行?
用一张照片“拍”电影。
用人工智能生成视频是许多人愿意尝试的应用。然而,人工智能的技术缺陷也引起了很多嘲笑:“张三在最后一段视频中生成,下一段视频变成了另一张脸。无论如何调整,两段视频的主角都不可能成为同一个人。“角色一致性的问题使人工智能难以制作同一角色和不同故事情节的短片,极大地限制了人工智能制作视频的应用场景。直到今年1月,MiniMax发布了一个新的视频模型,彻底解决了这个问题。用户只需提供一张角色的正面照片,无论生成多少不同风格的视频,主角都是这个人。这让网友们惊呼,一张照片就能拍电影,这不是梦!MiniMax在创业过程中始终坚持技术驱动。如何在动态视频中保持人物面部多角度的真实性和稳定性,如何保持人物角色的高度一致性...痛点是MiniMax攻关的重点。开发团队进行了大量的技术探索,选择了不同的技术路径,最终开发了S2V模型——只有1%的传统方案输入和计算成本,“上传一张图片”的效果就足够好了。三年多来,文生视频、图生视频、主体参考等功能不断优化。这些创新使海螺AI视频在激烈的竞争中脱颖而出,Sora的用户数量超过了OpenAI,分布在世界200多个国家和地区。MiniMax在文生语音等功能上也走出了差异化路线。网民们发现,MiniMax的语音功能实际上具有情绪调节和效果器功能,人工智能产生的语音可以带来快乐、悲伤、愤怒等情绪,这一创新大大提高了有声书籍和广播剧的生产力。“通用人工智能不是简单的互联网流量变化,而是计算范式的颠覆性创新,将引领生产力、社会分工和产业结构的深刻变化。MiniMax创始人严俊杰说。
画出自己的图纸来建造建筑。
计算能力、算法和数据是人工智能发展的“铁三角”。在MiniMax成立之初,计算能力和数据都非常有限,唯一的选择就是在算法上寻求突破。从2023年夏天开始,公司将80%的计算能力和研发资源投入到底层架构的研发中,这在外人眼里就像一场赌博。“我们在项目中遇到的许多问题源于黑暗的未知。“在没有成熟经验可供借鉴的情况下,公司技术团队一次又一次地尝试和犯错,并继续探索。一年后,公司成功推出了基于MoE架构的模型,R&D人员对“注意机制”问题产生了影响。今年1月,大规模实现线性注意力机制的MiniMax-01模型诞生。这是中国公司首次突破传统Transformer架构,并逐渐得到业界的广泛认可。
“底层模型能力是决定大模型应用成功的主要因素。MiniMax副总裁刘华告诉记者,尽管按照现成的图纸建造建筑物相对容易,但缺乏图纸也会限制建筑物的高度。我们选择用自己的图纸建造建筑,一开始可能比较慢,但希望能更好地应对未来的挑战。底层结构就像人工智能的“新基础设施”,MiniMax-01模型突破了长文本处理的瓶颈,可以高效处理最长400万token(词元)的上下文。在工业领域,该模型可以快速分析数百万字的设备日志,辅助故障诊断;在医疗场景中,它可以跟踪患者多年的病历,生成个性化的治疗方案。近两年来,大模型技术迭代迅速,国际国内人工智能产业白热化竞争。一个重大迭代的底层模型对产品的优化效果将远远超过在工程实现层面上“雕刻”产品。这也是MiniMax一直关注模型本身并加速迭代升级的一个重要原因。
借助上海的优势,加快发展。
MiniMax作为上海人工智能高地孵化的代表性企业,其成长离不开这座城市独特的文化和基因。上海汇集了世界顶尖的人工智能人才,大量热情的年轻人才,为行业的快速发展提供了支持。在MiniMax上海总部大楼,研发人员继续增加。2023年6月,还只有一层楼坐了半层楼,然后很快就坐满了两层楼。从人工智能产业发展的角度来看,成功的模式源于科学的工作方法、数百人技术团队的有效组织和诚实扎实的研发文化。不久前,上海在计算能力、场景、数据、人才等方面推出了人工智能“模塑申城”实施方案。上海还积极推动大型企业与现场企业的对接。以MiniMax为例,他们与小红书合作,打造生成式智能搜索,与阅文集团合作,将数千部小说变成超自然、高保真的有声书,通过相互授权实现更快的发展。严俊杰认为,“真正有价值的事情不是现在做的,而是技术进化的速度。“就像多年前的移动互联网行业一样,民营科技企业在人工智能的快速迭代行业中表现出了独特的价值,即在技术驱动下实现快速发展,以灵活的机制捕捉前沿趋势,以务实创新解决行业痛点。上海人工智能产业规模已超过4000亿元,企业规模超过350家。仅“模速空间”及周边地区就聚集了255家大型企业和34家备案大型模型。上海的人工智能宇宙正在加速增长,更令人兴奋的故事正在继续。