
跃问作为阶跃星辰旗下的核心产品,在 2025 年实现了技术架构的重大升级。其底层集成了自研的 Step 系列千亿参数大模型,包括 Step-1 语言模型和 Step-1V 多模态模型,同时接入了 DeepSeek R1 推理模型,形成了互补性技术体系。这种双引擎架构带来了独特优势:在处理文本推理时调用 DeepSeek R1 的逻辑能力,而多模态任务则由自研的 Step-1V 模型主导,例如上传产品原型图和专利文档后,系统可自动生成技术交底书框架,实测效率提升显著。
在日常办公场景中,跃问的多模态能力展现出强大的赋能价值。其「创意板」功能允许用户通过自然语言描述生成个性化应用,无需编程基础。例如,输入 “生成一个客户满意度调查工具”,系统会自动生成包含问卷设计、数据统计和可视化分析的完整应用,可直接在手机或电脑上运行。这种零代码开发模式极大降低了企业数字化门槛,尤其适合中小型团队快速搭建业务工具。
在学术创作中,跃问的多模态交互能力解决了传统工具的痛点。上传 PDF 格式的英文文献后,系统可快速生成中文核心观点总结,并自动提取关键数据制作图表。对于复杂的实验数据,用户拍摄实验装置照片并描述需求,跃问能解析图像中的设备参数,结合文献库生成实验方法优化建议,甚至模拟不同变量下的实验结果。
2025 年,智能体协作成为职场和学术场景的新趋势,跃问在这一领域展现出前瞻性布局。其与吉利汽车、OPPO 等企业合作开发的智能终端 Agent,可在汽车、手机等设备上实现多模态交互。例如,在智能汽车中,用户通过语音指令 “查询附近充电桩”,系统会结合地图数据和实时交通信息生成导航路线,并同步推荐周边餐饮服务。
与 DeepSeek、ChatGPT 等工具相比,跃问在多模态交互领域具有显著差异化优势。其自研的 Step-1V 多模态模型在 “司南” 评测中位列第一,性能对标 GPT-4V,尤其在中文语境理解和东方美学生成上表现突出。例如,生成中国风视频时,系统能精准把握水墨山水、汉服等元素的意境,运镜和色彩搭配更符合本土审美。
对于职场用户,建议优先利用跃问的复合型任务处理能力。例如,在项目汇报前,上传 PPT 草稿和相关数据图表,系统会自动生成演讲大纲并添加动态图表,同时调用搜索引擎补充行业最新数据,使汇报内容更具说服力。在团队协作中,通过云端实时协作功能,多人可同时编辑文档并接收智能批注,显著提升沟通效率。
跃问多模态交互在 2025 年的表现堪称惊艳,其技术创新和场景落地能力为职场和学术创作带来了革命性变化。无论是企业级的高效协作,还是学术研究的深度探索,跃问都展现出强大的赋能价值。尽管在某些细节上仍有改进空间,但其整体表现已足以成为 2025 年智能服务领域的标杆。随着技术的持续迭代,我们有理由期待跃问在未来带来更多惊喜。