靠谱的配资开户网
发布日期:2025-04-11 22:31 点击次数:200

股票配资好牌子推荐 架构重塑、LazyLLM开源、助手升级,这两家企业加速大模型创新

股票配资好牌子推荐 架构重塑、LazyLLM开源、助手升级,这两家企业加速大模型创新

股票配资好牌子推荐

今年春节期间,DeepSeek爆火出圈,也让科技圈持续升温。本周,备受瞩目的2025全球开发者先锋大会(GDC)将在上海开幕。昨天,记者探访商汤科技与MiniMax两家人工智能领域的代表性企业,了解它们在人工智能赛道上的创新实践与前沿探索。

商汤科技大厦内景。 本报记者 邢千里摄

商汤科技双创新:编程助手2.0 + 开源框架 LazyLLM

早在2023年,商汤科技就已推出基于“日日新Sensenova”大语言模型打造的软件智能研发助手“代码小浣熊”,覆盖软件需求分析、架构设计、代码编写、软件测试等环节,满足用户代码编写、编程学习等各类需求。

然而,企业内部拥有大量代码资产、管理规范、代码仓库及外部工具的调用等复杂需求,这使得现有的解决方案面临着挑战。因此,商汤科技将在此次全球开发者先锋大会上发布全新的代码小浣熊2.0 版本,标志着其编程助手功能的重大升级。

商汤科技产品总监及“小浣熊家族”产品负责人贾安亚表示,代码小浣熊2.0不再仅仅执行简单的代码补全和问答交互功能。它能够跨文件进行多个任务修改,支持更多具体的开发流程操作,为开发者提供更全面的编程辅助能力。

此外,代码小浣熊2.0还扩展了其服务对象,不仅局限于个人用户。它已经成为一个完整的企业级解决方案,能够帮助企业进行代码资产管理、筛查以及后续的开发优化迭代。贾安亚提到:“从过去单纯的个人生产力工具,到现在全面覆盖企业级软件研发的端到端解决方案,代码小浣熊2.0已经脱离了原有的功能限制。”

为了进一步提升用户体验,商汤科技还将其办公小浣熊与代码能力进行了深度整合。用户现在可以利用代码模型帮助完成更广泛的日常工作,包括文档处理和数据分析等任务。无论是个人用户、小团队,还是企业客户,都能够通过办公小浣熊高效进行任务分析、调研与报告生成。商汤科技将在此次开发者大会中的大模型生产力分论坛上分享更多实际用户的经验,并为现场观众提供应用体验。

在另一个创新方面,商汤科技还介绍了即将在大会上亮相的开源应用开发框架LazyLLM。该框架专注于数据为核心,支持应用开发过程中的数据迭代,从而不断提升数据效果。商汤大装置产品总监刘叶枫解释道:“LazyLLM的设计理念是简化开发流程,开发者可以像搭积木一样将意图识别、知识库检索、大模型能力等模块快速拼接,实现完整的应用。”通过这一框架,开发者能够更加高效地将智能体应用部署到不同平台上,包括网页、企业微信、钉钉等。

LazyLLM不仅支持跨平台和多操作系统,且利用轻量网关能够实现分布式应用的一键部署。刘叶枫指出:“借助LazyLLM,开发者能够更快速地完成应用的微调和功能串联,显著缩短开发周期。”例如,开发一个多模态客服问答机器人时,传统方法可能需要花费一周时间进行模型微调和功能整合。而通过LazyLLM平台,客户可以通过低代码拖拉拽的方式迅速完成各种功能开发,让开发过程更加高效。

谈及DeepSeek对行业的影响时,贾安亚表示,其不仅让更多人感到AI技术的巨大潜力,也让企业和个人逐步意识到AI在各行各业中的应用价值,对于AI生态的蓬勃发展无疑是个利好消息。

“商汤科技会博采众长,借鉴行业内的优秀实践经验,例如:如何提高推理效率、优化强化学习等,最终将这些创新转化为客户价值,更好服务B端和C端用户。”贾安亚认为,商汤科技的产品策略是开放和灵活的,单一模型无法覆盖所有场景,商汤会根据用户对性能、体验的不同需求,综合考虑并组合多种模型和接口,以提供最佳的用户体验。

MiniMax:重塑模型架构

今年1月,MiniMax发布并开源新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型使用多项突破性创新,以大规模应用线性注意力机制打破Transformer传统架构记忆瓶颈,在综合性能比肩GPT-4o、Claude-3.5等海外头部大模型的基础上,能高效处理高达400万token的输入,可输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

成立于2021年的MiniMax是目前国内领先的科技创业公司,致力于开发涵盖文本、图像、语音&音乐、视频等的多模态大模型,并打通产品全链路。公司凭借其创新的技术实力和前瞻性布局,迅速在人工智能领域崭露头角。

MiniMax副总裁刘华表示,高水平模型的开源能够让普罗大众免费体验优秀大模型的技术能力,从而推动人工智能技术的普及和渗透率的提升。同时,开源还能吸引更多开发者参与,共同推动大模型行业快速发展。“MiniMax也将继续开源,并期待通过开源让更多国内开发者参与打造非Transformer架构的模型生态,在模型底层架构方面加快自主创新。”

针对近年来关于“大模型是否撞墙”的疑虑,刘华认为,大模型技术仍处于快速发展阶段。“大模型技术保持着每隔几个月就会取得重要突破的迭代频率,比如Sora、4o、o系列模型等。”他指出,未来2至3年,除了增加训练和推理算力的Scaling Law外,Transformer架构变化的算法创新、合成数据、强化学习、多模态融合等技术,都将为模型能力带来几倍量级的提升空间。

刘华还提到,创业公司在中国大模型领域将继续发挥重要作用。大模型研发框架的敏捷迭代要求研发人员对技术变革抱有极致热情,而不能仅仅依赖过去的经验,这也是DeepSeek能够脱颖而出的重要原因之一。“无论是大厂还是创业公司,只要组建起成规模的高效研发团队,就一定能为行业发展作出重要贡献。”他表示,大量聘用年轻研究员并充分授权,打造科学的研发组织体系,是组建高效大模型研发团队的唯一路径。

此外,刘华认为,中国企业在算法创新方面取得显著进展。例如,DeepSeek在强化学习、小模型蒸馏、MOE(混合专家模型)等领域开展大量创新,使其在全球范围内迅速走红。而MiniMax的视频生成模型也处于领先地位。“在文本模型领域,OpenAI和Google很快推出了能力更强的模型。尽管中美之间的技术差距正逐步缩小,但中国大模型尚未实现超越。”他表示,中国大模型企业的发展仍需更多支持,包括技术研发、人才培养以及政策扶持等多方面。

据悉,在此次大会上股票配资好牌子推荐,MiniMax将通过多场主题分享、圆桌对话,共同探讨大模型开源技术的最新发展、多模态大模型在各行业的应用落地、人工智能在智能硬件等领域的创新实践、智能硬件转型升级等话题。

推荐资讯
友情链接: