2026-02-10 08:00:00
LongCat-Flash-Lite是一款拥有 685 亿参数,每次推理仅激活 29 亿~ 45 亿参数的轻量化 MoE 模型。通过将超过 300 亿参数高效用于嵌入层,LongCat-Flash-Lite 不仅超越了参数量等效的 MoE 基线模型,还在与同规模现有模型的对比中展现出卓越的竞争力,尤其在智能体与代码领域表现突出。
2026-02-02 08:00:00
LongCat-Flash-Thinking-2601模型创新性地打造了 “重思考模式” ,通过并行推理与深度总结,实现推理宽度与深度的协同扩展,显著提升复杂交互与多步规划任务中的表现。
2026-02-02 08:00:00
值此马年春节来临之际,我们精选了过去一年美团技术团队微信公众号发布的 40 多篇优质技术文章,精心汇编成一本 500 多页的电子书。谨以此作为一份特别的新年礼物,献给每一位热爱技术、持续探索的同学。
2026-01-26 08:00:00
美团技术团队推出了 EvoCUA 模型并在 Github、Huggingface 开源,通过构建可验证数据合成引擎与十万级并发的交互沙盒,将训练范式从传统的“静态轨迹模仿”转变为高效的“经验进化学习”。
2026-01-20 08:00:00
美团 LongCat 团队正式对外发布并开源 LongCat-Flash-Thinking-2601。作为已发布的 LongCat-Flash-Thinking 模型的升级版,LongCat-Flash-Thinking-2601 在 Agentic Search(智能体搜索)、Agentic Tool Use(智能体工具调用)、TIR(工具交互推理)等核心评测基准上,均达到开源模型 SOTA 水平。
2026-01-13 08:00:00
美团质效技术部联合复旦大学周扬帆教授团队推出 KuiTest——零规则 UI 功能性异常测试工具。KuiTest 通过将“人类预期”直接用作 Test Oracle,解决了长期以来 UI 测试 Oracle 泛化性差的自动化痛点。实验表明,KuiTest 异常召回率达 86%,误报率仅 1.2%,已在执行 21 万+测试用例,发现百余例有效缺陷,大幅降低人工成本并提升测试覆盖率。