腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
为此,今天要给大家介绍一款谷歌的开源项目LangExtract,不仅是一个工具,更是一套面向真实场景的 ...
其核心思想是借鉴计算机科学中的“外存算法” (Out-of-core algorithms),不要把长 Prompt 直接喂给神经网络,而是把它放在一个外部的 Python REPL 环境里。 Prompt 被加载为环境中的变量context 。模型不再像以前那样生吞整个字符串,而是通过编写代码(如len (context) , context.split , re.search )来按需读取数据 ...
大家好,我是已经摆烂了好几天的冷逸。今天上号了,给大家带来一篇 AI手机 的部署教程,手把手教学,教不会退网。最近我开始琢磨 ROI 的事情,不知道是在哪个地方看到了这样一句话:提高自己高 ROI 的付出,减少自己低 ROI 的内耗。ROI ...
scons ( 2.3.0 ) ant ( 1.8.2 ) Python ( 2.7.3 ) PostgreSQL ( 9.3.4 ) Linux x86-64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ( 3.81 ) kernel ( 3.0.13-0.27-default ) Linux PPC64: g++ ( 4.3.4 ) gcc ( 4.3.4 ) make ...
在本文里,将在AndesAIRE平台上实践自带模型(BYOM)流程,它是从模型开发、ONNX导出、API设计、交叉编译,到在RISC-V上部署与推论的完整流程。此流程展示了AndesAIRE I370平台在灵活整合外部模型与支持多元运行环境的优势。
如果你让AI随便生成Bug,它大概率会产生幻觉,为此SSR设计了一套如同安检般严格的一致性验证(Consistency Verification)流程。 逆向变异测试(Inverse Mutation ...
“半个宇宙”创始人为阿里巴巴前安全技术团队负责人、研究员吴翰清(花名“道哥”)。在创立半个宇宙之前,吴翰清曾在阿里云创始人王坚博士的团队中工作,是阿里云初创团队成员。自2020年开始,他就开始关注人工智能领域,做过云游戏、云渲染等业务,负责阿里云的网 ...
Looking ahead to the 15th Five-Year Plan period, Sargent underscored the importance of planning in China’s economic governance. China’s Five-Year Plans, he said, provide a clear and continuous ...
【本文由小黑盒作者@idea小时于12月30日发布,转载请标明出处!】 Introducing Inferri: Navigate the AGI Era. Inferri官网 互联网上每天诞生成百上千个 AI ...
字节跳动旗下AI编程工具TRAE近日发布2025年度产品发展报告,全面呈现其在全球开发者生态中的突破性进展。这款以智能代码补全为核心功能的工具,经过持续迭代升级,已形成覆盖全流程开发的Agent协作体系,用户规模与活跃度均呈现爆发式增长态势。
就在昨天,新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆(Memory)综述。 当前的 LLM 应用开发正面临严重的“记忆碎片化”问题:我们有用于短期记忆的 KV Cache,有用于知识检索的 RAG,还有用于长期交互的 MemGPT 类架构,但缺乏统一的理论指导。这篇综述不仅是对现有工作的盘点,更是一份解决“灾难性遗忘”与“上下文溢出”的系统方案。它详细 ...