Geek头条(2026-04-09)

  • [字节跳动技术团队]重磅发布|Scale‑SWE 构造 10 万级真实 SWE 数据集,火山引擎沙箱底座重塑代码智能体训练

    本文报道了字节跳动技术团队与中国人民大学高瓴人工智能学院合作,发布 Scale‑SWE 数据集,实现了 10 万级真实 SWE(Software Engineering)任务数据的规模化构建。通过火山引擎的高并发 Sandbox 基建,研究团队构建了基于多 Agent(EBA、UCA、PSWA)的工作流,在 5000 并发 Sandbox 资源上 1 小时完成原本需 1 个月的数据生成,保证了环境配置、单元测试生成和问题描述的完整、真实且分布均衡。基于该数据集蒸馏的 Qwen3‑30A3B‑Instruct 模型在 SWE‑bench‑Verified 中取得 64% 的成绩,超越同规模工业基准模型,验证了高质量真实数据与强大基建的协同效应。文中进一步分析了以往 SWE 数据扩展的瓶颈(基础设施并发、环境复杂度、单元测试稀缺、问题描述严谨性),并展望 Scale‑SWE 将降低研究者入门门槛,提供可直接使用的大规模开源数据,推动 Code Agent 在真实 GitHub 场景中的进一步发展。全文约 180 字。

  • 从 1960 到 2026:一文看透 Java、Go、Python 垃圾回收器的原理与演进 - Tony Bai

    本文回顾了从1960 年 McCarthy 提出的标记‑清除算法,到 1992 年 Wilson 对垃圾回收技术的分类学,再到现代 Java、Go、Python 的 GC 实现。文章解释了标记‑清除、复制、引用计数的基本原理,以及分代假说、三色标记、写屏障、混合屏障等关键概念。并通过简短的玩具实现展示了 GC 的标记、清除过程,并对比了 Go 的并发三色标记、Java 的 G1GC 与 ZGC 的有色指针与并发重定位,以及 CPython 的引用计数+循环检测机制。全文旨在帮助读者从理论到实现全景了解各语言 GC 的演进与工作原理。 (约 180 字)

  • 一周狂揽40K+ Star⭐ 的 Pretext 到底有多变态?这周的前端圈,可以说是被一个叫 Pretext 的项目彻 - 掘金

    这篇博客介绍了一个叫 Pretext 的开源库,它在短短几天内 GitHub 获得 40 K+ Star。Pretext 通过纯 JavaScript/TypeScript 实现文本宽高的精确测量,完全避免 DOM 操作和浏览器的强制同步布局(Reflow),从而在 1000 条文本测量的场景下将耗时从 300 ms 降至 2 ms,甚至可以在 Web Worker 中并行计算。它的核心技术是基于浏览器字体引擎的数学模型,兼容多语言、换行、Emoji 等复杂排版,实现了高精度、轻量、跨平台(浏览器、Canvas、Node 等)的文本布局解决方案。适用场景包括大规模虚拟列表、Canvas/WebGL 富文本渲染以及服务端 PDF/海报生成等需要提前知道文本尺寸的高性能需求。文章还强调,前端的真正高级不是堆砌 AI,而是在性能瓶颈出现时,用数学算法精准解决实际痛点。

  • 倒计时 33 个月?Go 前安全负责人:量子计算机将“摧毁”互联网 - Tony Bai

    文章指出,量子计算机在 2029 年左右就可能具备破解当前主流加密算法(RSA、ECC)的能力,倒逼密码学迁移。Google、Oratomic 等机构的最新论文显示,破解 256 位椭圆曲线只需约 10,000 个物理量子比特,且硬件、算法、纠错进步加速了“量子末日”。安全专家 Filippo Valsorda 宣布,从今天起不再有十年缓冲期,必须立即采取抗量子措施:① 密钥交换迁移至 ML‑KEM;② 数字签名改用 ML‑DSA,接受更大体积的签名;③ Go 标准库的密码学模块将被重构,开发者需提前做好准备。文章呼吁所有后端开发者立刻评估并保护关键数据,避免“先存后解”的 SNDL 风险。

  • [架构师之路]40岁,我创业一周年,一个人...(给自己打个85分)

    沈剑回顾了自己40岁创业一周年,从放弃CTO岗位、离开稳定工作、追求自由、开心、利他等目标,并通过“个人成长社群”实现了每月主题、直播、作业、福利等规划。一年里,他坚持每日输出、回复提问、发放福利,累计产出超555万字,组织了9大主题活动,并通过直播、作业提升参与度。面对下半年参与度下滑,他深度访谈用户后,发现学习成长的强度和频率不匹配,遂计划在2026年升级为每月3次直播、聚焦AI、个人品牌、第二曲线等主题,并引入专家团、行动营(如31天OpenClaw、AI编程大航海)提升参与度。同时,他推出一周年福利,以折扣价邀请新老成员加入个人成长星球。

  • Go 1.26.2-1 and 1.25.9-1 Microsoft builds now available | Microsoft for Go Developers

    微软近日发布了针对 Go 的两个新版本:1.26.2‑1 与 1.25.9‑1,均为 Microsoft 定制的构建。它们在保持 Go 官方发行版功能的同时,加入了安全补丁和 bug 修复,适合需要在 Windows 环境下使用的开发者直接下载使用。文中提供了对应的 release notes 链接,供用户查看详细变更。此次发布标志着微软持续维护其 Go 发行版,帮助开发者在更安全、稳定的环境中进行编程。

  • Release openclaw 2026.4.8 · openclaw/openclaw · GitHub

    OpenClaw 2026.4.8 正式发布,重点修复了 Telegram/setup 的加载问题,使 npm 编译的网关启动不再因缺失的 dist/extensions/telegram/src/* 文件而报错;同时对所有捆绑渠道(Feishu、Google Chat、IRC 等)统一采用包装的 sidecar 方式加载共享密钥合约,确保插件兼容性与版本同步。Agent 更新保持 OpenAI 系列任务的 plan 信息可用,并优化 exec 任务的主机策略返回;Slack 代理现在会自动读取环境代理设置并支持 NO_PROXY,解决代理-only 部署的连接问题。网络抓取守卫在可信代理模式下跳过 DNS 绑定,进一步提升沙箱的出站灵活性。此次发布还对插件元数据、成功 payload 结构以及多项安全/兼容性细节进行了同步更新,整体提升了 OpenClaw 在多平台、代理和插件场景下的稳定性与可维护性。

  • Release v1.5.0 · modelcontextprotocol/go-sdk · GitHub

    本次发布 v1.5.0,重点对 client‑side OAuth 进行稳定化,移除已弃用的 auth.PreregisteredClientConfig,改为 auth.AuthorizationCodeHandlerConfig.PreregisteredClient,并对 auth、oauthex 包的过时功能进行清理。新增企业托管授权(Enterprise Managed Authorization)支持,统一 OAuth 示例并修复多个兼容性问题。同时升级依赖、简化单元测试、修复内存事件存储空 EMPTY chunk 等,标记为首次贡献者的改动均已合并。总体提升了 SDK 的可靠性与向后兼容性。

  • Release Release v0.47.1 · mark3labs/mcp-go · GitHub

    该页面是 GitHub上 mark3labs/mcp-go 项目的 v0.47.1 发布说明。主要更新包括:

    • NewSSEMCPClient 增加示例,防止变量遮蔽(@vincent067 提交)。
    • Close() 中对 stdio 子进程进行安全关闭(@jbjardine 提交)。
    • 修复 client/http_streamable 中在上下文取消时未退出 ContinuousListening 协程的问题(@swedishborgie 提交)。
    • 新增贡献者 @jbjardine 与 @swedishborgie 的首次提交。
    • 该版本已通过 GitHub 签名验证,标记为正式发行版。

    总体而言,v0.47.1 侧重于代码质量改进、错误修复以及对新客户端示例的补充,提升了 MCP Go 的稳定性和可用性。 (约 150 字)

  • Release v3.31.0 · openai/openai-go · GitHub

    OpenAI Go客户端库发布 v3.31.0 版本,主要更新包括:在 Conversation 消息中新增 phase 字段;为 ResponseIncludable 添加 web_search_call.results;支持短期 Token;改进 multipart 表单编码的逗号格式;修复了部分取消marshal的错误和重复的 ? 参数;在 CI 中加入可选的跳过构建策略等。总体提升了 API 兼容性、错误处理和文档说明,同时更新了依赖版本。此次发布兼容 3.30.0 到 3.31.0 的完整变更。

  • 博客作者Armin Ronacher分享了Mario Zechner加入Earendil的消息,并阐述了个人感受。他回顾了2025年对AI软件的思考,强调质量、设计与可持续性比速度更重要,批评当下行业过度产出“slop”。Earendil的目标是构建更审慎、更人性化的机器实体,帮助人们更好沟通、协作。Pi作为开源、可扩展的代理框架,被视为理想基础,作者希望与其保持高质量、开放的发展,并投资其未来。整体立意是:在AI热潮中坚持工艺精神,避免盲目加速,推动更有意义的软件与人机交互。

  • 让 AI 给我优化了一下 AI 默认规则,大佬们看看如何,有更好的建议吗? - V2EX

    该帖讨论在 AI 编程工具(如 Codex)中实现“全局默认规则”,旨在通过模块化、单一职责、第一性原理等原则避免代码堆积、产生“屎山”。提出了包括 Kilo Code 的全局规则、结构化的三步工作流、反对冗余注释和占位符等具体准则,并强调直接输出可执行代码、禁止空话和重复信息。目标是让 AI 生成的代码更简洁、可维护、符合工程最佳实践。

  • 这世界变化太快了, 奶奶的 - V2EX

    这篇博客作者在V2EX 上分享了对当下技术快速迭代的感慨,重点聚焦在“Hermes‑agent”项目上。作者提到该项目虽有前景,但现有的 openclaw 实现显得臃肿、难以对接本地的 OMLX,导致自己折腾了一天仍未成功集成。文章还穿插了几位网友的调侃与评论,如对名字的玩笑、对单 Agent 与子 Agent 场景的讨论以及对海鲜爱好者的好奇。整体上,作者在表达对技术变革速度的惊叹,并对新出现的工具抱有期待,同时也在寻找更合适的接入方式。全文约 150 字,兼具技术细节与情感感受。

大图预览

Feedback