LLM on 拾乐码站 - 探索代码的艺术，分享编程的乐趣

2026年本地大模型完整指南：为什么现在是从云端迁移的最佳时机

Sun, 22 Mar 2026 00:00:00 +0000

2025年，在本地跑大模型还是一件需要"信仰驱动"的事——模型效果差、内存不够用、速度慢得像拨号上网。但到了2026年第一季度，局面已经彻底翻转。

2026年LLM编程能力横评：Claude Opus 4.6 vs GPT-5.3 vs Gemini 3

Sun, 08 Mar 2026 00:00:00 +0000

TL;DR

2026年3月，LLM编程能力格局已变。Claude Opus 4.6 凭借深度推理优势在复杂代码任务上领先，GPT-5.3 Codex 版在代码生成速度上依然强势，Gemini 3 则以性价比突围。本文基于 SWE-bench Lite、HumanEval 等权威基准测试数据，带你深入了解各模型的真实编程能力。

Constitutional Classifiers：Anthropic 如何用合成数据防御 AI 越狱攻击

Fri, 06 Mar 2026 00:00:00 +0000

问题：越狱攻击的军备竞赛

大语言模型（LLM）的安全防护一直在和越狱攻击（jailbreak）打一场军备竞赛。传统的防御方法有两个致命缺陷：

过度拒绝：为了安全，模型变得过于谨慎，连正常请求都拒绝
计算开销：每次推理都要额外检查，成本高昂

Anthropic 在 2026 年 1 月发布的 Constitutional Classifiers++ 提供了一个优雅的解决方案：用合成数据训练的分类器，在输入和输出两端拦截恶意内容。