<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>LLM on 拾乐码站 - 探索代码的艺术，分享编程的乐趣</title><link>https://shiller.cn/tags/llm/</link><description>Recent content in LLM on 拾乐码站 - 探索代码的艺术，分享编程的乐趣</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 22 Mar 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://shiller.cn/tags/llm/index.xml" rel="self" type="application/rss+xml"/><item><title>2026年本地大模型完整指南：为什么现在是从云端迁移的最佳时机</title><link>https://shiller.cn/posts/2026-03-22-local-ai-model-guide-2026/</link><pubDate>Sun, 22 Mar 2026 00:00:00 +0000</pubDate><guid>https://shiller.cn/posts/2026-03-22-local-ai-model-guide-2026/</guid><description>&lt;p&gt;2025年，在本地跑大模型还是一件需要&amp;quot;信仰驱动&amp;quot;的事——模型效果差、内存不够用、速度慢得像拨号上网。但到了2026年第一季度，局面已经彻底翻转。&lt;/p&gt;</description></item><item><title>2026年LLM编程能力横评：Claude Opus 4.6 vs GPT-5.3 vs Gemini 3</title><link>https://shiller.cn/posts/2026-03-08-llm-coding-benchmark-2026/</link><pubDate>Sun, 08 Mar 2026 00:00:00 +0000</pubDate><guid>https://shiller.cn/posts/2026-03-08-llm-coding-benchmark-2026/</guid><description>&lt;h2 id="tldr"&gt;TL;DR&lt;/h2&gt;
&lt;p&gt;2026年3月，LLM编程能力格局已变。Claude Opus 4.6 凭借深度推理优势在复杂代码任务上领先，GPT-5.3 Codex 版在代码生成速度上依然强势，Gemini 3 则以性价比突围。本文基于 SWE-bench Lite、HumanEval 等权威基准测试数据，带你深入了解各模型的真实编程能力。&lt;/p&gt;</description></item><item><title>Constitutional Classifiers：Anthropic 如何用合成数据防御 AI 越狱攻击</title><link>https://shiller.cn/posts/2026-03-06-constitutional-classifiers-jailbreak-defense/</link><pubDate>Fri, 06 Mar 2026 00:00:00 +0000</pubDate><guid>https://shiller.cn/posts/2026-03-06-constitutional-classifiers-jailbreak-defense/</guid><description>&lt;h2 id="问题越狱攻击的军备竞赛"&gt;问题：越狱攻击的军备竞赛&lt;/h2&gt;
&lt;p&gt;大语言模型（LLM）的安全防护一直在和越狱攻击（jailbreak）打一场军备竞赛。传统的防御方法有两个致命缺陷：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;过度拒绝&lt;/strong&gt;：为了安全，模型变得过于谨慎，连正常请求都拒绝&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;计算开销&lt;/strong&gt;：每次推理都要额外检查，成本高昂&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;Anthropic 在 2026 年 1 月发布的 Constitutional Classifiers++ 提供了一个优雅的解决方案：&lt;strong&gt;用合成数据训练的分类器，在输入和输出两端拦截恶意内容&lt;/strong&gt;。&lt;/p&gt;</description></item></channel></rss>