2026年6月28日Ollama 并非产品:构建可投入生产的开源大语言模型应用使用Ollama运行本地模型很简单。但构建一个可用于生产环境的开源大语言模型(Open-LLM)应用则更具挑战性:它需要RAG(检索增强生成)、访问控制、供应商抽象、评估、日志记录、部署规范,以及围绕模型构建受控的应用层。阅读更多
2026年6月16日ZBT Z8102AX 双SIM卡故障切换:有效功能、缺失功能及固件需改进之处ZBT Z8102AX是一款双SIM卡5G OpenWrt路由器,但仅具备双SIM卡硬件并不等同于智能故障切换。该路由器能识别SIM卡并成功连接,但自动切换、调制解调器恢复、基于信号的决策以及清晰的故障切换逻辑仍需更深入的测试。阅读更多
2026年5月4日Qwen 3.6 生产环境部署:发布手册、AI 回滚与 LLMOps 版本管理Qwen 3.6 不仅仅是一次模型升级。它同时是一个发布事件、一个回滚场景和一个版本管理问题。本文通过LLMOps规范、提示词与模型可追溯性、受控发布以及基于证据的回滚准备,阐述了在生产环境中应如何处理Qwen 3.6。阅读更多
2026年3月1日全面评估指南:精通LLM性能评估本指南详细介绍了评估工具(Evaluation Harness),这是一个在企业级LLMOps流程中严格评估大型语言模型(LLM)能力的关键框架。您将学习其设置方法、最佳实践以及高级技巧,以确保模型基准测试与优化的可靠性。阅读更多