擅长在有限算力下落地大模型应用。独立跑通微调、RAG 知识库与 Agent 协作系统。
在 RTX 2060 上跑通 7B 模型微调。4-bit 量化+LoRA,独立处理全流程。
基于 FastAPI 和 FAISS 的文档检索引擎。支持混合检索和引用溯源。
基于 LangGraph 构建 Router-Specialist 系统,实现动态任务路由规划。
解决体检报告痛点:OCR 上传 + LLM 术语解析。Vue3 + Node.js 全栈开发。