Claw Code + vLLM(Qwen3-4B-Thinking) 로컬 개발 환경 셋업 #1
Reference in New Issue
Block a user
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
목표
Claw Code(Rust CLI)를 로컬 vLLM 서버와 연동하여 Anthropic API 없이 로컬 LLM으로 에이전트 세션을 운용할 수 있도록 환경을 구성한다.
작업 내역
instructkr/claw-code클론 및cargo build --workspace빌드claw doctor동작 확인clawcodeapp↔vllm-windows멀티루트 VS Code workspace 파일 생성BAAI/bge-m3(embed)에서Qwen/Qwen3-4B-Thinking-2507로 교체--served-model-name local-qwen-thinking(DashScope prefix 오라우팅 방지)--max-model-len 12000,--gpu-memory-utilization 0.9,--enforce-eager/v1/models응답)claw --model local-qwen-thinking prompt ...end-to-end 검증연결 정보
http://localhost:8000/v1local-qwen-thinkingEMPTYANTHROPIC_API_KEYunset 필수 (prefix 미매칭 → 환경변수 우선순위 라우팅)참고
thinking포함 시temperature/top_p등 자동 제거vllm-windows/docker-compose.yml에 HF 토큰 하드코딩 상태 → 별도 이슈로 분리 필요