#research

1 post

12m

HarnessEval: Khi Coding Agent Thất Bại, Lỗi Tại AI Hay Hạ Tầng?

Đề cương nghiên cứu HarnessEval — framework đánh giá hạ tầng coding agent đầu tiên, tách rời đóng góp của harness và LLM.

#ai#research#coding-agent