메뉴얼 Landing V2.0
Quick · Step 08

평가 · 회귀

평가 · 어댑터 · 회귀 — 도구/RAG/코드/MCP 성공률. LLM-as-judge 와 도메인 벤치마크로 어댑터의 응답 품질을 점수화하고 before/after 비교까지 자동으로 누적합니다.

tool-call
해당 벤치마크 실행 이력 없음
rag-cite
해당 벤치마크 실행 이력 없음
code-test
해당 벤치마크 실행 이력 없음
어댑터 크기
어댑터 없음

코어 옵션 · 팩토리 동선

사이드바는 8코어 중심으로 두고, 세부 단계·프로브는 이 스트립에서 연결합니다.

전체 비교 엔진
비교

카드의「비교 (팝업)」은 RAG 바를 숨긴 빠른 모드입니다. LeafPlan 문맥까지 쓰려면 전체 비교로 이동하세요.

데이터

파싱·RAG·등록 파이프라인은 데이터셋 빌더에서 프로젝트·폴더를 지정한 뒤 학습 포맷으로 넘깁니다.

산출물

어댑터·런타임·RAG 슬롯은 Pack / Manifest빌드 시 동결됩니다.

정책

Provider 키·조직 시크릿은 API 키·설정을 SoT 로 두는 것을 권장합니다.

새 평가 실행

어댑터 다중 선택 → 벤치마크 → LLM judge 점수화

어댑터가 없습니다.

before / after

벤치마크별 직전 실행 → 최신 실행 통과율

완료된 평가가 없습니다. 위에서 첫 평가를 실행하세요.

평가 기록 (0)

평가 결과가 없습니다.

A/B 어댑터 비교

이전 /finetuning/ab 경로는 여기로 통합되었습니다.

A/B 대상 선택

두 어댑터를 직접 비교합니다 (통합 영역)

A
B

A 어댑터를 선택하세요.

B 어댑터를 선택하세요.