AI 활용 사례 공유

01 / 20

AI 활용 사례 공유

Presenter

솔루션1팀

김용건

a presentation in three parts

Date

2026.04.20

3 parts · 20 min

Part 1 · 바이브 코딩으로 서비스 개발

02 / 20

2.1AI를 활용한 사내 기술 시험 자동화

기존 채점 방식의 네 가지 문제

그동안 우리가 감내해 왔던 것들

01

채점 일관성 부재

채점자마다 점수가 다르고, 공통된 기준 자체가 존재하지 않는다.

02

개발자 리소스 낭비

채용 시기마다 개발자가 직접 채점. 실제로는 결과만 훑는 수준에 그친다.

03

오채점 발생

답지에 없지만 정답인 표현을 놓치고, 매번 별도 검증이 필요하다.

04

점수만으론 알 수 없다

실제 응시자의 답변을 봐야만 판단할 수 있는 영역이 존재한다.

김용건 · 솔루션1팀기존 방식의 한계

Part 1 · 바이브 코딩으로 서비스 개발

03 / 20

2.2ExamManager

그래서 이렇게 해결했다

사내 기술 면접 필기의 출제·응시·채점 전 과정을 하나의 서비스에서

기존 문제		ExamManager의 해결
① 채점 일관성 부재	→	AI 자동 채점 — 동일 LLM + 동일 채점 기준으로 모든 답안을 같은 잣대로
② 개발자 리소스 낭비	→	AI가 1차 채점, 사람은 검토만 — 개발자는 확인·첨삭에만 시간 투입
③ 오채점 발생	→	의미 기반 채점 — 모범답안과 다르더라도 핵심 개념이 맞으면 정답 인정
④ 점수만으론 알 수 없다	→	답안 색상 마커 — 정답/오답/부분정답을 답안 위에 직접 시각화

김용건 · 솔루션1팀문제 ↔ 해결 매핑

Part 1 · 바이브 코딩으로 서비스 개발

04 / 20

2.3AI 자동 채점

의미 기반 채점 + 답안 시각화

의미 기반 채점저장된 평가 기준으로 모범답안과 똑같지 않아도 핵심 개념이 맞으면 정답 인정 (단순 키워드 매칭 X)
색상 마커답안의 정오 구간을 초록/빨강/주황으로 자동 태깅 → 관리자가 답안을 훑기만 해도 채점 근거가 보인다
관리자 첨삭자동 채점 결과를 검토·수정, 마커 툴바로 구간 직접 지정
재채점채점 기준 수정 후 개별 / 전체 답안 재채점

채점 상세 · 색상 마커 (초록/주황/빨강)

김용건 · 솔루션1팀핵심 기능 ①

Part 1 · 바이브 코딩으로 서비스 개발

05 / 20

2.4AI 출제 도우미

주제·난이도만 주면 문제와 채점 기준까지

자동 생성주제·난이도 입력 → 문제 본문 + 채점 기준 + 배점 자동 생성
멀티턴 대화"난이도 높여줘", "SQL 문제로 바꿔줘" 식으로 맥락을 유지하면서 반복 수정
배경시험 문제의 추가·변경을 쉽게 할 수 있도록

AI 출제 도우미 · 멀티턴 대화

김용건 · 솔루션1팀핵심 기능 ②

Part 1 · 바이브 코딩으로 서비스 개발

06 / 20

2.5시험 운영 모니터링

운영자가 실시간 모니터링 가능

실시간 모니터링 · 채점 대시보드

① 실시간 모니터링

② 채점 대시보드

김용건 · 솔루션1팀운영자 경험

Part 1 · 바이브 코딩으로 서비스 개발

07 / 20

2.6개발자의 일이 바뀐다

본질은 그대로, 비중만 달라졌다

원래부터 개발자의 일은 — 사용자가 원하는 기능을 파악하고, 구현하고, 전달하는 것이었다.

그런데 현실은 문법·프레임워크·테크니컬 이슈 해결에 구현 시간의 대부분이 들어갔다. 정작 "사용자가 실제로 편하게 쓸 수 있는가"에는 시간을 충분히 쓰기 어려웠다.

AI가 코딩의 상당 부분을 대신하면서 그 부담이 줄어들고, 개발자는 드디어 본질에 제대로 시간을 쓸 수 있게 됐다.

이제 더 집중할 질문들

이 기능을 누가 쓰는가.
어떤 상황에서, 무엇을 하려고.
실제로 쉽게 쓸 수 있는가.

사실 원래부터 개발자가 해야 했던 질문들 —
여유가 생겼을 뿐이다.

김용건 · 솔루션1팀개발자 관점 전환

Part 1 · 바이브 코딩으로 서비스 개발

08 / 20

2.7사용자 관점 개선 · 예시 ①

AI 채점 근거의 색상 마커

사용자(면접관·채점자)를 고려해서 설계한 것

의미 기반 채점은 블랙박스가 되기 쉽다.
점수와 총평만 돌려주면, 사용자는 LLM의 판단을 역추적해야 한다. 그래서 처음부터 채점 결과를 쉽게 알아볼 수 있는가를 요구사항에 포함시켰다.

01

색상 마커로 채점 근거를 시각화

정답 ■ / 오답 ■ / 부분정답 ■ 을 답안 위에 직접 태깅 — 훑기만 해도 근거가 보인다.

02

판단이 다르면 직접 수정 가능

마커 툴바로 구간을 직접 지정해 첨삭. LLM의 판단을 그대로 받아들이지 않아도 된다.

03

기준을 고치면 다시 채점

채점 기준이 바뀌면 개별/전체 답안을 재채점. 운영 중에도 기준을 개선할 수 있다.

채점 상세 · 색상 마커

김용건 · 솔루션1팀블랙박스를 투명하게 — 사용자를 위한 설계

Part 1 · 바이브 코딩으로 서비스 개발

09 / 20

2.8사용자 관점 개선 · 예시 ② · 1 of 2

그룹 문제의 공통 지문

처음 만들었을 때 — 지문이 하위 문제마다 따라오지 않았다

공통 지문 (Q13)

사원·직급·부서 세 테이블 아래, Q13-1 ~ Q13-4가 달린 SQL 문제.

Before · 단순 요구

"한 페이지에 한 문제"로 요구 → Q13-2, Q13-3, Q13-4에는 공통 지문이 없다.

쿼리를 짜려면 매번 Q13-1로 돌아가 테이블 구조를 확인해야 한다.

김용건 · 솔루션1팀→ 다음 슬라이드에서 어떻게 고쳤는지

Part 1 · 바이브 코딩으로 서비스 개발

10 / 20

2.9사용자 관점 개선 · 예시 ② · 2 of 2

사용자 관점으로 재설계

그룹 문제일 때는 공통 지문을 모든 하위 문제와 함께

After · 사용자 관점

공통 지문이 하위 문제와 같은 화면에 함께 떠 있다.

수험자는 문제 풀이에만 집중할 수 있다. 테이블 구조를 확인하려고 이전 문제로 돌아갈 필요가 없다.

What it means

"이 기능을 누가, 어떤 상황에서, 어떻게 쓰는가"를 생각한다. 이게 개발자가 집중해야 할 본질이다.

$개선 후 — 공통 지문과 함께 표시$

재설계본 · Q13-3 화면 (공통 지문 + 하위 문제)

김용건 · 솔루션1팀사용자 관점을 요구사항에 포함시킨다

Part 1 · 바이브 코딩으로 서비스 개발

11 / 20

2.9Claude Code Agent

6개 에이전트가 협업하는 파이프라인

역할별로 쪼개고, 각자 독립된 컨텍스트에서 일한다

김용건 · 솔루션1팀Claude Code Agent 파이프라인

Part 2 · 에이전트 활용 원칙

12 / 20

3.1질문

에이전트, 굳이 쪼개야 할까?

방금 본 파이프라인, 솔직히 이런 생각 들지 않으셨나요

01

"하나의 세션에서 쭉 시키면 되는 거 아닌가?"

02

"에이전트를 쪼개면 오히려 관리 포인트만 늘어나는 것 같은데?"

03

"똑같은 Claude인데, 역할만 나눈다고 결과가 달라지나?"

김용건 · 솔루션1팀이 의문에 답하기 위한 두 개의 원칙

Part 2 · 에이전트 활용 원칙

13 / 20

3.2원칙 1-①

에이전트 분리 — 자기 편향 방지

01

PRINCIPLE 1-①

독립된 시각이
독립된 검증을 만든다

같은 에이전트가 작성과 검토를 함께 하면 확증 편향이 발생한다. 자기가 쓴 것을 자기가 검토하는 것은, 구조적으로 한계가 있다.

작성 에이전트와 검토 에이전트의 컨텍스트를 분리하면 독립적인 시각으로 검증할 수 있다.

❌

동일 에이전트
작성 + 검토

vs

✓

분리된 에이전트
작성 ↔ 검토

예 코드 작성 에이전트 ↔ 코드 리뷰 에이전트 (= Slide 10의 Phase 2 ↔ Phase 4)

김용건 · 솔루션1팀원칙 1-①

Part 2 · 에이전트 활용 원칙

14 / 20

3.3원칙 1-②

에이전트 분리 — 컨텍스트 보호

"Context Rot" — Anthropic이 공식적으로 인정한 현상

단일 세션에 정보를 계속 쌓으면 — 관련 없는 맥락이 누적되면서 — 모델의 판단력·집중력이 저하되는 현상.

그래서 agent-dev 파이프라인을 이렇게 쪼갠 것이다 — BE/FE는 기획서만 보고 병렬 작업하고, 리뷰어는 구현 과정을 모른 채 결과 코드만 본다.

각자 깨끗한 컨텍스트에서 자기 몫만 — 그래서 더 잘한다.

"Effective context engineering for AI agents" · Anthropic, 2025.09

Anthropic 블로그 · 컨텍스트 엔지니어링

김용건 · 솔루션1팀원칙 1-②

Part 2 · 에이전트 활용 원칙

15 / 20

3.4원칙 적용 사례

자료 조사 및 문서화 에이전트

이슈 발생 → 자료 조사 → 타당성 검증 → Notion 문서화, 전 과정을 자동화

01

Drafter sonnet

개요 작성, [조사 필요] 태깅

│

02

Researcher sonnet

웹 검색으로 자료 수집

│

03

Verifier sonnet

독립 교차 검증 (편향 방지)

│

04

Composer opus

검증된 자료로 완성 문서 작성

│

05

Reviewer opus

독립 관점에서 최종 검토

│

06

Planner sonnet

업무 계획 + TODO 생성

앞 원칙과 연결해 보기

Slide 12 · 자기 편향 방지
Researcher ↔ Verifier 별도, Composer ↔ Reviewer 별도

Slide 13 · 컨텍스트 보호
각 단계 서브에이전트는 자기 단계 정보만 보유, 메인은 Notion 하위 페이지를 인터페이스로 사용

모델 선택
조사·검증은 sonnet, 작성·검토는 opus

두 원칙이 실제 플러그인 설계를 그대로 끌고 왔다.

김용건 · 솔루션1팀이론에서 실제 설계로

Part 3 · 반복 업무 자동화

16 / 20

4.1Claude Cowork

Cowork는 뭐가 다른가

구분	일반 Claude (claude.ai)	Claude Code (CLI)	Claude Cowork (데스크톱)
실행 위치	브라우저 / 모바일	터미널	데스크톱 앱
주 사용자	누구나	개발자	개발자 · 비개발자 모두
로컬 파일	업로드만	직접 Read/Write/Edit	직접 Read/Write/Edit
셸 / bash	제한적	개발자 터미널 직접	샌드박스 bash
콘셉트	채팅	CLI 기반 개발 작업	내 PC 위의 에이전트

Cowork의 포인트 — 로컬 파일을 직접 읽고 쓰는, 개발자가 아닌 사람도 설치해서 쓸 수 있는 에이전트

김용건 · 솔루션1팀세 환경의 차이

Part 3 · 반복 업무 자동화

17 / 20

4.2Cowork 사례 ①

이메일 보안 뉴스 수집·공유 자동화

매번 사람이 '검색 → 선별 → 정리 → 공유'를 반복해야 했던 것을

01

수집·중복 제거

해외·국내 기사 검색, 이미 본 항목 필터링

02

분류·축적

카테고리별(위협 탐지 / AI 보안 / 인증 / 벤더 / 정책)로 Notion DB에 적재

03

제품·개발팀에 뉴스레터 발송

왜 Cowork인가

프롬프트 한 줄로 구현

코드 없이 자연어로 에이전트를 정의. 터미널·스크립트 작성 부담 없음

왜 Cowork인가

인프라 운영 부담 없음

별도 서버·cron·Lambda 없이 이미 쓰는 PC가 스케줄러 (매주 월요일 자동 트리거)

❝

반복되는 업무는 에이전트화할 수 있다 — 개발 업무가 아니어도.

김용건 · 솔루션1팀쌓인 Notion DB는 경쟁 기술 아카이브로 진화

Part 3 · 반복 업무 자동화

18 / 20

4.3Cowork 사례 ②

Java 예외 분석 자동화

예외 로그 → 로컬 레포 탐색 → 근본 원인 추적 → Notion 보고서 발행

왜 Cowork 환경인가

로컬 파일 접근이 필요

사내 GitLab에 직접 접근하지 않고 로컬 clone된 레포를 탐색

이미지 로그 첨부

로그 반출이 어려운 고객사 특성상, 이미지로 된 로그를 편리하게 첨부

개발자 PC에서 실행

현장 개발자의 환경과 동기화된 상태에서 분석 → Cowork

현재 활용

SECaaS 기반으로 분석한
내용을 공유하고 있다.

Notion · Java 예외 분석 보고서

김용건 · 솔루션1팀프롬프트로 정의한 분석 에이전트

마무리

19 / 20

5.0마무리

에이전트, 만드는 것도 쉽다

지금까지 본 에이전트들 — 프롬프트 한 줄로 만들었다

코드가 아니라
자연어로
에이전트를 정의한다.

"이게 전부입니다."

Claude Cowork · 에이전트 생성 대화

김용건 · 솔루션1팀자연어가 곧 인터페이스다

Thank You

20 / 20

—

감사합니다

Questions & Discussion

Presenter

김용건 · 솔루션1팀

Date

2026.04.20

end of session