[내일배움캠프] QA/QC_6기 - 사전캠프 3일차
- TIL
- 엑셀대신 SQL로 한번에 계산하기
- AI의 유형
- To-Do List
- SQL 강의 수강 (Chap2 전체)
- AI Literacy 강의 수강 (Chap1-3)
- SQL 및 AI Literacy 강의 과제 수행
ADsP 강의 수강 (D-25)
SQL
엑셀대신 SQL로 한번에 계산하기
- 숫자연산자 : + (더하기), - (빼기), × (곱하기), ÷ (나누기)
- 합계와 평균
- SUM : 합계
sum(칼럼) - AVG : 평균
avg(칼럼)
- SUM : 합계
- 전체 데이터의 갯수 구하기
- COUNT : (행의) 갯수 (테이블 전체를 나타낼 때 ( ) 안에 * 또는 1 사용가능)
count(칼럼) → 칼럼의 전체 데이터 갯수 - DISTINCT : 몇 개의 값을 가지고 있는지 구할 때
count(distint 칼럼) → 칼럼에서 똑같은 값은 한 개로 취급한 갯수
- COUNT : (행의) 갯수 (테이블 전체를 나타낼 때 ( ) 안에 * 또는 1 사용가능)
- 최솟값과 최댓값으로 데이터 범위 구하기
- MIN : 최솟값
min(칼럼) - MAX : 최댓값
max(칼럼) - 최대-최소 범위 구하기
select min(칼럼1), max(칼럼1) → 칼럼1의 최대·최소값을 알 수 있음 (최대-최소 범위)
- MIN : 최솟값
GROUP BY로 범주열 연산 한 번에 끝내기
- 카테고리별로 숫자 연산을 간단하게 하기
- GROUP BY : 카테고리 칼럼 지정
select 칼럼1, sum(칼럼2) → 칼럼1을 조회하고 칼럼2는 더해서 조회한다
from테이블 → 테이블에서
group by 칼럼1 → 칼럼1 내의 중복 데이터끼리 그룹화해서
- GROUP BY : 카테고리 칼럼 지정

쿼리 결과를 정렬하여 업무에 바로 사용하기
- 데이터를 오름차순, 내림차순으로 정렬하기
- ORDER BY : 데이터를 오름차순으로 정렬
order by 칼럼 → 칼럼에는 카테고리 칼럼 또는 계산 칼럼 모두 가능 - DESC : 데이터를 내림차순으로 정렬
order by 칼럼 desc
- ORDER BY : 데이터를 오름차순으로 정렬
실습 예제
- 음식 종류별 가장 높은 주문 금액과 가장 낮은 주문금액을 조회하고, 가장 낮은 주문금액 순으로 (내림차순) 정렬해봅시다.
select cuisine_type, max(price), min(price)
from food_orders
group by cuisine_type
order by max(price) desc, min(price) desc
과제
- products 테이블에서 제품 이름(product_name)과 가격(price)만을 선택하는 쿼리를 작성해주세요.
select product_name, price
from products - products 테이블에서 제품 이름에 '프로'가 포함된 모든 제품을 선택하는 쿼리를 작성해주세요.
select *
from products
where product_name like '%프로%' - products 테이블에서 제품 이름이 '갤'로 시작하는 모든 제품을 선택하는 쿼리를 작성해주세요.
select *
from products
where product_name like '갤%' - products 테이블에서 모든 제품을 구매하기 위해 필요한 돈을 계산하는 쿼리를 작성해주세요.
select sum(price)
from products - orders 테이블에서 주문 수량(amount)이 2개 이상인 주문을 진행한 소비자의 ID(customer_id)만 선택하는 쿼리를 작성해주세요.
select customer_id
from orders
where amount>=2 - orders 테이블에서 2023년 11월 2일 이후에 주문된 주문 수량(amount)이 2개 이상인 주문을 선택하는 쿼리를 작성해주세요.
select *
from orders
where amount>=2 and order_date>'2023-11-02' - orders 테이블에서 주문 수량이 3개 미만이면서 배송비(shipping_fee)가 15000원보다 비싼 주문을 선택하는 쿼리를 작성해주세요.
select *
from orders
where amount<3 and shipping_fee>15000 - orders 테이블에서 배송비가 높은 금액 순으로 정렬하는 쿼리를 작성해주세요.
select *
from orders
order by shipping_fee desc
AI Literacy
LLM (Large Language Model)이란?
사람의 언어를 인식하고 이해하여 답변하는 AI 모델
일반적으로 생성형 AI가 이에 해당 (사람의 언어로 이해하고 산출물을 만들어냄)
하지만 LLM이 언어를 이해하는 것은 아님
- LLM이 어떤 문장을 인식하면 모델이 알 수 있는 벡터 또는 스칼라 값과 가장 유사한 값을 대조
→ 답변해야 하는 가장 적합한 값을 찾아서 답변 (사용자의 만족 여부와 상관없이 유사한 값에 해당하는 답변)
→ LLM은 문장의 의미를 알지 못함
- LLM이 문장을 인식하는 방법 (간략화 예시)
- 머리 감을 때 좋은 샴푸를 추천해줘'
- 감다 (태엽을 감다?, 먹는 감? 어떤 감?), 좋은(좋다는 것은?), 샴푸(샴푸랑 shampoo는 다른가?)
- '태엽을 감다' → 태엽:35, 감다:15
- '눈을 감다' → 눈을:27, 감다:486
- '머리를 감다' → 머리를:-54, 감다:110
- (실제로는 훨씬 더 복잡한 다차원적 표현이 사용됨)
- 문장을 숫자로 바꿔서 저장 → 수치화(벡터화)하여 문장을 저장하고 이해
- 이렇게 수치화(벡터화) 하는 방법을 '임베딩'이라 함
- 임베딩한 정보를 바탕으로 트랜스포머 연산을 통해 이해
- 트랜스포머 알고리즘은 실제 의미를 조합하기 위한 로직
즉, LLM이 문장을 이해하기 위한 첫번째 단계는 단어, 문장 등 사람의 언어를 임베딩 작업을 통해 수치화 하는 것
- 한계 : LLM의 성능 향상을 위해 수많은 문장을 데이터로 입력? (비효율적) → 이를 극복하기 위한 방법 고안
- Fine-tuning (미세조정)
- LLM의 특정 매개변수를 수정하는 작업 (다소 모호한/광범위한 표현)
- 새로운 데이터셋 학습, 답변 자유도 값(Temperature) 수정, 답변 최대 길이 수정 등
- 데이터 양이 많을수록 파인튜닝에 의한 성능 변화가 큼
- 장점 : 비교적 빠른 작업 속도
- 단점 : 결과를 보는데까지 긴 시간 필요 (결과가 마음에 들지 않으면 다시 미세조정을 반복)
- RAG (검색증강생성) 활용 등
- LLM이 참고해서 답변을 만들 수 있는 새로운 정보의 장을 활용하는 방법
- 기존 학습 방법 + 추가적인 정보 (Web에 있는 내용, 서버의 문서, 핸드폰 그림 등을 참고)
- AI가 스크패핑한(수집한) 정보를 그대로 제시하는 것이 아닌 가공을 해서 제시해야 RAG
- 장점 : 별도의 학습이 필요치 않음 (새로운 정보의 장만 제공)
- 단점 : RAG의 설계·구축·적용·유지보수 작업에 매우 큰 비용이 요구
- Fine-tuning (미세조정)
- AI 기술자는 상황에 따라 두 방법 모두 사용
- 결국 AI는 도구일 뿐, 사람의 손이 필요
Quiz! 다음 중 생성형 LLM에 해당하지 않는 것은? (정답 없음, 모두 LLM)
- Claude
- Grok
- ChatGPT
- LLama → 오프라인 상황에서 활용 가능한 소형 LLM 모델에 적용 가능
Quiz! 다음 정의를 말해주세요.
- (단답형) LLM의 답변 최적화를 위해 외부 지식 베이스를 활용하는 기술 : RAG
- (단답형) AI 모델을 최적화하기 위해 매개변수를 조정하는 활동 : 파인튜닝
- (서술형) LLM이란?
인간의 언어를 인식하고 인간의 언어로 답변을 생성하는 AI 모델
당일 과제. LLM을 활용해서 내 직무 관련 업무의 문서 만들어 보기
AI 활용 퀘스트 미션 1 : 나는 AI를 제대로 쓰고 있을까?
예시 : 취업 준비 방향을 물어볼 때
지식인형 질문
품질관리 취업하려면 뭘 배워야 해?
GPT 답변

도구형 질문
나는 고분자공학 전공 4학년이고, 제조업 품질관리 직무로 취업을 준비 중이야. 현직 품질 엔지니어가 실제로 많이 쓰는 스킬 중, 비전공자가 3개월 안에 갖출 수 있는 것 Top 3를 골라서 각각 왜 중요한지, 어떻게 준비하면 좋은지 구체적으로 알려줘.
GPT 답변

답변 비교
- 지식인형 : 사전 입력된 기초적인 사용자의 정보만으로 광범위한 질문을 하여 GPT의 답변 또한 구체적이지 못하고 정말 가장 핵심적인 부분 4가지를 간단하게 제시
- 도구형 : 사용자에 대한 구체적인 정보가 추가된 이후 사용자가 가진 또는 가지지 못한 역량에 초점을 둬 조금 더 구체적인 방안 제시
내가 만든 도구형 질문
내 질문
너는 반도체 품질관리 직무에서 10년 이상 근무한 베테랑이야. 나는 고분자공학 전공으로 학사, 석사 졸업하고 2차원 나노 소재를 필러로 활용한 전자파 차폐 고분자 복합 소재를 연구했어. 현재 대기업 반도체 품질관리 직무에 취업하고 싶어서 노력 중인데, 이를 위해서는 내가 어떤 준비를 해야 하는지 step-by-step으로 자세히 정리해줘.
GPT 답변


출처
전용문, 박현민 지음, 2026 ADsP 데이터분석 준전문가, 위키북스
내일배움캠프 교육 자료
'TIL > 내일배움캠프' 카테고리의 다른 글
| 쿼리로 데이터베이스 다루기 (0) | 2026.04.27 |
|---|---|
| AI와 대화? 프롬프팅 (0) | 2026.04.26 |
| 나는 AI를 잘 사용하고 있을까? (1) | 2026.04.23 |
| AI란 무엇인가? (0) | 2026.04.21 |
| JD 분석이란? (1) | 2026.04.21 |