TIL/내일배움캠프

AI란 무엇인가?

Kou_ 2026. 4. 21. 18:16

[내일배움캠프] QA/QC_6기 - 사전캠프 2일차

  • TIL
    • SQL의 기본 구조
    • AI란?
  • To-Do List
    1. SQL 강의 수강 (Chap1 전체)
    2. AI Literacy 강의 수강 (~ Chap1-2)
    3. SQL 및 AI Literacy 강의 과제 수행
    4. ADsP 강의 수강 (D-26)

SQL

SQL (Structured Query Language)란?

DBMS에서 DB에 명령을 내리는 하부 언어

→ 즉, DB에 SQL이란 언어를 이용해 요청하는 질의(Query, 쿼리)로 데이터를 이용

실습에 사용하는 프로그램 : DBeaver (MySQL 사용)

DB (Data Base)

데이터가 저장되어 있는 공간, DB 내부에 Table(테이블)의 형태로 데이터가 저장되어 있다.

테이블은 엑셀 파일과 유사한 구조로 데이터를 가지고 있으며, 각 열을 Column(컬럼)이라 한다.

데이터 조회하기

  • SELECT : 데이터를 가져오는 기본 명령어, 데이터를 조회하는 모든 쿼리에 사용
    select *
  • FROM : 데이터를 가져올 테이블을 특정하는 문법
    from food_order
  • * : 모든 컬럼을 의미

필요한 항목만 조회하기

  • 모든 컬럼을 조회하는 * 대신 다음과 같이 표현
    select 컬럼1, 컬럼2

컬럼에 별명(alias) 지정하기

  • 방법1 : 컬럼1 as 별명1
  • 방법2 : 칼럼2 별명2
  • 유의사항
    • 영문, 언더바 : 별명만 작성
      select order_no as ord_no
      from food_orders
    • 특수문자, 한글 : "별명"과 같이 큰 따옴표 안에 작성
      • select order_no as "ord no"
        from food_orders

      • select order_no "주문번호"
        from food_orders

조건에 맞는 데이터로 필터링하기

  • WHERE: 전체 데이터 중 원하는 데이터만 필터링 할 수 있다.
    • 고객 중 여성인 사람을 조회 (조건절에 문자를 사용할 경우 다음과 같이 ' ' 을 사용)
      select *
      from customers
      where gender='female'
    • 필터링 시 유용한 표현
      • 비교연산자 : = (같다), <> (같지않다), > (초과), >= (이상)
      • 다양한 조건의 종류
        • BETWEEN : A와 B 사이
          between A and b
        • IN : '포함'하는 조건 주기
          in (A, B, C) → A, B, C를 포함하는 값
        • LIKE : 완전히 같지는 않지만, 비슷한 값을 조건으로 주기
          특정 문자로 시작 '포함문자 %'
          예시) On으로 시작하는 가게명 where restaurant_name like 'On%'
          특정 문자를 포함 '% 포함문자 %'
          예시) Time을 포함하는 가게명 where restaurant_name like '%Time%'
          특정 문자로 끝 '% 포함문자'
          예시) Do로 끝나는 가게명 where restaurant_name like '%Do'
    • 여러 조건으로 필터링하기
      • 논리연산자
        • AND (그리고) : 20세 이상이고 여성
          where age>=20 and gender='female'
        • OR (또는) : 20세 이상이거나 여성 (즉, 20세 이상의 남자, 20세 미만의 여성도 포함)
          where age>=20 or gender='female'
        • NOT (아닌) : 20세 이상이고 여성이 아닌 (즉, 20세 이상의 남성)
          where age>=20 not gender='female'

실습 예제

  • 상품 준비시간이 20~30분 사이인, 한국 음식점의 식당명과 고객번호 조회하기
    select restaurant_name, customer_id
    from food_orders
    where food_preparation_time between 20 and 30 and cuisine_type='Korean'

과제

  1. sparta_employees 테이블에서 모든 직원의 이름(name)과 직급(position)을 선택하는 쿼리를 작성해
    select name, position
    from sparta_employees
  2. sparta_employees 테이블에서 중복 없이 모든 직급(position)을 선택하는 쿼리를 작성해주세요.
    select distinct position
    from sparta_employees
  3. sparta_employees 테이블에서 연봉(salary)이 40000과 60000 사이인 직원들을 선택하는 쿼리를 작성해주세요.
    select *
    from sparta_employees
    where salary between 40000 and 60000
  4. sparta_employees 테이블에서 입사일(hire_date)이 2023년 1월 1일 이전인 모든 직원들을 선택하는 쿼리를 작성해주세요.
    select *

    from sparta_employees
    where hire_date<'2023-01-01'

AI Literacy

AI란? 일종의 software (SW)

단순 SW가 아니라, 능동적으로 비선형 상황을 처리하는 똑똑한 SW이다.

  • 선형 상황 : 일을 하고 노동의 대가로 월급을 받을 때 계좌이체로 받는다.
  • 비선형 상황 : 진상 고객 상대, 깨진 접시 청소, 계산, 홀매니저 등 다양한 상황이 발생 가능한 경우

즉, AI는 이런 다양한 상황들에 대해 능동적으로 처리하는 SW

 

상황에 맞게 AI를 사용하기 위해 필요한 작업 - 머신러닝(기계학습, machine learning)

지도학습, 비지도학습, 강화학습 등이 있다.

  • 지도학습 (규칙기반) : 기술자의 의도대로 규칙 기반, 정답 데이터를 알려주며 해당 로직을 수행하도록 학습시키는 방법
    • 장점 : 특정 상황에 대해서 빠르고 정확하게 처리 가능
    • 단점 : 다양한 상황에대한 유연성이 다소 떨어짐, 정답 데이터를 기술자가 많이 준비 해야함 (데이터 레이블링 필요)
    • ex) 스팸 메일 분류, 질병 진단, 성별 예측 등
  • 비지도학습 (패턴기반) : 특정 군집, 패턴을 인식하여 많은 정보 속에서 특정 공통점과 차이점을 인식
    • 장점 : 정답 데이터가 필요 없음
    • 단점 : 명확한 정답이 없음 (해석하기 나름)
    • ex) 상품 추천, 범죄 위험 지역 예측, 고객 분류 등

지도/비지도 학습은 상황에 따라 달리 사용한다. (어떤게 더 좋고 나쁘고 X)

다만, 최근에는 복합 학습 방법 사용이 증가하는 추세 → 해결해야 하는 상황이 고도화되고 있음

ex) 자율주행 자동차 등

분류/생성 AI 사례

학습 결과에 따라 AI의 결과물도 달라짐

  • 분류형 AI : 그림, 글, 신호 등 다양한 정보를 분류
    • AI 사례 : OpenCV, YOLO, NAIVE BAYES, SVM 등의 AI기 존재)
    • ex) 스팸 메일 분류, ECG, EMG, EKG 등의 생체 신호 분류, 안면인식 등
  • 생성형 AI : 어떠한 직접적인 산출물이 발생하면 모두 생성형 AI
    • AI 사례 : GPT, GROK, CLOUDE, Imagen 등의 LMM

일상생활에서 마주하는 AI

유튜브 (영상 추천 알고리즘), 아마존, 스마트스토어 (상품 추천 알고리즘), Apple Siri, 삼성 Bixby (개인 비서 AI), 능동형 CCTV (인구 밀도 측정), 인스타그램 (이미지 편집, 컨텐츠 추천 알고리즘), 스마트워치 (심박수 측정) 등

 

Quiz! 다음 중 생성형 AI에 해당하는 것은?

  1. 음성을 인식해서 답변하는 AI → 답변을 생성
  2. 이메일에서 스팸, 업무, 일반 내용으로 분류하는 AI → 메일을 내용에 따라 분류
  3. 타국의 언어를 번역해주는 AI → 기존의 텍스트를 번역 하는 것 (직접적인 생산물 산출 X)
  4. 얼굴을 인식하는 AI → 얼굴을 분석해서 대조·분류

 

Quiz! 다음 정의를 말해주세요.

  1. (단답형) AI를 성숙시키기 위해 하는 활동 : 머신러닝(지도,비지도,강화학습 등)
  2. (단답형) LLM과 같이 언어를 인식하여 답변하는 AI를 (생성)형 AI라 한다.
  3. (서술형) AI란?
    비선형적 상황에 대해 능동적으로 대처하는 인공지능 소프트웨어

당일 과제) 내 직무(품질관리)에서 이미 사용하고 있는 AI 사례 1가지 조사하여 TIL에 작성하기.

  • AI 비전검사
    • 인공지능 기술을 기반으로 한 고도화된 이미지 분석 시스템
    • 제품의 외관이나 내부 상태를 빠르게 파악하여 결함 여부를 자동으로 판별하는 검사 방식
    • 기존의 머신비전과 AI의 결합으로 딥러닝 알골리즘으로 학습한 수천 장의 이미지 패턴을 통해 미세한 불량, 복잡한 변형까지 스스로 인식할 수 있는 수준에 도달해 정확하고 반복성 있는 품질 관리를 가능하게 함
    • 장점
      • 검사 속도 향상 : 초당 수십 프레임 단위의 이미지 분석이 가능하여 생산 라인의 정체가 없음
      • 인력 비용 절감 : 단순 반복 검사를 AI가 대체하며 인력 투입 최소화
      • 검사 신뢰도 향상 : 기준 일관성 확보로 불필요한 과검 또는 누락 방지
      • ESG 평가 대응 : 제조 폐기물 감소, 불량률 저하 → 환경·사회 영향 개선
    • AI 비전 적용 사례
      • 전자부품 제조 : 불량률 20% 감소, 검사 속도 3배 이상 증가, 휴먼 에러로 인한 재검 건수 급감 등
      • 정밀 가공 산업 : 반복되는 가공 결함을 사전에 차단, 사람은 놓치기 쉬운 미세한 스크레치, 표면의 곡률 불균형 등 탐지
      • 자동차 부품 제조 사례 : 부품간 단차,  표면 강도 편차 등 정밀 계산이 필요한 영역에서 기존 장비 대비 10배 이상 높은 정밀도 구현
    • AI 비전검사 도입 시 고려사항
      1. 인프라와 환경 조건
        • 검사 대상의 크기·형태·조건에 따라 카메라 해상도, 렌즈 화각, 조명 종류 등이 변화
        • 실시간 처리 여부를 위해서는 높은 GPU 성능의 연산 장치 요구
      2. 소프트웨어 통합
        • MES나 ERP와 같은 기존 생산관리 시스템과의 연동 여부
      3. 운영 및 유지보수 계획
        • 딥러닝 모델은 사용 중에도 계속 학습하고 튜닝이 필요하기 때문에 정기적 유지관리 체계가 필요
        • 모델 업데이트 주기 관리와 오류 대응 플로우를 사전에 구성
      4. 비용
        • 초기 설치 비용, 유지보수, 정기 업그레이드 비용 등
        • ROI 관점에서 중장기 계획으로 접근
    • AI 비전검사의 미래 전망
      • 제조업의 표준 인프라로 자리 잡을 가능성 ↑
      • 이전보다 빠르게 더 많은 경우의 수를 정확히 판별할 수 있는 환경 조성되는 중
        (Transformer 기반 비전 모델, YOLOv8 클래스의 실시간 검출 엔진 상용화)
      • 제조 현장 자체가 점차 데이터 기반 공정 운영에 가까워짐
        → AI 비전검사는 단순 검사를 넘어 생산 흐름 최적화SPC(Statistical Process Control)로 까지 영역 확장 중
    • 향후 주목해야 할 키워드
      • AI + Edge Computing 확대 : 서버 없이 현장에서 실시간 검출 및 분석 가능
      • 멀티모달 센서 통합 : 카메라 이외에 열화상·레이저 연계로 복합 결함 탐지
      • 자율 학습 기반 모델 업데이트 : 신규 불량 등장 시 AI가 자동 학습하여 성능 유지
      • MLOps 체계 정착 : AI 검사운영관리 자동화를 통해 기술 의존도↓, 운영 안정성↑

ADsP

Chap 2. 데이터의 가치와 미래

빅데이터의 이해

  • 빅데이터 정의
    • "빅데이터는 일반적인 DB 소프트웨어로 저장·관리·분석할 수 있는 범위를 초과하는 규모의 데이터다." (McKinsey, 2011)
    • 더그 래니(Daug Laney)의 정의 (3V)
      • 데이터의 양 (Volume)
      • 데이터의 다양성 (Variety) : 데이터의 유형과 소스 측면
      • 데이터의 속도 (Velocity) : 데이터의 수집과 처리 측면
      • 이에 더해 빅데이터의 새로운 특징(4V)으로 Value (가치), Veracity (정확성)를 포함해 설명하기도 한다.
        (Visualization(시각화), Variability(가변성) 등을 추가하는 견해도 존재)
  • 빅데이터 정의의 범주 및 효과
    • 기존 방식으로는 얻을 수 없는 통찰 및 가치 창출
    • 데이터 변화 (3V)
               ↓
    • 기술 변화 (클라우드 컴퓨팅 활용 등)
               ↓
    • 인재·조직 변화 (데이터 사이언티스트와 같은 인재 필요, 데이터 중심 조직)

빅데이터의 출현 배경

  • 3가지 출현 배경
    • 산업계 (고객 데이터 축적) : 양질 전환 법칙
    • 학계 (거대 데이터 활용, 과학 확산)
    • 기술발전 (관련 기술의 발달)
      • 디지털화의 급진전, 저장기술의 발전과 가격 하락
      • 모바일 시대 진전에 따른 클라우드 컴퓨팅 보편화와 분산처리 기술 등의 발전
      • 빅데이터 처리 비용을 획기적으로 낮춘 측면에서 클라우드 컴퓨팅의 중요성↑

빅데이터 기능과 변화

  • 빅데이터의 기능
    • '산업혁명의 석탄, 철' : 제조업에 더해 서비스 분야의 생산성↑, 사회·경제·문화·생활 전반에 혁명적 변화 가져올 것 기대
    • '21세기의 원유' : 경제 성장에 필요한 정보를 제공 → 산업 전반 생산성↑, 새로운 범주의 산업 탄생 전망
    • '렌즈' : 렌즈를 통해 현미경이 생물학 발전에 미친 영향만큼, 빅데이터도 산업 발전에 큰 영향을 미칠 것으로 기대
      ex) 구글의 Ngram Viewer, 현미경
    • '플랫폼' : 공동 활용의 목적으로 구축된 유무형의 구조물, 다양한 서드파티 비즈니스에 활용되어 플랫폼 역할 수행을 기대
      ex) 페이스북, 카카오톡 등
  • 빅데이터가 만들어내는 변화
    • 처리 → 사처리 : 필요한 정보만 수집하고 그렇지 않은 정보는 버리는 시스템에서 최대한의 데이터를 모으고 다양한 방식으로 조합하여 숨은 인사이트를 발굴
    • 표본조사 전수조사 : 데이터 수집 비용 감소와 클라우드 컴퓨팅 기술의 발전데이터 처리 비용 감소 → 방대한 양의 데이터를 활용 가능하게 되며 전수조사로 변화
    • : 양질 전환 법칙
    • 인과관계 → 상관관계 : 특정 인과관계가 중요시 되던 과거 → 상관관계를 통해 특정 현상의 발생 가능성을 포착 → 그에 따른 행동을 추천하는 등의 인사이트 도출이 점점 확산

데이터의 가치와 미래

  • 빅데이터의 가치와 영향
    • 빅데이터의 가치 산정이 어려운 이유
      • 데이터 활용 방식 : 특정 데이터를 누가, 언제, 어떻게 활용하는지 파악 불가능
      • 새로운 가치 창출 : 기존에 없던 가치를 창출하는 것이 빅데이터
      • 분석 기술의 발전 : 오늘날에는 가치가 없는 데이터라도 추후 새로운 분석 기법의 등장으로 가치가 창출될 수 있음
    • 빅데이터의 영향 : 생활 전반의 스마트화
      • 기업 : 소비자 행동 분석, 시장 변동성 예측 → 비즈니스 모델 혁신,  신사업 발굴
      • 정부 : 기상, 인구이동, 각종 통계 등 수집 → 사회 변화 추정, 각종 재해관련 정보 추출 (미래 대응)
      • 개인 : 목적에 따른 활용 → 개인의 인지도 향상 (연예인, 정치인의 SNS 활용) 등
    • 미래의 빅데이터 활용에 필요한 3요소
      • 데이터 : 모든 것을 데이터화
      • 기술 : 진화하는 알고리즘, 인공지능
      • 인력 : 데이터 사이언티스트, 알고리즈미스트
  • 빅데이터 활용 기본 테크닉 7가지
    1. 연관 규칙 학습 (Association rule learning)
      • 변인들 간에 주목할만한 상관관계가 있는지 찾아내는 방법
      • 연관 분석 혹은 장바구니 분석으로도 불림 (고객이 구매한 물품들을 분석하여 품목 사이의 규칙성 파악)
      • 예시
        • 우유 구매자가 기저귀를 더 많이 구매하는가?
        • 커피를 구매하는 사람이 탄산음료를 더 많이 사는가?
    2. 유형분석 (Classification tree analysis)
      • 새로운 사건이 속할 범주/분류를 찾아내는 방법
      • 예시
        • 문서를 어떻게 분류할 것인가?
        • 조직을 어떻게 여러 그룹으로 나눌 것인가?
    3. 유전 알고리즘 (Genetic algorithms)
      • 최적화가 필요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화시켜 나가는 방법
      • 여러 세대를 반복하며 최적의 해, 좋은 근사해를 찾아나감
      • 예시
        • 최적화된 택배 차량 배치
        • 응급실에서 의사를 어떻게 배치해야 가장 효율적인가?
    4. 머신러닝 = 기계학습 (Machine learning)
      • 컴퓨터가 데이터로부터 규칙을 찾고 이를 활용해 '예측'하는 데 초점을 둔 방법
      • 훈련 데이터로부터 얻은 특성을 활용해 예측하는 방법 (데이터 학습 → 예측 모형)
      • 특정 하나의 분석 방법 X, 다양한 분석 알고리즘을 활용해 예측하는 분석 모델 자체를 말함
        ex) 의사결정나무, k-NN, 인공신경망, SVM, 군집, 딥러닝, 유전 알고리즘 등의 분석 알고리즘을 사용
      • 예시
        • 질병 진단 예측
        • 기존 시청 기록을 바탕으로 시청자가 보유한 영화 중 어떤 것을 가장 보고싶어 할까?
    5. 회귀분석 (Regression analysis)
      • 원인과 결과를 이용한 분석 (종속변수에대한 독립변수의 영향력을 분석)
      • 독립변수를 조작하며 종속변수의 변화를 보고 두 변인의 관계를 파악
      • 예시
        • 구매자의 나이가 차량의 타입에 어떤 영향을 미치는가
        • 상품 가격은 매출에 어떤 영향을 미치는가
    6. 감정분석 (Sentiment analysis)
      • 특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석하는 방법
      • 비정형 마이닝의 대표적인 기법
      • 예시
        • 새로운 환불 정책에 대한 고객의 평가는 어떤가?
        • 제품 후기에 나타난 고객의 감정은?
    7. 소셜 네트워크 분석 (SNA, Social Network Analysis)
      • 사회관계망 분석으로도 불리며, 유저 사이의 관계를 분석하여 오피니언 리더, 인플루언서를 찾아내는데 활용
      • 예시
        • 이 사람이 어느 정도 영향력이 있는 '인플루언서'인가?
        • 고객들 간의 관계망은 어떻게 구성되어 있나?
  • 빅데이터의 위기 요인과 통제 방안
      위기요인 통제 방안
    사생활 침해 개인정보 포함 데이터의 목적 외 활용은 사생활 침해 위협을 넘어 사회·경제적 위협으로 변형 가능

    ex) 여행 사실을 SNS에 업로드 후 빈집털이 강도 사건 발생
    '동의에서 책임으로'
    개인정보 사용자의 책임으로 해결
    책인 원칙 훼손 예측 알고리즘에 의해 잠재적 위협으로 분류되어 불이익을 얻을 가능성↑

    ex) 영화 '마이너리티 리포트', 특정 사회적/경제적 특성의 집단에 속한다는 이유로 자신의 신용도와 무관하게 대출 불가 판정
    '결과 기반 책임 원칙 고수'
    예측 자료에 의한
    불이익 가능성을 최소화
    데이터 오용 데이터의 고신 혹은 잘못된 지표의 사용으로 잘못된 인사이트를 얻어 비즈니스에 적용할 경우 직접적인 손실이 발생 가능, 과거의 데이터에 의존하기 때문에 이를 바탕으로 한 미래 예측은 위험할 수 있음

    ex) 베트남 전쟁 (적군의 사망자 수로 전쟁 승리를 예측하는 오류)
    '알고리즘 접근권 허용/인증'
    예측 알고리즘의 부당함을
    반증힐 방법을 명시·공개
    • 미국 연방거래위원회(FTC)의 '소비자 프라이버시 보호 3대 권고사항'
      • 기업은 상품 개발 단계에서부터 소비자 프라이버시 보호 방안을 적용
      • 기업은 소비자에게 공유 정보 선택 옵션 제공
      • 소비자에게 수집된 정보 내용 공개 및 접근권 부여
    • 데이터 비식별 기술
      • 데이터 마스킹 : 데이터의 속성은 유지한 채, 식별할 수 없는 임의의 값으로 대체
        ex) 대한민국 → 대**국
      • 가명처리 : 데이터의 값을 다른 값으로 변경하는 기술
        ex) 김종국 → 이광수
      • 총계처리 : 데이터의 총합 또는 평균 값을 보여 개별 데이터 값을 노출하지 않는 기술
        ex) 155cm, 160cm, 170cm → 162cm
      • 데이터값 삭제 : 필요 없거나 개인 식별에 중요한 값을 삭제
        ex) 서울시 강남구 → 서울시
      • 데이터 범주화 : 데이터 값을 범주화하여 특정 값을 숨기는 기술
        ex) 46kg → 40kg~50kg

가치 창조를 위한 데이터 사이언스와 전략 인사이트

  • 빅데이터 분석과 전략 인사이트
    • 빅데이터 분석의 핵심 : 'Big'이 아닌 'Insight'
      • 크기가 아닌 인사이트
        • 데이터의 크기 X → 어떤 시각과 인사이트(의미있는 정보)를 얻을 수 있느냐의 문제
        • 비즈니스의 핵심 가치에 집중, 이와 관련된 분석 평가 지표 개발시장과 고객 변화에 효과적으로 대응 할 수 있을 때 빅데이터 분석은 가치가 있음
        • 빅데이터와 관련된 걸림돌은 '비용' X, '분석적 방법과 성과에 대한 이해 부족'
      • 전략적 인사이트의 중요성
        • 단순히 데이터 분석을 많이 사용한다고 경쟁우위에 도달 X
        • 경쟁의 본질을 제대로 바라보지 못하면 쓸모없는 결과만 만들어냄
        • 이를 예방하기 위해 전략적 통찰력을 가지고 핵심적인 비즈니스에 집중하여 데이터 분석, 차별적인 전략으로 기업 운영해야 함
    • 일차원적인 분석 vs 전략 도출 위한 가치 기반 분석
      • 산업별 일차원적인 분석 (트레이딩, 공급/수요 예측은 에너지, 금융 X)
      • 전략 도출 위한 가치 기반 분석
        • 일차원적인 분석은 해당 부서나 업무 영역에서는 상당한 효과, 하지만 대부분 업계 내부의 문제에만 포커스
        • 이는 주로 부서 단위로 관리 → 비즈니스 성공에 핵심적인 역할을 기대하기는 어려움
        • 일차원적인 분석을 통해 분석 경험을 늘리며 작은 성공을 거두면 점차 분석의 활용 범위를 더 넓고 전략적으로 변화시킴으로써 전략적 인사이트를 주는 가치 기반 분석 단계로 나아가야함
        • 이 단계에 도달하면 분석은 경쟁의 본질에 영향을 미치고 기업의 경쟁 전략을 이끌 수 있다.
  • 전략 인사이트 도출을 위한 필요 역량
    • 데이터 사이언스의 의미와 역할
      • 데이터 사이언스는 의미있는 정보를 데이터로부터 추출해내는 학문
      • 통계학 (정형화된 실험 데이터를 분석) vs 데이터 사이언스 (정형/비정형을 막론하고  다양한 유형의 데이터를 분석)
      • 데이터 사이언티스트는 비즈니스의 성과를 좌우하는 핵심 요소를 정확하게 겨냥할 수 있어야함 (소통력이 필요)
    • 데이터 사이언스와 데이터 사이언티스트
      • 데이터 사이언스의 핵심 구성요소
        • Analytics (분석적 영역) : 수학, 확률 모델, 머신러닝, 분석학, 패턴 인식과 학습, 불확실성 모델 등
        • IT (Data Management, 데이터 처리와 관련된 IT 영역)
          : 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 고성능 컴퓨터 등
        • 비즈니스 분석 (비즈니스 컨설팅 영역) : 커뮤니케이션, 프레젠테이션, 스토리텔링, 시각화 등
      • 데이터 사이언티스트의 요구 역량
        • Hard skill
          1. 빅데이터에 대한 이론적 지식 : 관련 기법에 대한 이해와 방법론 습득
          2. 분석 기술에 대한 숙련 : 최적의 분석 설계 및 노하우 축적
        • Soft skill
          1. 통찰력 있는 분석 : 창의적 사고, 호기심, 논리적 비판
          2. 설득력 있는 전달 : 스토리텔링, 시각화
          3. 다분야 간 협력 : 커뮤니케이션
    • 데이터 사이언티스트 : '과학과 인문학의 교차로'
      • 전략과 인사이트 도출을 위한 인문학
        • 기업들이 경영 전략을 수립하는 소프트 스킬이 필요 → 인문학에서 비롯되는 소프트 스킬
        • 데이터 사이언티스트는 스토리텔링, 소통 능력, 창의력, 비판적 시각 등의 역량이 필요 (인문학의 주요 주제)
        • 공급자 중심의 기술 경쟁하에서는 '산출물' 중시, 소비자의 재미·편의를 이해하기 위해서는 '창조 과정'에 주목하는 인문학적 통찰력이 필요 → 비즈니스 핵심가치 이해, 고객과 직원의 내면적 요구를 이해하는 능력 요구
        • 외부 환경에서 본 인문학의 열풍
          외부 환경 변화
          컨버전스 → 디버전스
          컨버전스 : 여러 기능·기술이 하나로 융합(수렴)되는 현상
          디버전스 : 융합된 기능이 다시 분화(분산)되는 것
          단순 세계화 → 복잡 세계화
          생산 → 서비스 제품생산 → 서비스
          생산 → 시장 창조 기술 경쟁 → 무형 자산의 경쟁
      • 인문학적 사고의 특성
        구분 정보 통찰
        과거 무슨 일이 일어났는가?
        ex) 보고서 작성 등
        어떻게, 왜 일어났는가?
        ex) 모델링, 실험 설계
        현재 무슨 일이 일어나고 있는가?
        ex) 경고
        차선 행동은 무엇인가?
        ex) 권고
        미래 무슨 일이 일어날 것인가?
        ex) 추측
        최악 또는 최선의 상황은 무엇인가?
        ex) 예측, 최적화, 시뮬레이션

빅데이터 그리고 데이터 사이언스의 미래

  • 가치 패러다임 변화
    과거 현재 미래
    디지털화
    (Digitalization)
    연결
    (Connection)
    에이전시
    (Agency)
    - 아날로그의 효과적인 디지털화가 가치 창출의 원천 - 디저털화된 정보와 대상들이 서로 연결되어, 이 연결이 얼마나 효과적·효율적으로 제공 되는가  - IoT의 성숙과 함께 연결이 증가하고 복잡해져, 이를 얼마나 효과적이고 신뢰성있게 관리하는가가 이슈
    - 데이터 사이언스의 역량에 좌우
    ex) 운영체제, 오피스 프로그램 등 ex) 구글의 검색 알고리즘 등 -
  • 데이터 사이언스의 한계와 인문학
    • 데이터 사이언스의 한계
      • 분석 과정에서 가정 등 인간의 해석이 개입되는 단계를 반드시 거침
      • 데이터 분석은 100% 완벽하지 않다는 한계가 반드시 존재하나, 정보가 뒷받침되지 않는 직관보다는 나음
    • 데이터 사이언티스트에게 요구되는 인문학
      • 인문학자처럼 모델의 능력에 대해 항상 의구심을 가지고, 가정과 현실의 불일치에 대해 끊임없이 고찰하고, 분석 모델이 예측할 수 없는 위험을 살피기 위해 현실 세계를 주시해야 함
      • 그럴 때 비로소 빅데이터에 가려진 잠재력을 끌어내고, 새로운 기회를 창출하고, 새로운 창조의 힘을 발휘

출처

전용문, 박현민 지음, 2026 ADsP 데이터분석 준전문가, 위키북스

내일배움캠프 교육 자료

'TIL > 내일배움캠프' 카테고리의 다른 글

쿼리로 데이터베이스 다루기  (0) 2026.04.27
AI와 대화? 프롬프팅  (0) 2026.04.26
나는 AI를 잘 사용하고 있을까?  (1) 2026.04.23
GPT는 LLM?  (1) 2026.04.22
JD 분석이란?  (1) 2026.04.21