분류 전체보기 146
-
1. LLM이 생성한 텍스트에서 할루시네이션(Hallucination)이란 무엇이고, 왜 문제가 되나요? 여러 LLM 서비스들은 할루시네이션 문제를 어떻게 극복하려고 시도 중일까요? 구글링 등을 통해 자유롭게 리서치해보세요. 1) 할루시네이션(Hallucination)이란?LLM이 출력한 텍스트 중 사실이 아니거나 근거가 없는 내용, 또는 모델 내부에서 만들어낸 잘못된 정보가 진실인 것처럼 표현된는 현상.즉, 실제 데이터/사실과 일치하지 않지만 모델이 자신 있게 주장하는 문장들을 뜻한다.유형외부 근거 불일치(Extrinsic): 모델이 외부 지식을 잘못 인용하거나 존재하지 않는 사실을 창작함예: 존재하지 않는 논문·통계·인용문을 만들어냄내부 논리 오류(Intrinsic): 모델 내부 추론에서 모순 또는 ..
-
1. BERT와 GPT의 주요 차이점은 무엇인가요?각각의 기본 구조와 작동 방식, 적합한 NLP 응용 분야를 위주로 설명해주세요. BERTGPT개요 요약양방향(비순차) 컨텍스트를 학습하는 인코더 기반 모델로, 입력 저체 문맥을 동시에 고려해 문장 이해(표현 학습)에 강하다.주로 분류, 태깅, 질의응답 등 이해 과제에 적합Autoregressive(왼→오)디코더 기반 생성 모델로,이전 토큰을 조건으로 다음 토큰을 예측하는 방식으로 학습한다.텍스트 생성, 완성, 대화형 응용에 강함아키텍처트랜스포머의 인코더 블록만 사용입력 전체의 모든 토큰이 서로를 참조하는 self-attention(양방향)을 사용함트랜스포머의 디코더 구조를 사용.마스킹된 어텐션을 써서 각 시점은 이전 토큰들만 참조한다(단방향)입력 처리..
-
1. 텍스트 데이터를 모델에 적용하기 전에 어떤 전처리 과정을 거치나요?정제(Cleaning): 노이즈 제거와 표준화를 통해 일관된 텍스트로 만든다.토크나이징/인코딩 : 토큰 단위로 쪼개고 숫자 시퀀스로 변환한다.정규화/정렬: 길이, 대소문자, 특수기호, 공백 등을 일관되게 맞춘다.특수 목적 처리: 불용어, 표제어/어간, 오탈자, 이모지/URL/코드 블록 등 도메인별 룰을 적용한다.레이블/메타 처리: 지도 학습이면 레이블 정제, 불균형/누락 처리, 샘플 재가공을 수행한다. 단계별 상세기본정제공백 정리, 중복 문자 축약, 제어문자 제거, 잘못 인코딩된 문자 정정URL, 이메일, 숫자 패턴, 해시태그/멘션, 이모지 처리 규칙을 정의(보존/마스킹/삭제 중 선택)대소문자 통일: 영어는 소문자화가 보편적이나, ..
-
1. Semantic Segmentation이란 무엇이며, 이미지 분류(Classification)와 어떤 차이가 있나요? Semantic Segmentation이란?이미지의 모든 픽셀에 대해 어떤 클래스인지 예측해, 입력과 동일한 해상도의 픽셀별 레이블 맵을 생성하는 테스크를 의미한다."어디에 무엇이 있는지"를 구분한다.이미지 분류와의 차이점분류는 이미지 전체에 하나의 레이블을 예측해 "무엇이 있는지" 판단하는데, 세그멘테이션은 픽셀 단위로 레이블을 예측한다. 따라서 출력이 분류는 단일 레이블(또는 확률 벡터)로 나오는 반면, 세그멘테이션은 입력과 같은 크기의 다채널 마스크(픽세별 클래스)로 나온다.더보기 2. Fully Convolutional Networks(FCN)의 주요 특징과 기존 CNN 기..
-
1. Appstore에서 Xcode 설치하기 2. 터미널에서 homebrew 설치 HomebrewThe Missing Package Manager for macOS (or Linux).brew.sh/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" 설치완료 후 확인brew help zsh: command not found: brew위와 같은 오류가 뜬다면eval $(/opt/homebrew/bin/brew shellenv)입력 후 brew help 다시 3. homebrew로 git 설치brew install git 설치 완료 되면 git 버전 확인 및 user config 설..
-
코랩 컴퓨팅 소스 없어질까봐 무서워서 세팅해봄***아나콘다 설치해야됨 Extensionpython, jupyter 받고 가상환경 및 커널 생성25.08.30 기준 pytorch 사용하려면 Python 3.8 ~ 3.12 버전 선택해야함터미널에서 한줄씩 실행conda create -n [가상환경 이름] python=[원하는 파이썬 버전]conda activate [환경이름]pip install jupyterpip install ipykernelpython -m ipykernel install --user --name [가상환경 이름] --display-name "[jupyter에 표시될 kernel의 이름]" 가상환경 목록 확인 및 삭제conda info --envsconda remove --nam..
-
1. YOLO(You Only Look Once) 모델의 주요 특징과 장점은 무엇인가요?YOLO는 이미지를 “한 번만” 훑어 전체를 격자 단위로 나눠 동시에 객체의 위치(바운딩 박스)와 클래스 확률을 예측하는 단일 단계(원스테이지) 객체 감지 모델이다. 이 단일 패스 구조 덕분에 매우 빠르면서도 실용적인 정확도를 제공한다.주요 특징단일 단계 감지(One-stage)별도의 후보영역(Region Proposal) 생성 없이, 한 번의 전방향 패스로 박스와 클래스를 동시에 예측격자 기반/앵커(예측입력을 격자로 나누고 각 셀(또는 특성 맵 위치)에서 여러 박스를 예측. 다중 스케일 특성 활용FPN/PAN 등으로 작은 물체부터 큰 물체까지 다양한 스케일에서 감지 성능을 높인다.NMS 후처리중복 박스를 비최대억제(..
-
1. 이미지를 모델에 입력하기 전에 리사이징(Resizing)과 정규화(Normalization)를 하는 이유는 무엇인가요?1) 리사이징(Resizing)을 하는 이유입력 크기 통일모델은 고정된 입력 해상도를 기대하는 경우가 많음크기를 맞춰야 배치 처리가 가능하고 메모리/연산량을 예측할 수 있음연산 비용 관리: 큰 이미지는 GPU와 연산 시간이 증가함field와 스케일 일관합성곱 필터의 수용야 대비 객체 크기가 표준화되면 특징 학습이 안정적입력 스케일이 들쭉날쭉하면 같은 필터가 다른 의미로 작동할 수 있어 학습이 어려워짐데이터셋 간/내 편차 감소: 서로 다른 원본 해상도를 공통 크기로 맞추면 분포가 덜 산란해져 일반화에 유리 실무 팁분류: 224×224, 256×256 같은 표준 크기를 많이 사용탐지/분..