'분류 전체보기' 카테고리의 글 목록

여러 RAG 기법

2025.04.16·

데이터 사이언스/RAG 엔지니어링

1. Adaptive RAG질문의 복잡도, 난이도에 따라서 가장 적합한 검색 및 생성 전략을 동적으로 선택하는 방법 단순한 질문, 좀 가벼운 LLM 입장에서 답변하기 쉬운 그런 단순한 질문 같은 경우 단순한 구조의 RAG 체인을 사용.복잡한 질문, 좀 풀어내기 어려운 질문에 대해서는 반복적으로 여러번 RAG 전략을 사용하는 기법.문제의 난이도에 따라서 레그 전략을 다르게 가져가는 방법. Adaptive RAG 작동 방식1. 사용자 질문의 복잡성 수준을 분석2. 분석 결과에 따라 가장 적합한 처리 전략을 선택 - 단순 질문 : 기본 LLM 또는 단순 검색 - 중간 복잡성 : 단일 단계 검색 증강 LLM 사용 - 복잡한 질문 : 여러 단계의 검색과 추론을 수행3. 선택된 전략에 따라 질문을 ..

간단 시간복잡도

2025.02.27·

공부 정리/이것저것

Python의 List 연산에 대한 시간복잡도 Indexarr[i]O(1)Lengthlen(arr)O(1)Appendarr.append(4)O(1)Poparr.pop()O(1)Slicearr[a:b]O(b-a)Extendarr.extend(...)O(len(...))Insertarr.insert(i, v)O(N)Deletedel arr[i]O(N)Poparr.pop(i)O(N)ReverseArr.reverse()O(N)Sortarr.sort()O(N LogN)Iterationfor i in arr:O(N)Storearr[i] = vO(1) Python Dictionary 연산의 시간복잡도 Indexd[k]O(1)Stored[k] = vO(1)Lengthlen(d)O(1)Deletedel d[k]..

간단 선형대수 용어 정리

2025.02.26·

공부 정리/면접 준비

차원의 저주 (The curse of dimensionality) - 데이터 학습을 위해 차원이 증가하면서 상대적으로 데이터가 Sparse해지고 모델의 성능이 떨어지는 현상 차원 축소 (Dimensional Reduction) - 고차원 데이터를 저차원 데이터로 변환하는 방법 - Feature Selection (특성 선택): 통계적인 방법을 이용해 feature들의 중요도에 순위를 정해서결정하는 방법 (ex. 상관분석, 전/후진선택 등) - Feature Extraction (특성 추출): 기존 Feature들을 이용하여 유용한 Feature를 새롭게 생성하는 방법 (ex. PCA, LDA) PCA와 LDA- PCA(Principal Component Analysis, 주성분 분석) : 변수 간 상관관..

확증적 데이터 분석 vs 탐색적 데이터 분석

2025.02.26·

공부 정리/면접 준비

확증적 데이터 분석 (CDA)가설을 설정한 후 수집한 데이터로 가설을 평가하고 추정하는 전통적인 분석 방법.재현성, 유의성 검정, 신뢰구간 추정 등의 통계적 추론을 이용.탐색적 데이터 분석 (EDA)데이터를 가지고 여러 방향으로 데이터를 탐색하고, 데이터의 특징과 구조로부터 얻은 정보를 바탕으로 통계모형을 만드는 분석 방법 ------- 확증적 데이터 분석(Confirmatory Data Analysis, CDA)과 탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 데이터 분석의 두 가지 주요 접근 방식으로, 각각의 목적과 방법론이 다릅니다. 1. 탐색적 데이터 분석 (Exploratory Data Analysis, EDA)탐색적 데이터 분석(EDA)은 데이터가 가지고 있는..

LangGraph 기본 개념

2025.02.26·

공부 정리/면접 준비

AI Agent란?1. AI를 통해 의사결정 및 판단하는 프로그램2. LLM Agent란? - 의사 결정의 도구로 LLM을 활용하는 Agent- 좋은 Agent를 만들려면 LLM을 잘 활용할 수 있어야하는데 잘 활용하기 위한 도구가 LangGraph LangGraph 랭그래프는 Stateful하고 Orchestration Framework1. Stateful상태를 유지한다. Agent니까 멀티 Agent의 경우 서로 소통하고 협력을 하는데 그때의 중간중간마다 결과물이 있는데, 그것을 여기서 말하는 상태라고 합니다.여기의 상태는 챗봇의 채팅 히스토리와 유사하다.2. Orchestration FrameworkAgent가 협업할 때 어떻게 협업할 지 정해줘야한다. DevOps해보면 Kubernetes 활용해..

Regularization vs. Normalization

2025.02.19·

공부 정리/인공지능

개념 Regularization (규제) Normalization (정규화) 목적과적합(Overfitting) 방지학습 속도 향상 및 안정화적용 대상모델의 가중치(Weight)입력 데이터(Feature)사용 기법L1, L2 정규화(Weight Decay), DropoutMin-Max Scaling, Z-score Scaling효과모델이 복잡해지는 것을 방지하여 일반화 성능 향상입력값의 범위를 일정하게 조정하여 학습을 빠르고 안정적으로 만듦 Regularization (규제)"모델이 너무 복잡해지는 걸 방지하는 기법"과적합(Overfitting)을 막기 위해 모델의 가중치를 제한하는 방식.예제:L1 정규화 (Lasso, 가중치 절댓값 패널티)L2 정규화 (Ridge, Weight Decay, 가중치 제..

DFS와 BFS - Python

2025.01.08·

코딩 테스트/백준

[Silver II] DFS와 BFS - 1260문제 링크성능 요약메모리: 35660 KB, 시간: 348 ms분류그래프 이론, 그래프 탐색, 너비 우선 탐색, 깊이 우선 탐색제출 일자2025년 1월 8일 06:10:00문제 설명그래프를 DFS로 탐색한 결과와 BFS로 탐색한 결과를 출력하는 프로그램을 작성하시오. 단, 방문할 수 있는 정점이 여러 개인 경우에는 정점 번호가 작은 것을 먼저 방문하고, 더 이상 방문할 수 있는 점이 없는 경우 종료한다. 정점 번호는 1번부터 N번까지이다.입력첫째 줄에 정점의 개수 N(1 ≤ N ≤ 1,000), 간선의 개수 M(1 ≤ M ≤ 10,000), 탐색을 시작할 정점의 번호 V가 주어진다. 다음 M개의 줄에는 간선이 연결하는 두 정점의 번호가 주어진다. 어떤 두 ..

가상 함수 동작 원리 - 가상 함수 테이블

2025.01.06·

공부 정리/이것저것

가상함수는 어떻게 동작하는 것일까?어떻게 객체가 컴파일때는 어떤 클래스인지 모르면서 함수 동작은 해당 클래스에 맞춰서 할 수 있는 것일까?가상함수를 지원하는 C++은 C보다 살짝 더 느린데 왜그럴까? 가상함수의 동작원리에 대해 알아보도록 하자. 다음과 같은 C++ 코드가 있다고 가정해보자. #include using namespace std;class AAA{private: int num1;public: virtual void Func1() { coutFunc1(); BBB * bptr=new BBB(); bptr->Func1(); return 0;}// 실행 결과// Func1// BBB::Func1 한 개 이상의 가상함수를 포함하는 클래스는 컴파일러가 '가상함수 테이블'..

티스토리툴바