목록분류 전체보기 (12)
MJ's Blog

모든게 블랙박스?현재 산업계에서 99%+ 의 실무 AI 시스템이 블랙박스로 사용되며 OpenAI GPT, Google Gemini, Meta Llama 등 모두 내부 작동 원리 불명한 상황 (기업들도 자신들의 모델이 정확히 어떻게 작동하는지 모름)그래서 Mechanistic Interpretability와 같이 모델 내부를 파악하려는 노력도 많이 생기고 있는것 같지만 아직 이분야는 비주류인 상황블랙박스라서..많은 icml의 주제들이 모델 내부 자체를 이해하지 못하기 때문에, input으로 이런걸 넣어봤더니 output으로 이런게 나오더라 와 같은 내용이 많았음 ex) Training a Generally Curious Agent : 좁은 파인튜닝이 광범위한 정렬 실패를 야기할 수 있다는 논문 ex) tu..

인사이트 정리1. 효율적인 에이전트 개발 기존 LangChain 기반 시스템에서 도구 구성과 연결에 많은 시간을 들였다면, ADK는 개발자가 직접 Python 코드로 오케스트레이션 및 동작 정의가 가능해져 더 정밀한 제어와 테스트 가능해 에이전트 개발의 부담을 줄이고 핵심 로직에 집중할 수 있는 구조라고 판단됨 2. 작업 모듈화 root agent ↔ sub agent 구조를 통해 모듈화된 작업 분담이 가능하여 이를 잘 활용하면 사내 검색 시스템 내에서도 task별 분리된 에이전트 설계를 적용 가능할것으로 보임 (예: 문서 요약 ↔ 검색 ↔ 인사이트 추출 분리). 3. 세션 및 상태 관리 State, memorybank, artifact 개념을 활용하면 사용자별 대화 기록이나 작업 맥락을 효과적으로 관리..

테이블 정보PK (Primary Key) = 기본키각 행을 유일하게 식별하는 컬럼으로 전체 테이블(ex)위와 같은경우 7개 테이블 전체)에서 절대 중복되지 않는 값이다. PK는 NULL(빈값)이 될수없으며 각 테이블마다 딱 하나만 존재하고, 이 PK값을 다른테이블에서 참조값으로 사용할수도 있다. FK (Foreign Key) = 외래키다른 테이블의 PK를 참조하는 컬럼이다. 즉 오리지널은 PK고, 이 FK는 오리지널 값을 다른 테이블로 부터 빌려온 개념.그래서 FK는 다른 테이블과의 연결고리 역할한다.FK는 중복 가능하다. (여러 직원이 같은 부서에 있을 수 있으니까) Practice1. 모든 직원의 이름(first_name, last_name)과 이메일 주소를 조회링크 2. 'IT' 부서에 속한 ..
Indexing인덱싱이란 db검색을 좀 더 빠르고 효율적으로 수행하기 위해 정의된 개념이다. 인덱싱을 해서 데이터 대소를 비교해 정렬해두고, 이를 이진탐색을 통해 검색하면 훨씬 빠르게 검색을 수행할 수 있기 때문이다. 실제로 인덱싱을 해두지 않은 db는 검색 시 Full Table Scan을 하게 되는데, 이는 모든 데이터 칼럼을 까서 하나씩 비교해 검색하는 방식으로 매우 비효율적이다.데이터베이스에서 자주 검색하는 컬럼에 선별적으로 인덱스를 붙여줘서 해당 컬럼을 검색하는 속도를 높여 주는 것데이터베이스에서 인덱스 없이 검색하면 Full Table Scan을 하기 때문에 시간&비용 비효율적인데, 인덱싱을 해놓으면 이진탐색이 가능해 더 빠르고 효율적으로 검색이 가능인덱싱이란? 모든 데이터 타입에는 데이터의 ..
# nginx 1.27.5를 베이스 이미지로 사용FROM nginx:1.27.5# 로컬의 index.html 파일을 컨테이너의 nginx html 디렉토리로 복사COPY index.html /usr/share/nginx/html/index.html# nginx는 기본적으로 80포트에서 실행됨EXPOSE 80 FROM nginx:1.27.5 FROM: "이 이미지를 기반으로 시작하겠다"는 의미nginx:1.27.5: 이미 만들어진 nginx 웹서버 이미지 (버전 1.27.5) COPY index.html /usr/share/nginx/html/index.html COPY: "파일을 복사하겠다"는 의미index.html: 내 컴퓨터(로컬)에 있는 파일/usr/share/nginx/html/index.html..
일반화(generalization)일반화는 모델이 학습한 데이터 이외의 새로운 데이터에도 잘 작동하도록 하는 것.즉 말그대로 특수한 데이터에만 성능이 잘 나오는게 아니라 일반적으로(general하게) 모든 데이터에 성능이 잘 나오도록 하는 것을 의미함. 정규화(regularization)정규화는 과적합을 방지하는 기법들기법들은 보통 모델의 복잡도를 제한하는 방식으로 만들어져있는데, 이는 모델이 너무 복잡해지면 훈련데이터만 외우게 되기 때문임. (모델이 더 복잡해질수록 과적합 가능성이 커짐) 전통적으로 무작위 라벨링, 즉 패턴이 없는 데이터에 대해선 학습이 매우 어려울 것으로 예상했었다. 왜냐하면,모델이 복잡하고 매개변수가 많을수록 특정 정답에 과적합하기 쉬울것으라고 생각했기 때문이다. 논문의 발견은 아래..
특징멀티프로세싱 (Multi Processing)멀티스레딩 (Multi Threading)비동기 (Async)동시성(Concurrency)여러 프로세스가 독립적으로 실행하나의 프로세스 내에서 여러 스레드가 동시에 실행단일 스레드에서 I/O 대기 시간 동안 다른 작업 수행병렬성(Parallelism)실제 병렬 실행 (여러 CPU 코어 활용)제한된 병렬 실행 (GIL 제약이 있는 Python의 경우)병렬 실행이 아님 (동시성만 제공)실행 단위프로세스스레드코루틴(Coroutine)메모리 공간독립적인 메모리 공간공유 메모리 공간공유 메모리 공간공유 자원 Lock 필요거의 필요 없음 (프로세스 간 통신 필요)필수적 (공유 자원 접근 시 경쟁 상태 방지)협력적 멀티태스킹으로 인해 대부분 불필요주 사용처CPU 집약적..

들어가기 앞서 관계형 데이터베이스의 구조를 살펴보자면, 관계형 데이터베이스는 기본적으로 데이터가 저장되는 테이블들의 집합이고, 이러한 테이블들은 각각의 필드를 기반으로 구성되어 있다. 위 와 같이 테이블 3개의 집합이 '데이터베이스', 위 각각 표가 '테이블', 각 테이블의 한 행 이 '레코드' 이다. 아래는 위에서 설명된 관계형 데이터베이스 구조의 순서대로 Mysql에서 생성 하는법을 다룬다. 1. 데이터베이스 기본적으로 spl 명령어는 'mysql command line client'를 통해 입력한다. 1) 존재하는 데이터베이스 확인 show databases; 2) 데이터베이스 생성 create database '데이터베이스 명'; 데이터베이스 생성 예시 ------------------------..

1. 개요 1.1 Abstract : 인풋 이미지를 NeRF(Neural Radiance Field) 로 전이시킬 수 있는, 비지도 & single-shot 프레임워크 : 주요한 아이디어는, generative한 NeRF 모델을 사용해서 없는 geometry 정보를 보간하는 것 : 이미지를 latent space 와 generative NeRF model 으로 매핑 시키는 인코더 (latent space와 NeRF model은 dependent 한 관계) 1.2 기존 NeRF의 한계점 : 주어진 이미지에 오버피팅 되거나, 이미지가 많이 필요하다는 점 : train 시간이 과하게 많이 걸림 : general 한 NeRF 모델을 만들기 위한 시도도 있었으나, 이는 multi-view 이미지에만 잘 작동하는 ..

1. ABSTRACT & INTRODUCTION 1.1 Inverse graphics 소개 및 현 문제점 'Inverse graphics'는 한장의 2D 이미지로 3D 형상을 예측하는 기술을 의미한다. * inverse graphics 한장의 사진에서 해당 물질의 생김새, 질감, 물성, 채도 등의 특성을 알아내어 물질의 3D 형상을 예측하는 것. inverse graphics는 현재 AR/VR, 로보틱스, 컴퓨터 비전등 다양한 분야에서 사용되고 있음. Inverse graphics를 구현하기 위해 많은 노력이 있었고, 현재까지 구현된 기술에는 아래 2가지 문제점이 존재해 왔음 : synthetic 데이터의 낮은 성능 보통 inverse graphics를 구현하기 위해선, 3D 라벨을 사용해 신경망을 훈련..