특화형 Small VLM 설계 및 Scratch 구현
특정 도메인(차량, 동물 등)에 특화된 경량 VLM 구축 시도함. Scratch부터 시작해서 학습 효율 높이는 방향으로 구조 잡음. Image Captioning이랑 Detection 둘 다 잡으려고 설계함. 메시지 엄청 주고받으면서 모델 아키텍처랑 데이터 파이프라인 빡세게 논의함.
이 날의 포인트
- 도메인 특화형 경량 VLM 아키텍처 설계
- Captioning 및 Detection 통합 구조 논의
- Scratch 구현을 위한 학습 전략 수립
세션별로 뭘 시켰나 (1개)
-home-son-prj-small-vlm
16:09 — 06:10
1193개 메시지
작은 vlm을 만들어보고 싶어. 차량이나, 동물같은 특정 데이터셋을 한정해서, 학습 시간을 줄이는 대신에 그 분야에 대해서는 image captioning이나 detection을 할 수 있게 하는. 혹시 scratch부터 만들어보려고 하는데, 도와줄래?