← 전체 날짜로
2026-04-05 building

NPC 음성 데이터 STT 및 JSON 추출 작업

data/raw/ogg 폴더 내 ogg 파일들 전부 STT 돌림. 특정 대사('안녕하세요, 세리아 키르민이에요') 찾는 게 목적임. 2,500개 분량의 JSON 데이터 생성 작업 진행함. 메시지 양 보니 꽤 오래 붙잡고 씨름함.

이 날의 포인트

  • OGG 음성 파일 한글 텍스트화
  • 대량의 음성 데이터 STT 자동화
  • 2,500개 규모의 JSON 데이터셋 구축

세션별로 뭘 시켰나 (2개)

-home-son-prj-dnf-03-npc-voice-gen 07:04 — 07:04 3개 메시지

(시스템 메시지만 있음)

-home-son-prj-dnf-03-npc-voice-gen 07:07 — 17:36 481개 메시지

data/raw/ogg 하위의 음성파일을 stt해서, 각 오디오 파일을 한글 텍스트화해줘. "안녕하세요, 세리아 키르민이에요" 를 찾고 싶어. 2500개의 json을 일단 만들어줘.