NPC 음성 데이터 STT 및 JSON 추출 작업
data/raw/ogg 폴더 내 ogg 파일들 전부 STT 돌림. 특정 대사('안녕하세요, 세리아 키르민이에요') 찾는 게 목적임. 2,500개 분량의 JSON 데이터 생성 작업 진행함. 메시지 양 보니 꽤 오래 붙잡고 씨름함.
이 날의 포인트
- OGG 음성 파일 한글 텍스트화
- 대량의 음성 데이터 STT 자동화
- 2,500개 규모의 JSON 데이터셋 구축
세션별로 뭘 시켰나 (2개)
-home-son-prj-dnf-03-npc-voice-gen
07:04 — 07:04
3개 메시지
(시스템 메시지만 있음)
-home-son-prj-dnf-03-npc-voice-gen
07:07 — 17:36
481개 메시지
data/raw/ogg 하위의 음성파일을 stt해서, 각 오디오 파일을 한글 텍스트화해줘. "안녕하세요, 세리아 키르민이에요" 를 찾고 싶어. 2500개의 json을 일단 만들어줘.