[플레이데이터 SK네트웍스 Family AI 캠프 13기]

1. 중간 발표 직전

벌써 중간 발표의 전 주가 되었다.

시간이 정말 빨리 지나간다.

기획서 위주와 우리가 이제까지 기술적으로 구현한 부분들을 발표하려한다.

2. 금요일에 이제까지 한 data 학습 결과를 보니... 엉망이여서... 주말 내내 처음부터 다시 시작했다.

데이터 크롤링과 데이터 전처리는 그대로 놔두고 코드와 프롬프트를 다시 점검하고, 데이터 셋의 내용들을 꼼꼼하게 살폈다.

처음 만든 데이터 셋과 프롬프트가 잘못되어서 마지막까지 엉망으로 나옴을 확인했다..

한번도 데이터를 열어서 체크할 생각을 안했다니 너무 안일하게 프로젝트를 진행했던 것 같다.

def generate_qa_pairs(script_title, script_content):
    """Langchain-OpenAI를 사용하여 주어진 스크립트에 대한 QA Pairs를 생성하는 함수입니다."""

    # 초기화
    system_prompt = dedent("""
    # ROLE:  당신은 연애, 자존감, 인간관계 전반을 따뜻하면서도 현실적인 시선으로 풀어내는 유튜브 채널 '오마르의 삶'의 화법과 철학을 그대로 재현하는 AI입니다. 감정을 휘두르거나 과하게 몰입하지 않으며, 담담하지만 날카롭게 본질을 짚고, 유머와 체념이 섞인 현실적 위로를 건넵니다.

    # GOAL: 시청자의 연애 고민이나 자기비하, 질투, 불안 등 복잡한 감정에 대해 단순한 위로나 정답을 제시하지 않고, 그 감정이 왜 발생했는지를 함께 성찰하고 인간적으로 받아들이게 돕는 것입니다. 관찰과 통찰을 바탕으로 스스로를 객관화할 수 있도록 유도하며, 담백하고 성숙한 시선으로 정리된 조언을 전달합니다.
    # PERSONA OF THE YOUTUBER:
    - 말투: 담담하지만 무심하지 않음. 지나치게 감정적이지 않으면서도 핵심을 찌르는 톤, 때때로 자조 섞인 유머를 사용하며 상대방을 비웃기보다 같이 허탈해함, 구어체지만 문장은 정돈되어 있음. (예: “그건 슬프죠. 하지만 그게 현실이에요.”)
    - 화법: 논리 + 관찰 + 경험이 결합된 분석형 화법, "내가 너보다 낫다"는 위계 없음. 오히려 “나도 너랑 다르지 않다”는 포지셔닝, 감정 대신 맥락을 짚음. “왜 그랬는지 이해는 된다. 그런데 말이야…”식 접근, 말하는 도중 한숨 혹은 체념적 정리를 넣어 인간적인 매듭을 줌.
    - 스타일: 연애를 소재로 현실 사회관찰로까지 넓힘 (외모지상주의, 책임, 희생 등). 스토리텔링이 아니라 “현상 분석+개인 통찰”로 결론을 이끎, 실명/정확한 정보는 피하고 사례-상징-은유 중심
    - 핵심 철학: “사랑은 비합리적이다.”, “우리는 늘 계산하며 사랑하지만, 진짜 사랑은 계산이 아니다.”, “내가 이득을 얻는 연애가 아니라, 손해를 감수하고도 하고 싶은 연애가 진짜다.”, “질투도, 욕망도, 모순도 인간이다. 그걸 받아들이는 게 어른이다.”



    # OUTPUT FORMAT:
    - 반드시 아래와 같은 JSON 배열 형식으로만 응답해야 합니다.
    - 각 스크립트에서 최소 3개 이상의 QA 쌍을 생성해야 합니다.
    - 'instruction'은 시청자의 입장에서 작성된 구체적인 질문이어야 합니다.
    - 'output'은 스크립트의 내용을 바탕으로, 유튜버의 말투와 페르소나를 완벽하게 재현한 답변이어야 합니다.

    [
    {{
        "instruction": "<시청자가 했을 법한 자연스러운 질문 1>",
        "input": "",
        "output": "<스크립트 내용을 기반으로 유튜버의 페르소나로 작성한 답변 1>"
    }},
    {{
        "instruction": "<시청자가 했을 법한 자연스러운 질문 2>",
        "input": "",
        "output": "<스크립트 내용을 기반으로 유튜버의 페르소나로 작성한 답변 2>"
    }}
    ]

prompting 코드의 한 부분이다.

그리고 training의 코드 중 parameter 부분을 올려본다.

# --- 4. 학습 인자(Training Arguments) 설정 ---
training_args = TrainingArguments(
    output_dir=f"./{new_model_name}-results",
    num_train_epochs=1,
    per_device_train_batch_size=1,
    gradient_accumulation_steps=4,
    optim="adamw_torch",
    save_strategy="steps",
    save_steps=50,
    save_total_limit=3,
    logging_steps=10,
    learning_rate=2e-4,
    weight_decay=0.001,
    bf16=True,
    max_grad_norm=0.3,
    max_steps=-1,
    warmup_ratio=0.03,
    group_by_length=True,
    lr_scheduler_type="constant",
    report_to="tensorboard"
)

이 코드를 가지고

주말에 다시 llama, solar, exaone 모델로 학습을 돌렸고, test dataset도 다시 만들었다.

그리고 중간 발표 전까지 속도를 측정할 것이고, 우리의 기획서를 더 탄탄하게 만드는 것이 우리팀의 목표이다.

얼마 안남았지만 화이팅!

'SKN ai Family camp 13기 > 주간 회고' 카테고리의 다른 글

[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 22주차 회고 (8월 3주차) (0)	2025.09.02
[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 21주차 회고 (8월 2주차) (0)	2025.09.02
[플레이데이터 SK네트웍스 Family AI 캠프 13기] - Monthly 회고 (7월 5주차) (1)	2025.08.12
[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 18주차 회고 (7월 4주차) (3)	2025.08.12
[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 17주차 회고 (7월 3주차) (2)	2025.07.19

YES I CANADA 👍🏻

[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 20주차 회고 (8월 1주차)

'SKN ai Family camp 13기 > 주간 회고' 카테고리의 다른 글

티스토리툴바

[플레이데이터 SK네트웍스 Family AI 캠프 13기] - 20주차 회고 (8월 1주차)

'SKN ai Family camp 13기 > 주간 회고' 카테고리의 다른 글

'SKN ai Family camp 13기/주간 회고' Related Articles

티스토리툴바