PsychAdapter: Big Five 성격 및 정신건강을 반영하는 LLM 어댑터 구현

이 요약은 AI가 원문을 분석해 생성했습니다. 정확한 내용은 원문 기준으로 확인하세요.

TL;DR

맥락과 목적은 LLM이 특정 심리적 특성과 정신건강 상태를 반영하도록 안내하는 프레임워크를 제시하는 것이다.

핵심은 파라미터 효율적 어댑터를 활용해 대형 모델의 가중치를 크게 증가시키지 않고도 텍스트 생성 시 esp. Big Five 성격 특성, 우울 및 삶의 만족도 같은 지표를 반영하는 구성이다. 구현적으로 Gemma-2B를 베이스로 latent_size를 5로 설정하고, Big Five 데이터세트 및 평가 데이터로 학습한다. 실험 파이프라인은 train_psychadapter.py로 학습을 수행하고, inference_psychadapter.py로 다차원 변수의 출력을 생성하는 방식으로 구성된다.

의미상으로는 이 접근이 연구 재현성과 특성 제어 가능성의 새로운 경로를 열지만, 실제 적용시 윤리적 고려와 편향 관리 등의 한계가 남아 있을 수 있다.

섹션별 상세

대형 언어모델의 텍스트 출력이 특정 성격 특성이나 정신건강 상태에 따라 달라질 수 있다는 문제의식에서 시작한다. PsychAdapter는 파라미터 효율적 어댑터를 활용해 이 차이를 학습한다. 실험적으로 Big Five 중 다섯 가지 특성과 우울/삶의 만족도 같은 심리 지표를 반영하도록 설계되었다. 출력 제어를 위한 모듈식 어댑터의 이점은 전체 가중치 재학습 없이도 특성 차이를 재현 가능하게 만든다.

bash

python ./codes/train_psychadapter.py \
  --train_data_file ./data/big5_training_data.csv \
  --eval_data_file ./data/big5_validating_data.csv \
  --output_dir ./checkpoints/big5_model \
  --model_name_or_path google/gemma-2b \
  --latent_size 5 \
  --do_lower_case \
  --per_gpu_train_batch_size 32 \
  --per_gpu_eval_batch_size 32 \
  --gradient_accumulation_steps 2 \
  --do_train \
  --evaluate_during_training \
  --learning_rate 5e-5 \
  --num_train_epochs 5 --save_steps 1000 \
  --logging_steps 100

PsychAdapter 학습을 위한 핵심 학습 명령 예시

bash

python3 ./codes/inference_psychadapter.py \
  --train_data_file ./data/big5_training_data.csv \
  --output_dir ./checkpoints/big5_model \
  --model_name_or_path google/gemma-2b \
  --checkpoint_step 30000 \
  --psych_variables big5 \
  --latent_size 5 \
  --do_lower_case \
  --generate_num 10 \
  --generate_length 64 \
  --temperature 0.7 \
  --top_k 10 \
  --top_p 0.9 \
  --std_range 3.0 \
  --generate_interval 3.0 \
  --seed 45 \
  --prompting_text "I like to"

추론(Inference) 실행 예시

구현 구성은 Gemma-2B를 베이스로 하여 latent_size를 5로 설정하고, Big Five 데이터세트 및 평가 데이터 파일을 사용한다. 학습 파이프라인은 train_psychadapter.py를 통해 실행되며, 출력은 ./checkpoints/big5_model에 저장된다. 모델 학습은 5에폭, 학습률 5e-5, 배치 크기 32, 그래디언트 누적 2로 구성되며, 1000 스텝마다 저장하고 100스텝마다 로깅한다. Demographics conditioning은 필요 시 선택적으로 적용된다.

추론은 inference_psychadapter.py를 사용하며, generate_num=10, generate_length=64, temperature=0.7, top_k=10, top_p=0.9 등 샘플링 파라미터를 제어한다. std_range와 generate_interval은 각 변수의 생성 간격과 다양성을 조정하는 신호로 작동하며, prompt 예시로 'I like to'를 사용한다. 이러한 구성은 다차원 특성에 따른 텍스트 생성의 다양성과 제어를 동시에 확보한다.

실무 Takeaway

파라미터 효율적 어댑터를 도입하면 대형 트랜스포머의 특정 특성 반영을 가중치 재학습 없이 가능하게 한다.

언급된 리소스

DemoModel Checkpoints (PsychAdapter)

문서PsychAdapter Dataset

논문PsychAdapter paper (Nature NPJ AI)

python ./codes/train_psychadapter.py \ --train_data_file ./data/big5_training_data.csv \ --eval_data_file ./data/big5_validating_data.csv \ --output_dir ./checkpoints/big5_model \ --model_name_or_path google/gemma-2b \ --latent_size 5 \ --do_lower_case \ --per_gpu_train_batch_size 32 \ --per_gpu_eval_batch_size 32 \ --gradient_accumulation_steps 2 \ --do_train \ --evaluate_during_training \ --learning_rate 5e-5 \ --num_train_epochs 5 --save_steps 1000 \ --logging_steps 100

python3 ./codes/inference_psychadapter.py \ --train_data_file ./data/big5_training_data.csv \ --output_dir ./checkpoints/big5_model \ --model_name_or_path google/gemma-2b \ --checkpoint_step 30000 \ --psych_variables big5 \ --latent_size 5 \ --do_lower_case \ --generate_num 10 \ --generate_length 64 \ --temperature 0.7 \ --top_k 10 \ --top_p 0.9 \ --std_range 3.0 \ --generate_interval 3.0 \ --seed 45 \ --prompting_text "I like to"

PsychAdapter: Big Five 성격 및 정신건강을 반영하는 LLM 어댑터 구현

TL;DR

섹션별 상세

실무 Takeaway

언급된 리소스

PsychAdapter: Big Five 성격 및 정신건강을 반영하는 LLM 어댑터 구현

TL;DR

섹션별 상세

실무 Takeaway

언급된 리소스

관련 토론

댓글

관련 피드

관련 토론

댓글

관련 피드