TL;DR
고강도 게임 환경에서의 미세한 제스처와 상호작용 패턴은 고유한 생체 신호를 제공한다. BEACON은 Mouse dynamics, Keystroke dynamics, 네트워크 트래픽, 화면 녹화, 하드웨어 맥락을 동기화한 대규모 다중 모달 데이터셋으로, 연속 인증과 사용자 프로파일링을 위한 벤치마크를 제공한다. 기존 데이터셋의 unimodal/제한적 맥락 문제를 해소하고, 강건한 다중 모달 융합 모델 개발에 기여한다.
왜 중요한가
고강도 게임 환경에서의 미세한 제스처와 상호작용 패턴은 고유한 생체 신호를 제공한다. BEACON은 Mouse dynamics, Keystroke dynamics, 네트워크 트래픽, 화면 녹화, 하드웨어 맥락을 동기화한 대규모 다중 모달 데이터셋으로, 연속 인증과 사용자 프로파일링을 위한 벤치마크를 제공한다. 기존 데이터셋의 unimodal/제한적 맥락 문제를 해소하고, 강건한 다중 모달 융합 모델 개발에 기여한다.
핵심 기여
대규모 다중 모달 데이터셋 BEACON 공개
약 430 GB의 동기화 신호(mouse, keystroke, 네트워크, 화면, 하드웨어 컨텍스트)를 79 세션, 28명으로 수집하여 Valorant 게임 환경의 고충실도 데이터를 제공한다.
BEACON 로거 아키텍처와 파이프라인 공개
참가자 동의 및 환경 맥락 보존을 위한 static data capture와 네트워크/스크린/입력 스트림을 동시 기록하는 로거 아키텍처를 제시하고, chunked 업로드 및 보안 수집 파이프라인을 포함한 엔드투엔드 데이터 수집 체계를 제시한다.
벤치마크 설계 및 Baseline 제시
Website Fingerprinting 계열 아키텍처(ARES, BAPM, NetCLR, TCN, TMWF, Var-CNN)를 활용한 28-class 식별 태스크를 구성하고, 마우스/키보드/결합 구성에서의 성능을 비교한다.
실험적 핵심 발견 및 인사이트
마우스 다이나믹스가 키보드보다 높은 정보밀도와 생체 구분력을 제공하며, 60초 윈도우에서 결합 모달의 성능이 최적화되고 EER가 감소한다. 초기 융합이 최적의 식별 정확도를 달성한다.
윤리·데이터 공개 정책
참가자 동의 및 익명화 파이프라인을 통해 공개 데이터가 개인식별정보를 제거하도록 설계되었고, Valorant 라이선스 및 연구 윤리를 준수한다.
핵심 아이디어 이해하기
출발점: 기존 연구는 단일 모달 신호나 짧은 세션의 로그에 의존해 고정된 보안 가정을 제시해왔다. 이로 인해 고강도 환경에서의 미세한 차이를 포착하기 어렵고, 환경 맥락 간의 상호작용을 학습하기 어렵다. BEACON은 고주파의 센서모터 입력(mouse)과 비선형 키 입력, 네트워크 트래픽, 화면 컨텍스트, 하드웨어 정보를 절대시간 기준으로 동기화해 서로 다른 모달리티 간의 정확한 정합을 보장한다. 1단계로 4개의 동시 스트림(Keyboard, Mouse, Network, Screen Recording, Hardware Context)을 시간 스탬프 기준으로 맞춰 모달리티 간의 시계열 정합을 가능하게 한다. 2단계로 33개의 엔지니어링 피처를 도출해 모델에 입력하고, 6개 WF 아키텍처를 적용해 28-class 식별 태스크를 수행한다. 3단계에서 마우스 다이나믹스는 연산 밀도가 높아 개별적 생체서명을 강하게 구분하고, 60초 윈도우에서 Macro-행동과 Micro-반응의 조합이 안정적 식별에 기여한다. 4단계의 융합 실험은 모달 간 보완성을 활용해 최종 식별 정확도와 EER를 개선한다. BEACON의 주요 시사점은 고정밀 멀티모달 신호의 융합이 연속 인증의 현실적 적용에 필요한 안정성과 강인성을 제공한다는 점이다.
관련 Figure

키보드 입력의 밀집 영역(예: WASD, 스페이스 바)의 위치를 보여주며, 다수 참가자의 입력 집중이 특정 시퀀스/전술에 모여 있음을 시사한다. 이는 키보드 기반 특징의 차이가 크다는 점과 연관되어 있다.
Complete Keyboard Heatmap. 키보드 입력의 전체 분포를 시각화한 차트다.

다중 모달의 피처 간 차이가 크고, 개인별 프로파일이 뚜렷하게 형성됨을 보여줘 멀티 모달 융합의 필요성과 가능성을 시사한다.
Cross-Modality heatmap: Median feature z-score by participant. 다중 모달 피처들의 개인간 편차를 한눈에 보여준다.
방법론
- 전체 접근: 4-모달리티 실시간 로깅과 다중 세션 수집으로 BEACON 데이터셋 구축; 1) 초기화 및 동의: Consent Form → Consent Granted 기록 → Timestamped Data Folder 생성. 2) 정적 데이터 수집: hardware_info.json, valorant config 등 환경 컨텍스트 수집. 3) 동적 모듈: Keyboard, Mouse, Network, Screen Recording으로 분리된 스래이브 스레드에서 이벤트를 수집. 4) 시간동기화: POSIX 타임스탬프를 이용해 모든 모듈의 이벤트를 절대 시간 기준으로 정렬, 교차모달 융합 가능. 5) 업로드 파이프라인: chunked HTTPS 전송, OAuth 인증, 서버 측 검증 및 MySQL 로그로 무결성 관리. 6) 피처 엔지니어링: 33개 피처를 Window(10/30/45/60s)로 추출. 7) Baseline: ARES, BAPM, NetCLR, TCN, TMWF, Var-CNN으로 28-class 식별 학습. 8) 데이터 제한: PCAP/비디오를 Baseline에서 제외하고 모달리티 간 융합은 후속 연구로 남김. "어떤 값을 입력으로, 어떤 계산을 거쳐, 어떤 결과를 얻고, 그 값의 의미"를 따라 수학적 또는 알고리즘적 의사결정을 설명한다; 예를 들어 CrossEntropyLoss는 각 샘플에 대해 -log p(y|x)를 계산하고, 이를 배치 평균으로 줄여 학습 업데이트를 수행한다. 피처의 정의와 각 모델의 설정은 Appendix에 자세히 기재되어 있다.
관련 Figure

로거-애플리케이션-로컬 데이터 저장-업로드 파이프라인 간 연결 구조를 보여주며, 시간동기화 및 다중 모달 데이터 수집의 기본 흐름을 확인할 수 있다.
BEACON 로거 아키텍처 다이어그램으로 로깅 파이프라인과 모듈 간 인터랙션을 시각화한다.

클라이언트-로깅, 로컬 저장, 업로드 포털, 서버/백엔드의 검증 및 저장으로 구성된 프로세스 흐름을 시각화한다. 데이터 무결성 확보와 익명화 프로세스의 근거를 제공한다.
CUSTOM LOGGER DATA COLLECTION & UPLOAD PIPELINE 다이어그램. 엔드투엔드 데이터 파이프라인의 구체적 흐름을 제시한다.
주요 결과
주요 결과는 28-class 식별 태스크에서 모달별 성능으로 정리된다. Mouse Only에서 63.16%의 최고 식별 정확도는 10초 윈도우의 Var-CNN에서 달성되었고, Keyboard Only의 경우 60초 윈도우에서도 낮은 성능을 보인다(예: ARES 60초: 22.63%, BAPM 60초: 22.90%, NetCLR 60초: 22.80%, TCN 60초: 19.61%, TMWF 60초: 32.66%, Var-CNN 60초: 24.35%). Combined(Mouse + Keyboard) 설정에서 Var-CNN이 60초 윈도우로 70.82%의 최고 정확도, 4.31%의 최저 EER, d′ 3.192, AUC 0.911를 달성한다. Baseline 간 차이로는 키보드의 제한성과 마우스의 고정보밀도가 확인되며, 60초 윈도우에서 Combined 구성이 가장 강력한 식별 성능을 제공한다. 데이터의 윈도우 길이가 늘수록 d′가 증가하고, 모델의 글로벌 최적화가 확인된다. 이러한 결과는 마우스 다이나믹스의 높은 정보밀도와 다중 모달 융합의 시너지를 나타낸다.
관련 Figure

좌클릭/우클릭/휠 등 세부 동작의 분포 차이가 참가자 간 식별에 중요한 신호가 됨을 시각적으로 보여준다. 마우스 다이나믹스의 고해도 신호가 개인별 차이를 잘 포착한다는 점을 보조한다.
All Participants: Mouse Switch Schematic. 마우스 스위치 사용 빈도와 분포를 3D 도식으로 표현.

마우스 다이나믹스가 키보드에 비해 더 강력한 식별 신호를 제공함을 보여주고, 모달 간 융합의 잠재적 이점을 뒷받침한다.
All Participants: Cross-Modality Behavioral Comparison. 각 모달리티의 중간값 Z-score를 비교한 열지도.

키의 누름률, dwell 시간 등의 피처 분포가 참가자마다 크게 차이나며, 장시간 윈도우에서만 구분력이 증가하는 경향을 확인할 수 있다.
Keyboard Heatmap: Complete Keyboard Tiling. 각키의 누름 빈도 및 dwell 시간 등 피처별 분포를 나타낸 도표.

이미지 4와 유사한 도표로, 모달 간 차이와 융합의 효과를 재확인한다.
All Participants: Cross-Modality Behavioral Comparison (중복 이미지).
기술 상세
- 데이터 수집 아키텍처: BEACON 로거는 이벤트 기반 기록으로 Keyboard, Mouse, Network, Screen Recording 스트림을 각 사용자별로 time-stamped 출력 폴더(data_[timestamp])에 저장한다. - 학습 및 피처 엔지니어링: 33개 엔지니어링 피처를 4개의 타임 윈도우(10s, 30s, 45s, 60s)에서 추출. 피처 목록은 Table 3에 상세히 정의되어 있다. - Baselines: ARES, BAPM, NetCLR, TCN, TMWF, Var-CNN; 입력 시퀀스 길이는 1024 토큰으로 패딩/트렁케이셔닝. - 학습 세팅: Optimizer=Adam, lr=1e-3, 배치크기=32, epochs=30, 데이터 분할은 시간 순으로 80% 학습, 10%는 학습 분할의 10%를 검증으로, 남은 20%를 테스트로 사용. - 데이터 배포 및 윤리: HuggingFace BEACON-Dataset에 익명화된 버전 배포; Zenodo에 로거 코드 공개. - 성능 지표: Accuracy, EER, d′, ROC-AUC, 4개의 윈도우에서 6개 모델의 성능 비교. - 제약: PCAP/비디오 데이터는 Baseline에서 제외되어 있으며, 대상은 Valorant 윈도우즈 플랫폼에서의 FPS 게임 특성에 한정되어 있다.
한계점
BEACON의 한계로는 (i) 28명의 참가자, 단일 게임타이틀 Valorant, Windows 플랫폼 중심의 실험 구성으로 일반화에 한계가 있다. (ii) 멀티모달 baselines에서 PCAP 및 비디오 모듈은 벤치마크에 포함되지 않았다. (iii) longitudinal(장기 추적)에 의한 행동 drift 연구가 미비하다. (iv) 분류 문제를 중심으로 한 식별 벤치마크이며, 다른 운영체제/게임으로의 전이성에 대한 검증 필요성이 있다.
실무 활용
실무적으로 BEACON은 연속 인증 시스템의 벤치마크를 제공한다. 고해상도 멀티모달 로그를 활용한 지속적 신원 확인 및 이상 행위 탐지 연구에 적용 가능하며, 모형의 일반화와 로드 매핑 연구에 활용될 수 있다.
- 연속 인증 시스템의 벤치마크 설계
- 다중 모달 융합을 통한 보안 모델의 강건성 평가
- 에스포츠 환경에서의 사용자 프로파일링 및 행동 분석
- 보안 연구에서의 모달별 데이터 기반 트래픽 분석과 포렌식 연구
- 적대적 생체인식에 대한 로버스트니스 연구 및 라이브니스 탐지
코드 공개 여부: 공개
코드 저장소 보기키워드
AI 요약 · 북마크 · 개인 피드 설정 — 무료
출처 · 인용 안내
인용 시 "요약 출처: AI Trends (aitrends.kr)"를 표기하고, 사실 확인은 원문 보기 기준으로 진행해 주세요. 자세한 기준은 운영 정책을 참고해 주세요.