핵심 요약
통계는 예측, 규칙 생성, 시뮬레이션 등 다양하게 활용되지만, 가장 흔하면서도 논란이 되는 용도는 수사학(Rhetoric)이다. 저자는 p-값이나 신뢰구간 같은 사후 추론(Post-hoc inference) 도구들이 객관적 진리를 찾는 알고리즘이라기보다, 자신의 주장을 관철하기 위한 설득의 언어로 기능한다고 분석했다. 데이비드 흄의 귀납법 문제에서 보듯 과거의 관찰로 믿음을 정당화하는 논리적 수단은 없으며, 결국 통계는 과학적·관료적 맥락에서 논쟁을 위한 규칙 세트 역할을 수행한다.
배경
기초 통계학(p-value, 신뢰구간), 과학 철학(귀납법의 문제)
대상 독자
데이터 과학자 및 통계적 의사결정 프로세스 설계자
의미 / 영향
통계적 유의성에 대한 맹신을 경계하고, 데이터 분석이 사회적 합의와 설득의 과정임을 인식함으로써 더 투명하고 정직한 과학적 소통을 가능하게 한다.
섹션별 상세
통계적 추론의 본질은 객관적 과학이라기보다 논쟁을 위한 스타일 가이드에 가깝다. 로널드 피셔(Ronald Fisher)와 같은 통계학의 거두들도 자신의 신념을 방어하고 타인의 주장을 반박하기 위해 통계적 수사학을 능숙하게 사용했다. 이는 통계가 단순히 숫자를 세는 행위를 넘어, 특정 언어 형식을 빌려 권위를 획득하는 과정임을 나타낸다. 결국 통계적 도구들은 난공불락의 신탁이 아니라 논쟁을 지속하기 위한 수단으로 활용된다.
사후 추론(Post-hoc inference)은 데이터 수집 이후에 샘플과 데이터 생성 분포를 연결하는 기술적 행위를 의미한다. 교육 과정에서는 이러한 도구들이 상식에 속지 않고 개인의 지식을 확장하는 알고리즘이라고 가르치지만, 실제 현장에서 사람들이 통계적 추론 도구를 배포할 때는 자기 자신을 설득하기 위함이 아니라 타인을 설득하기 위한 목적이 강하다. R이나 Stata, 혹은 Claude Code와 같은 도구를 이용해 데이터를 파싱하고 논리적 근거를 생성하는 행위는 결국 수사학적 전략의 일환이다.
과학적 추론에는 모든 상황에 적용 가능한 단일한 알고리즘이 존재하지 않는다. 과학은 다양한 방법으로 경험적 사실을 제시하고 해석하는 지저분하고 사회적인 시스템이며, 통계적 추론은 그 안에서 사용되는 여러 언어 중 하나일 뿐이다. 베이지안이나 빈도주의 통계가 수치적 증거로부터 학습하는 유일하거나 최선의 방법이라는 주장은 편협한 시각일 수 있으며, 실제로 많은 과학 분야에서 통계 없이도 데이터를 통해 의미를 도출하는 다양한 방식이 존재한다.
통계적 수사학은 관료적 맥락에서 증거의 표준을 설정하는 데 매우 효율적으로 작동한다. 복잡한 규제 시스템 내에서 통계적 추론은 법률 문장과 유사한 기능을 수행하며, 모든 사람을 완벽히 설득하지 못하더라도 의사결정을 진행할 수 있는 통계적 문턱을 제공한다. 따라서 통계학자와 데이터 과학자들은 통계가 단순히 진리를 찾는 도구가 아니라, 숫자를 이용한 강력한 설득과 스토리텔링의 언어임을 솔직하게 인정해야 한다.
실무 Takeaway
- 통계적 추론 도구(p-value 등)를 객관적 진리의 척도가 아닌, 특정 주장을 관철하기 위한 수사학적 프레임워크로 재정의해야 한다.
- 데이터 분석 시 계산의 정확성만큼이나 그 결과가 어떤 논리로 타인을 설득하고 있는지에 대한 수사학적 의도를 파악하는 것이 중요하다.
- 가설 검정 중심의 전통적 추론과 머신러닝, 탐색적 데이터 분석(EDA)과 같은 실용적 기법을 분리하여 통계학의 활용 범위를 명확히 구분해야 한다.
언급된 리소스
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료