핵심 요약
알루미늄 압출 프로파일 도면 검색 시스템 구축 중 노이즈 제거와 기하학적 특징 추출의 한계를 극복하기 위한 파이프라인 개선 방안을 논의한다.
배경
사용자가 알루미늄 압출 프로파일의 2D 도면 데이터셋 약 2,000개를 기반으로, 노이즈가 많은 쿼리 이미지에서 정확한 모델을 찾아내는 검색 시스템을 구축했으나 전처리 및 모델 성능 문제로 어려움을 겪고 있다. 현재 OpenCV와 DINOv2를 결합한 하이브리드 방식을 사용 중이나 실제 산업 현장의 복잡한 도면 환경에서 정확도가 일관되지 않아 개선 방안을 모색 중이다.
커뮤니티 반응
작성자가 구체적인 파이프라인 구성과 가중치 수치(40:40:20)를 제시하여 실질적인 기술적 피드백을 유도하고 있으며, 전처리와 모델 아키텍처 사이의 트레이드오프에 대한 논의가 활발하다.
실용적 조언
- 단순한 형태학적 연산 대신 딥러닝 기반의 도면 세그멘테이션 모델을 도입하여 치수선과 본체 도면을 분리하는 것이 효과적이다.
- 종횡비 계산 시 노이즈에 민감한 바운딩 박스 대신 컨투어(Contour) 기반의 기하학적 특징량을 사용하는 것이 더 견고하다.
- 데이터셋이 2,000개 수준이라면 Siamese Network를 통한 유사도 학습이 검색 정확도를 크게 높일 수 있다.
언급된 도구
DINOv2중립
이미지 임베딩 추출 및 특징 매칭
OpenCV중립
엣지 검출, 형태학적 연산 및 기하학적 특징 계산
YOLO추천
프로파일 영역 검출 및 크롭을 위한 후보 도구
섹션별 상세
현재 파이프라인의 전처리 한계가 명확하다. 작성자는 OpenCV의 Canny 엣지 검출과 형태학적 연산인 팽창(Dilation) 및 닫기(Closing)를 사용하여 치수선과 텍스트를 제거하려 시도했다. 그러나 치수 보조선이나 텍스트를 지우기 위해 커널 크기를 키우면 프로파일의 핵심적인 얇은 구조적 선까지 함께 소실되는 문제가 발생한다. 이는 결과적으로 원본 형상을 왜곡시켜 후속 분석 단계의 신뢰도를 낮추는 원인이 된다.
DINOv2 임베딩 모델의 기하학적 인식 부족이 확인됐다. DINOv2는 프로파일의 슬롯이나 곡선 같은 국소적인 질감 특징은 잘 포착하지만, 전체적인 매크로 기하학적 형상을 구분하는 데는 취약한 모습을 보였다. 이로 인해 40x80 직사각형 프로파일과 40x40 정사각형 프로파일이 단순히 T-슬롯 구조를 공유한다는 이유만으로 동일하게 매칭되는 오류가 빈번하게 발생한다. 이를 보완하기 위해 도입한 종횡비(Aspect Ratio)와 Hu 모멘트 가중치 합산 방식도 전처리의 불완전함 때문에 제대로 작동하지 않는 상태이다.
데이터셋 규모에 따른 새로운 아키텍처 도입 가능성을 검토 중이다. 현재 보유한 약 2,000장의 깨끗한 도면 데이터를 활용하여 제로샷(Zero-shot) 방식인 DINOv2 대신 ResNet이나 EfficientNet을 기반으로 한 샴 네트워크(Siamese Network)와 트리플렛 손실(Triplet Loss)을 적용하는 파인튜닝 방식이 제안됐다. 또한 검색 파이프라인 이전에 YOLO나 세그멘테이션 모델을 배치하여 노이즈로부터 프로파일 영역만 정교하게 잘라내는 단계의 필요성에 대해서도 논의가 이루어지고 있다.
실무 Takeaway
- DINOv2와 같은 범용 비전 모델은 도면의 세부 질감에는 강하나 전체적인 기하학적 비율과 형상을 구분하는 데 한계가 있다.
- 전처리 단계에서의 과도한 형태학적 연산은 노이즈뿐만 아니라 핵심적인 구조 정보까지 손실시킬 위험이 크다.
- 기하학적 특징을 검색 필터로 사용할 경우, 입력 이미지의 노이즈가 바운딩 박스 측정에 미치는 영향을 최소화하는 견고한 세그멘테이션이 선행되어야 한다.
- 약 2,000개 규모의 데이터셋이라면 범용 모델의 제로샷 활용보다 도메인 특화 파인튜닝이나 샴 네트워크 구조가 더 유리할 수 있다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료