비츠로그룹의 주간 뉴스레터가 발행되었습니다. 💌
안녕하세요, 반갑습니다.
오늘은 사람 대신 AI가 도면을 읽고 이해하는 디지털 전환 사례인 도면 해석의 자동화를 위한 AI 모델 설계와 적용 관련 내용을 전해드립니다. |
|
|
도면 인식, AI가 대체할 수 있을까?
- 도면 객체 인식으로 구성요소 추출, 디지털 전환으로 가는 첫 단계 |
|
|
"도면 인식관련 AI 기술 적용을 통해 설계 검토부터 생산 자동화까지 디지털 전환 실현 가능" |
|
|
📌 1. 왜 중전기기 산업에서 도면 인식 AI가 필요한가?
- 중전기기 산업은 차단기, 변압기, 단자대 등의 다양한 부품이 포함된 복잡한 도면을 기반으로 설계·시공·유지보수가 이루어짐
- 도면(2D CAD 도면, PDF 문서, 스캔 이미지 등)은 비정형 데이터로, 사람이 직접 해석해야 하므로 시간과 전문 인력이 많이 필요
- 디지털 전환(DX)과 자동화 흐름 속에서 도면을 AI가 자동 해석하는 기술의 필요성이 급부상
📌 2. 도면 인식을 위한 AI 모델 구조와 핵심 기술
- 단순한 컴퓨터비전으로는 한계 → 다단계 AI 아키텍처 필요
- 객체 탐지(Object Detection): 기호(차단기, 변압기 등) 인식
- 문자 인식(OCR): 부품명·심볼명·도면 텍스트 등 추출
- 기호 분류: 유사 기호 식별
- 관계 추론: 회로 흐름 이해
- 기울기/회전 보정: 도면 정렬
📌 3. 실제 적용 사례 및 기대 효과
- 적용 분야: 설계 검토, 생산 연계, 유지보수, 인증 심사 등 산업 전반
- 기대 효과:
- 도면 해석 시간 단축
- 설계 오류 자동 검출
- MES/ERP 연계 통한 생산 자동화 가능
- 전문가 의존성 감소 및 설계 표준화
|
|
|
도면은 건축, 기계, 전기 등 다양한 산업에서 핵심적인 정보를 담고 있지만, 자동으로 읽고 분석하기 매우 까다로운 비정형 데이터입니다.
※ 비정형 데이터란, 정해진 구조(형식)가 없는 데이터를 의미합니다. 즉, 표나 데이터베이스처럼 행과 열로 정리되지 않은 데이터로 이미지, 문서, 음성, 영상, PDF, 도면 등의 데이터가 비정형 데이터로 분류 될 수 있습니다. |
|
|
🧠 비정형 데이터의 주요 특징
- 일정한 형식이 없어 SQL(관계형데이터베이스 관리시스템) 등으로 직접 처리하기 어려움
- 분석 및 활용을 위해 AI기술(Object Detection, OCR, NLP 등) 필요
- 전체 데이터의 80% 이상을 차지 (기업 데이터 기준)
🏗️ "도면"은 왜 비정형 데이터일까?
- 도면(PDF, PNG, DWG)은 표처럼 정리되지 않음
- 문자가 아닌 기호, 선, 도형, 박스로 구성
- 사람은 의미를 이해하지만, 컴퓨터는 해석할 수 없음
- 따라서, AI(Object Detection, OCR 등)로 구조화해야 활용 가능
|
|
|
|지금까지 도면 분석은 대부분 사람이 직접 읽고, 수작업으로 정보를 추출하는 방식에 의존해 왔습니다. |
|
|
그러나 디지털 전환과 자동화가 요구되는 현장에서 다음과 같은 문제가 발생합니다.
- 도면 수천 장을 일일이 해석하는 데 드는 시간과 인건비
- 도면 기호나 구조에 대한 전문 지식 의존
- 치수나 관계 오류 발생 시 설계/시공 문제로 연결
이에 따라, 도면을 자동으로 이해하고 구조화하는 AI 기반 도면 인식 기술이 주목받고 있습니다. |
|
|
중전기기 산업에서 활용되는 도면(예: 단선결선도, 배선도, 계통도 등)은 단순한 이미지가 아니라 전기적 의미와 기능이 포함된 복잡한 기술 문서입니다.
도면은 다음과 같은 다양한 요소들이 혼합된 비정형 데이터입니다.
- 기호: 차단기, 개폐기, 변압기, 단자대, 계측기기 등 표준 또는 사내 기호
- 선(Line): 배선, 접지선, 전력선, 신호선 등 전기적 연결 구조
- 텍스트: 부품명, 회로명, 치수, 용량, 배선 번호, 레이블
- 구조정보: 회로 흐름, 상하좌우 연결 관계, 블록 다이어그램
이처럼 다양한 정보를 정확히 추출하려면 단순한 이미지 분류나 객체 탐지만으로는 부족합니다. 따라서 아래와 같은 다단계 AI 기반 도면 인식 파이프라인이 필요합니다.
|
|
|
1️⃣ 입력 전처리 (도면 포맷 변환)
- PDF, DWG, TIFF 등 다양한 포맷을 AI 모델이 인식 가능한 이미지 또는 벡터 형식으로 변환
- 불필요한 배경 제거, 해상도 보정
2️⃣ 기호/객체 검출 (Object Detection)
- YOLO, Faster R-CNN 등의 AI 알고리즘을 이용해 차단기, 릴레이, 변압기, 단자대 등 기호 탐지
- 자체 학습 데이터셋으로 기호 유형 커스터마이징 가능
3️⃣ 배선/회로 경로 인식 (Line Detection)
- Hough Transform 또는 Skeletonization으로 전선 구조 검출
- 전기적 흐름 방향 또는 상하/좌우 블록 연결 추론
4️⃣ 텍스트 추출 (OCR + 문맥 분석)
- TrOCR, PaddleOCR 등으로 텍스트 박스에서 회로명, 부품 ID, 전압값 추출
- 도면 특화 문자인식: 전기 기호, 숫자 조합 인식 보정
5️⃣ 구조 해석 및 연결 관계 파악
- 객체 간 거리, 연결 선로 분석을 통해 회로 연결 정보 생성
6️⃣ 출력 구조화 (Structured Output)
- 추출된 정보를 JSON, CSV, CAD 도면 태깅, ERP/PLM 연동 포맷으로 저장
- 부품 BOM 자동 생성, 배선 리스트 출력, 유지보수 문서 자동화 가능
|
|
|
도면은 기호, 선, 텍스트가 복잡하게 얽혀 있는 대표적인 비정형 데이터로, 이를 정확히 인식하기 위해서는 일반적인 컴퓨터 비전(CV) 기술보다 훨씬 정교한 AI 모델 구조가 필요합니다. 아래와 같이 다단계 AI 아키텍처의 조합이 사용됩니다. |
|
|
1️⃣ 객체 탐지 (Object Detection)
주요 모델: YOLO, Faster R-CNN, Detectron2
- 역할: 차단기(CB), 단로기(DS), 계기류, 변압기, 단자대 등 기호 위치 및 종류 탐지
- 특징:
- 작은 기호 다수 → 해상도 중요 - 동일한 형태 기호 다수 존재 → anchor box 전략 정교화 필요 - 위치 정보 정확도가 회로 연결 해석에 직접 영향
2️⃣ 문자 인식 (OCR, Optical Character Recognition)
주요 모델: DBNet + CRNN, TrOCR
- 역할: 부품명, 배선 번호, 회로명, 전압 값 등 텍스트 인식
- 특징:
- 스캔 도면 특유의 기울어짐, 압축, 왜곡 보정 필요 - OCR 영역 탐지 정확도가 전체 파이프라인 신뢰도에 영향 - 도면 서식 내 특수 문자(예: ‘3Φ’, ‘190/√3[v]’) 대응 필요
3️⃣ 기호 분류 (Symbol Classification)
주요 모델: CNN Classifier, Siamese Network
- 역할: 유사한 전기기기 기호 구분 (예: ACB vs MCCB, CT vs VT 등)
- 특징:
- 형태 유사성이 높아 정교한 비교 필요 - 회전, 대칭, 스케일 변화에 강인한 학습 필요 - 사내 설계표준 기호에 맞춘 커스터마이징 필수
4️⃣ 관계 추론 (Connection Reasoning)
주요 모델: Graph Neural Networks (GNN), Rule-based Hybrid
- 역할: 전기기기 간의 연결성 모델링
- 예: "Incomer 차단기 → 계기류 → 개별 부하" 흐름 추론
- 특징:
- 배선(선) 정보를 GNN에서 노드 간 간선으로 활용 - 도면의 전기적 흐름, 기능 흐름까지 해석 가능 - 기호 간 연결 규칙 기반 룰엔진과 AI 결합 가능
5️⃣ 회전 정렬 및 기울기 보정 (Skew & Rotation Correction)
주요 모델: Hough Transform, Principal Component Analysis (PCA), Deep Learning 기반 Orientation Estimation (ex. RotNet), Image Moments
- 역할:
- 회전/기울어진 도면 또는 기호, 텍스트의 정렬 상태를 보정 - 객체 탐지(기호), OCR(텍스트), 기호 분류 정확도 향상
- 특징:
|
|
|
YOLO(You Only Look Once)는 객체 탐지(Object Detection) 알고리즘 중 하나로, 이미지에서 여러 객체를 실시간으로 빠르게 탐지하고 분류할 수 있는 딥러닝 기반 기법입니다. 이름 그대로 한 번의 신경망 연산으로 객체의 위치와 종류를 동시에 예측하는 것이 특징입니다. |
|
|
📌 YOLO는 언제 사용하나?
- 실시간 객체 탐지가 필요한 경우 (CCTV, 드론, 자율주행 등)
|
|
|
🧠 1. YOLO의 작동 방식 요약
1) 입력 이미지를 고정된 크기로 조정
2) 이미지를 S x S 격자로 나눔
3) 각 셀은 다음을 예측:
- B개의 바운딩 박스 정보: (x, y, w, h, confidence)
- C개의 클래스 확률 (예: 사람, 개, 자동차 등)
|
|
|
🔍 2. YOLO의 핵심 아이디어
전통적인 객체 탐지 알고리즘은 두 단계를 거칩니다.
- 1단계: 객체가 있을만한 영역(Region Prposal)을 추정
- 2단계: 그 영역 안의 객체를 분류 및 위치 보정
YOLO는 이 과정을 단 한 번의 CNN(합성곱 신경망) 연산으로 처리합니다. |
|
|
|이미지를 SxS 그리드로 나누고, 각 그리드 셀에서 B개의 바운딩 박스와 객체의 확률(class probability)을 예측 |
|
|
📦 3. 예측 결과
각 바운딩 박스에 대해:
- (x, y): 박스 중심의 좌표 (셀 기준 상대 위치)
- (w, h): 박스의 너비와 높이 (전체 이미지 기준 상대 크기)
- Confidence: 해당 박스에 객체가 있을 확률 x IOU (예측 vs 정답 박스 간 겹침 정도)
- Class Probabilities: 이 박스에 어떤 객체가 있는지에 대한 확률
|
|
|
중전기기 산업을 위한 도면 인식 AI 기술의 적용 사례와 기대 성과
▶️ 적용 분야 |
|
|
▶️ 기대 효과
✅ 도면 1장당 처리 시간: 기존 평균 10~15분 수작업 분석 → 10초 이내 AI 분석으로 전환
✅ 설계 오류 자동 검출: 치수 누락, 배선 미연결, 장비 누락 등 전기 설계상 오류 자동 탐지 가능
✅ 형식 혼합 도면 처리: PDF, 이미지 스캔본, CAD(DWG) 등 이기종 도면을 동시에 처리 가능
✅ DX 및 스마트팩토리 연계: AI 인식 결과를 MES/ERP 시스템과 연결하여 부품 조달 및 생산 자동화 가능
✅ 노하우 표준화 및 전문가 의존도 감소: 기존 시니어 기술자 경험에 의존하던 검토 작업 → AI 기반 공정화 및 표준화 |
|
|
📢 AI 기술 적용 및 데이터 활용과 관련하여 업무 개선에 대한 의견이나 궁금하신 사항이 있으시면, 아래 피드백란에 자유롭게 남겨주세요. 소중한 의견은 검토 후 안내드리겠습니다.😊 |
|
|
비츠로그룹 뉴스레터를 함께 받아보고 싶은
임직원분이 계시다면 구독하기 버튼을 클릭해주세요📩 |
|
|
Copyright © VITZRO Tech. All Rights Reserved. |
|
|
|
|