kdrug-inventory-system/dev_scripts/analyze_product_code.py
시골약사 ad9ac396e2 chore: 개발 파일 정리 및 구조화
- 개발/테스트 스크립트를 dev_scripts/ 폴더로 이동
- 스크린샷을 screenshots/ 폴더로 이동
- 백업 파일 보존 (.backup)
- 처방 관련 추가 스크립트 포함

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2026-02-18 04:44:48 +00:00

62 lines
2.2 KiB
Python

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
한약재 제품 코드 엑셀 파일 분석
"""
import pandas as pd
import openpyxl
def analyze_excel_file():
file_path = 'sample/(게시)한약재제품코드_2510.xlsx'
# 엑셀 파일 열기
wb = openpyxl.load_workbook(file_path, read_only=True)
print("=== 엑셀 파일 시트 목록 ===")
for i, sheet_name in enumerate(wb.sheetnames, 1):
print(f"{i}. {sheet_name}")
# 4번째 시트 데이터 읽기
if len(wb.sheetnames) >= 4:
sheet_name = wb.sheetnames[3] # 0-based index
print(f"\n=== 4번째 시트 '{sheet_name}' 분석 ===")
# pandas로 데이터 읽기
df = pd.read_excel(file_path, sheet_name=sheet_name)
print(f"\n데이터 크기: {df.shape[0]}행 x {df.shape[1]}")
print(f"\n컬럼 목록:")
for i, col in enumerate(df.columns, 1):
# NaN이 아닌 값들의 예시
non_null_count = df[col].notna().sum()
sample_values = df[col].dropna().head(3).tolist()
print(f" {i}. {col} (유효값: {non_null_count}개)")
if sample_values:
print(f" 예시: {sample_values[:3]}")
print(f"\n=== 데이터 샘플 (처음 10행) ===")
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', 50)
print(df.head(10))
# 주요 컬럼 분석
if '주성분코드' in df.columns:
print(f"\n=== 주성분코드 분석 ===")
print(f"유일한 주성분코드 수: {df['주성분코드'].nunique()}")
print(f"주성분코드 샘플: {df['주성분코드'].unique()[:10].tolist()}")
if '제품명' in df.columns:
print(f"\n=== 제품명 분석 ===")
print(f"유일한 제품 수: {df['제품명'].nunique()}")
print(f"제품명 샘플: {df['제품명'].head(10).tolist()}")
# 컬럼 정보를 더 자세히 분석
print(f"\n=== 데이터 타입 및 null 값 정보 ===")
print(df.info())
wb.close()
if __name__ == "__main__":
analyze_excel_file()