Install
pip install utilskit
개요
이 패키지는 다양한 전처리 작업을 효율적으로 처리할 수 있도록 설계된 커스텀 유틸리티 모음입니다. 데이터 정제, 결측치 처리, 반복 패턴 탐지, 시계열 정렬 및 그룹화 이미지 생성 편의성 등 데이터 분석 전반에 걸친 반복 작업들을 간결하게 수행할 수 있도록 돕습니다. 분석가와 엔지니어 모두를 위한 실용적인 도구로, 빠르고 안정적인 데이터 분석 파이프라인 구축에 기여할 수 있습니다.
Features
- classificationutils
| 함수명 | 목적 |
|---|---|
| confucsion_matrix | confusion matrix 생성 |
- dataframeutils
| 함수명 | 목적 |
|---|---|
| read_df | 데이터 불러오기 |
| utc2kor | 시간대 변경 |
| adnormal2nan | 이상치 --> 결측치 |
| time_filling | 시간 확장 |
| isdfvalid | dataframe 유효성 검증 |
| fill_repeat_nan | 반복성 결측치 보정 |
| pin2nan | 핀포인트 결측치 보정 |
- dbutils
- plotutils
| 함수명 | 목적 |
|---|---|
| draw_plot | 이미지 생성 |
| draw_subplot | 서브 플롯 형태의 이미지 생성 |
- repeatutils
| 함수명 | 목적 |
|---|---|
| get_section | 반복 구간 산출 |
| section_union | 구간과 구간과의 겹침 연산 |
- timeutils
| 함수명 | 목적 |
|---|---|
| get_now | 사용자 지정 방식의 현재 시간 추출 |
| time_measure | 정수 --> 시, 분, 초 변환 |
| get_date_list | 입력한 기준값을 통해 전체 날짜 리스트 생성 |
- utils
| 함수명 | 목적 |
|---|---|
| envs_setting | 각종 랜덤 시드 설정 |
| get_error_info | 에러 발생시의 메시지 객체화 |
Release Notes
2025-11-24 — ver 0.2.18
- 에러 수정
- repeatutils 의
section_union함수에서 mode 에-,+,&외의 값 입력 시 에러를 도출하는 유효성 검증 추가
- repeatutils 의
- 최적화
- README 및 docs 구조 변경
0.2.18.1
- README의 하이퍼링크를 GitHub 절대경로로 변경
0.2.18.2
- README의 하이퍼링크 GitHub 절대경로 수정
0.2.17
logutils기능 완전 삭제 → 별도 패키지 logie 로 분리
0.2.16
- repeatutils
section_union에서 mode=&이고 sub 또는 main section 이 빈 리스트일 때[]반환하도록 수정
0.2.16.1
- 조건문에서
&앞 띄어쓰기 문제로 연산이 정상 처리되지 않던 부분 수정
0.2.15
- repeatutils
section_union에서 결과가 빈값일 때 에러가 발생하던 문제 수정
0.2.14
- repeatutils
min_key설정 시min_equal=False일 경우 정상 구간 탐색이 되지 않는 문제 수정
0.2.13
- repeatutils에
section_union함수 추가
0.2.13.1
rpu.get_section사용으로 인한 오류 수정
0.2.12
- dataframeutils
fill_repeat_nan함수가 NaN 하나만 존재할 경우 보정하지 못하던 문제 수정
0.2.11
fill_repeat_nan이 3 이상 반복되는 NaN 구간을 비정상적으로 보정하던 문제 수정
0.2.10
- repeatutils
between함수가 정상 동작하지 않던 현상 수정
0.2.10
