- 과제기간 : 2022.7.11.~2022.8.26.
- 목표 : 제조 공정에서 발생하는 데이터를 활용한 분석
- 연구내용 :
- 유라 코퍼레이션 청북공장 방문 및 공정 파악
- aoi + ict + laser soldering 결합 데이터 분석
- Tableau를 활용한 데이터 시각화
- 성과 :
- 제조 공정의 프로세스 개선을 위한 데이터 분석 결과 도출 및 문제 원인 발견
- Tableau기반 데이터 시각화 대시보드 작성
<Tableau 기반 제조 공정 데이터 시각화>
<제조 공정 프로세스 개선을 위한 데이터 분석>
- 과제기간 : 2022.7.11.~2022.8.26.
- 목표 : 한우 개량을 위한 씨수소 족보 정보 분석
- 연구내용 :
- 씨수소 족보 정보 인포그래픽 작성
- 타 공공기관 데이터와 족보 데이터의 결합을 통한 데이터 분석
- 성과 :
- 씨수소 족보 정보 네트워크 분석
- 인포그래픽 작성을 위한 동적 네트워크 시각화
<씨수소 족보 정보 네트워크 시각화>
- 과제기간 : 2023.1.1.~2023.1.31.
- 목표 : 구매 및 판매 데이터 분석
- 연구내용 :
- 기업별 수요 데이터 분석
- 기업별 수요 데이터 시각화
- 데이터 분석 기반 시장조사
- 성과 :
- 발주-선적 기간에 따른 수요량 분석
- Tableau 기반 판매현황 데이터 시각화
- 기업별 수요 데이터 시각화
<기업별 수요량 분석 및 시각화>
<발주-선적 기간에 따른 수량 시각화 및 분석>
- 과제기간 : 2023.3.15.~2023.6.21.
- 목표 : MES 데이터 활용 및 온라인 마케팅 데이터 파이프라인 구축
- 연구내용 :
- MES 데이터를 활용한 데이터 처리방법 고안
- 실제 MES 데이터를 활용하여 다양한 분석 방법 제시
- 제조기반 기업이 디지털전환에 필요한모듈을 조사하고 다양한 방법으로 제시
- 성과 :
- MES 데이터 정리 및 전처리
- MES 데이터를 활용하여 머신러닝,시계열 분석 기반의 분석접근
- 온라인 데이터 파이프라인 구축 ->추후 데이터 수집용이하도록 구조 변경
- 구글 애널리틱스, 태블로를 활용한 로그 시각화 및 분석
<구글 애널리틱스 활용 웹페이지 방문자 로그 추적>
<MES의 raw data table 데이터 분포 예시>
<결측치 제거 등의 전처리 과정 후의 데이터 분포>
<AutoML패키지 적용하여 머신러닝 접근 feasibility 측정>
<시계열 예측(1)>
<시계열 예측(2)>
- 과제기간 : 2023.07.03. ~ 2023.08.31.
- 목표 : 생산계획 달성 관련 내부 변동원인 파악 및 최소화 방안을 도출하기 위한 기반 마련
- 연구내용 :
- 생산계획달성률에 영향을 주는 요인 확인
- 설비 관련 데이터를 사용한 설비효율 계산
- 근무자 인구통계학적 특성에 대한 근태사고발생 빈도 및 추세확인
- 분석결과를 바탕으로 생산계획달성률 향상방안 제시
- 성과 :
- 계획 및 실제 생산에 대한 생산계획달성률(%) 변동그래프 출력
- 설비 및 근태변동 관련 내용에 대한 생산계획달성률과의 상관관계 분석
- 인구통계학적 특성에 따른 근태사고발생률(%) 독립표본 t검정
- 인구통계학적 특성에 따른 근태사고발생률 추세 분석 및 시각화
<일자별 생산설비 데이터 기초 설비종합효율 산출>
<2021-2022년 계획 및 실제 생산량에 따른 생산계획달성률 변동그래프>
<결측치 제거 등의 전처리 과정 후의 데이터 분포2021-2022년 전체 상관관계분석 결과(종속변수: 생산계획달성률)>
<2021-2022년 근무자 특성별 그룹통계 및 독립표본 t검정 결과(N=57)>
<분석 대상자의 연령에 따른 근태사고발생률 추세(N=57)>
- 과제기간 : 2023.07.03. ~ 2023.08.31.
- 목표 : 도비스튜디오의 비즈니스 모델 가설 검증 및 홍보
- 연구내용 :
- 전문가 매칭 서비스 Britdge와 일본 진출 사업 전문가 매칭 서비스 Experienced에 필요한 각 분야 전문가 및 의뢰기업 소싱을 위한 가설 실험
- 커스텀 메일 생성 서비스 CustomGPT의 베타서비스 홍보를 위한 개인화 정도에 따른 메일 전환율 가설 실험
- 성과 :
- 가설 실험을 위한 다양한 DB 준비
- 발송한 커스텀 메일의 열람 횟수와 전환율 추적
- 관련 커뮤니티를 통한 서비스 홍보
- Britdge와 Experienced 서비스 플랫폼 홈페이지 개선안 제시
- 과제기간 : 2023.12.26. ~ 2024.02.29.
- 목표 :
- 생산계획 달성 관련 내부 변동원인 파악 및 최소화 방안을 도출하기 위한 기반 마련
- 라인별 과거 생산량 데이터를 활용한 미래 2024년 생산량 예측
- 연구내용 :
- 뉴스 기사를 바탕으로 다양한 텍스트 마이님 기법 적용
- ARIMA 모형을 통한 미래 생산량 예측
- TimeGPT를 활용한 시계열 예측
- 성과 : 외부 생산 변동요인 파악
- 친환경 및 신기술
- 국내 기반 시장 경제
- 해외 관련 시장 경제
- 코로나 이후 자동차 관련 신문화
<빈도 분석 결과 워드클라우드 중 일부>
<빈도 분석 결과 중 일부>
<TF-IDF 결과 중 일부>
<Line A에 대한 ARIMA 결과>
<Line A에 대한 TimeGPT 결과>
- 과제기간 : 2023.12.26. ~ 2024.02.29.
- 목표 : 랭체인(Langchain)을 활용한 RAG(Retrieval-Augmented Generation) 챗봇 성능 개선
- 연구내용 :
- 1. 다양한 텍스트 분할(TextSplit) 방법의 성능 평가
-
- CharacterTextSplitter VS. RecursiveCharacterTextSplitter
- RecursiveCharacterTextSplitter VS. SemanticChunker
- 2. 답변 출처 확인 실험
-
- set_debug(True)
- similarity_search()
- LangChain 공식 도큐먼트 Returning sources
- 3. 임베딩 모델에 따른 성능 테스트
-
- OpenAIEmbeddings
- multilingual-e5-large
- 4. 정량평가 실험
- 성과 :
- 문서 분할 방법 및 파라미터 전략 검증
- LLM의 답변 생성시 문서 출처 확인으로 RAG 성능 검증
- 임베딩 모델 테스트를 통한 모델 성능 평가
<CharacterTextSplitter 와 RecursiveCharacterTextSplitter 성능 실험 결과>
<RecursiveCharacterTextSplitter 방법 활용 및 답변 출처 확인 실험 결과>
<임베딩 모델에 따른 성능 테스트 결과>