logo white en.png

RE:IMAGINE WITH

NATURAL LANGUAGE PROCESSING 

자이냅스는 기업이 새로운 서비스를 성공적으로 제공하고 사용자에게 새로운 경험을 제공할 수 있도록

자연어 처리와 빅데이터 분석을 위한 혁신적인 기술을 지속적으로 개발하고 있습니다.

The Most Advanced Hybrid Chatbot Engine

독자적으로 개발한 하이브리드 챗봇 엔진은 규칙기반 설계방식과 머신러닝 기반 설계방식의 단점을 보완하고

​오픈 소스 챗봇 대비 더 많은 인텐트를 제공하며, 상대적으로 더 적은 데이터만으로도 다양한 고객의 질의에 대응 가능합니다.

Topic Modeling

상담 데이터에 대한 카테고리를 추정하고, 추정된 카테고리를 '질문-대답'에 자동으로 매핑하는 Topic Modeling기술은

​기존에 사람이 자의적으로 처리했던 기존 방식보다 더 정확하고 빠르게 데이터를 처리하여 고객 데이터에 기반한 챗봇 설계가 가능합니다.

Latent Dirichlet Allocation + Relation ​Inference Technology

Latent Dirichlet Allocation(LDA)과 자체기술을 결합하여 주제와 주제들간의 관계를 추론하고

기획자가 인사이트를 보다 쉽게 얻을 수 있도록 시각화하여 출력

Auto Labeling

상담 데이터를 머신러닝에 적용하기 위해 반드시 필요한 방대한 상담 데이터 레이블링 작업을 인력이 하던 기존방식을

Semi-supervised Learning을 적용하여 사람이 처리하면서 발생하는 오류를 제거하고 시간과 비용을 획기적으로 절감할 수 있습니다.

Issues on big data

많은 기관들은 빅데이터, 특히 정형 데이터의 한계를 극복하기 위해 비정형 데이터 활용에 큰 관심을 보이고 있으나

데이터 레이블링을 인력투입으로 해결하는 방식에서 벗어나지 못해 효율성 및 활용도가 저하되는 상황

Semi-supervised learning​

기존에 수기로 진행했던 데이터 레이블링 작업을 Semi-supervised Learning을 사용하여

Auto Labeling으로 고도화함으로써 데이터 처리의 효율성과 정확성을 확보

- Sample에 대해 Feature Selection 수행 -

 - 데이터 증가에 따른 분류기 앙상블 생성 -

- 다중 분류기의 결과 취합 및 자동 Labeling 수행 -

​- 레이블링된 데이터를 포함하여 Self-learning 반복 수행 -

네이버 영화 데이터에 대한 자체 테스트 결과

  • 149,995건 중 100건을 Labeling 작업 수행

  • 100건의 Label로 63,845건의 Auto Labeling수행 

  • 전체 0.07% Labeling으로 42.56%의 Coverage가능

  • ​정확도 99.84%(기존 Self-Learning은 약 50% 수준)

Preference-based Sentence Embedding

방문했던 문서들 간의 관계를 학습하고 인덱스화하여 문서를 추천하는 Preference-based sentence embedding 기술을 적용하여

​보다 정확한 문서, 뉴스 등의 콘텐츠를 추천, 제안함으로써 업무 효율을 향상시키고 시간을 절감할 수 있습니다.

logo white en.png

주식회사 자이냅스 | 사업자등록번호 258-86-00597

©2019 by Xinapse

Images designed by Smashicons, Eucalyp, Good Ware. itim2101, Pause08, pongsakornRed, raw pixel.com, Pixel perfect, freepik.com, wanicon, Gregor Cresnar from flaticon

 

 

개인정보처리방침

  • 페이스 북 - 회색 원
  • 유튜브 - 회색 원