주식회사 자이냅스 | 사업자등록번호 258-86-00597

©2019 by Xinapse

Images designed by Smashicons, Eucalyp, Good Ware. itim2101, Pause08, pongsakornRed, raw pixel.com, Pixel perfect, freepik.com, wanicon, Gregor Cresnar, Vitaly Gorbachev, Becris from flaticon  / Photos by rawpixel.com from Pexels

 

개인정보처리방침

  • 페이스 북 - 회색 원
  • 유튜브 - 회색 원

Reimagine with

NLP technology

자이냅스는 기업이 새로운 서비스를 성공적으로 제공하고 사용자에게 새로운 경험을 제공할 수 있도록 자연어 처리 및 빅데이터의 분석을 위한 혁신적인 기술을 지속적으로 개발하고 있습니다.

Less data, More precisely

Inference-based NLU engine

 

자연어 이해(Natural Language Understanding) 엔진은 사용자가 일상용어로 구성된 자연어를 텍스트로 입력할 경우, 사용자의 의도(Intent)를 파악하여 요청사항에 대한 답변을 제공하기 위한 챗봇 핵심 기술입니다.

일반적인 규칙기반 챗봇의 경우 다양한 사용자 발화를 처리하기 위해서 최대한 많은 표현을 미리 입력해야 하기 때문에 챗봇 구축에 시간과 비용이 많이 소요되고 관리도 어렵습니다.

자이냅스의 NLU 엔진은 한국어 고유의 모호한 구문∙형태에 근거하여 설계된 General-Specific 방식에 기반한 추론(Inference) 기능을 탑재하고 있어 규칙기반(Rule-based) 챗봇 대비 상대적으로 적은 데이터로도 인텐트를 정확하게 파악하고 올바른 답변을 제공합니다. 

Algorithm rather than Intuition

Topic Modeling

 

빅데이터에서 공통된 ‘주제(Topic)’를 가진 항목끼리 묶어내는 자이냅스의 Topic modeling은 LDA(Latent Dirichlet Allocation)과 자체 기술을 결합하여 주제와 주제들간의 관계를 추론한 내용을 시각화하여 출력합니다.

 

기존에 사람을 투입하여 처리하던 방식의 경우 투입되는 인력은 해당 도메인별 전문지식이 반드시 필요하였으나 Topic modeling은 알고리즘이 판단하기 때문에 도메인별 지식이 없더라도 가능합니다.

직관이 아닌 정확한 데이터에 근거하여 개발을 추진할 수 있기 때문에 의미없이 많은 서비스가 아닌 실제로 고객이 필요로 하는 핵심 서비스에 집중하고 시간, 자원을 효율적으로 사용할 수 있습니다.

More Efficient, More Accurate

Auto Labeling

 

기업 및 기관들은 빅데이터, 특히 정형 데이터의 한계를 극복하기 위해 비정형 데이터를 활용하는데 관심을 갖고 있으나 데이터 레이블링이 자동화되지 못해 효율성 및 활용도가 저하되는 문제가 있습니다.

 

자이냅스는 기존에 수기로 진행했던 데이터 Labeling 작업을 Semi-supervised Learning을 사용하여 Auto Labeling으로 고도화함으로써 보유한 데이터의 일부만 레이블링하더라도 전체 데이터에 대한 레이블링을 수행하여 비정형 빅데이터 분석의 효율성과 정확성을 개선합니다. 

빅데이터의 전처리 과정을 자동화시키는 오토레이블링은 사람이 수기로 진행하면서 발생되는 오류, 시간/비용을 획기적으로 감소시킬 수 있습니다.

Context between sentences

Sentence Embedding

Sentence embedding은 자연어 처리 분야에서 매우 중요한 기술로 문장과 문장 간의 의미관계를 인공지능이 지속적으로 학습하고 이를 통해 문맥의 의미를 파악하고 클래스를 분류합니다.

 

자이냅스는 Facenet 기술을 응용하여 문서 데이터의 성격을 분류하고 문서 내 문장들을 좌표로 계산하여 인공지능이 인식할 수 있도록 하며, Triplet loss 기법을 이용하여 좌표 간의 각도 및 거리를 계산하고 인공지능은 반복학습을 통해 계속적으로 좌표 간의 각도 및 거리를 조절하여 데이터 클래스를 분류합니다.

What do you want to know?

Machine Reading Comprehension

 

MRC는 AI가 사람처럼 문서를 읽고 자연어로 주어진 문제의 맥락을 이해하여 주어진 질문에 스스로 답변을 찾아 대답하는 인공지능 기반 기술입니다.

기존 검색시스템에서는 사용자가 질문을 입력하면 해당 질문에 있는 키워드가 포함된 모든 문서를 찾아주고, 사용자가 일일이 문서를 읽고 해답을 찾아봐야 했다면, MRC는 질문에 대한 답변을 바로 제시할 수 있습니다.

 

MRC를 적용할 경우, 기존 홈페이지 혹은 그룹웨어의 성능을 개선하여 효율적으로 정보를 찾고, 정보 공유 수준을 높일 수 있다.

Guess who talk to you

Speech Synthesis

​​

음성의 특징을 추출하는 Mel finter bank 알고리즘과 딥러닝을 활용하여, 적은 음성 데이터로도 빠른 시간 안에 자연스러운 음성합성이 가능합니다.

• 기술적 고도화를 통해 타 기술보다 높은 음질의 컨텐츠 생성

시스템 최적화를 통해 음성 생성 속도 개선(동일 시스템 기준 구글의 공개기술은 5초 내외, 자사 기술 1초 내외)

• 후처리 없는 고음질 컨텐츠 생성

• 연예인 기획사와의 제휴를 통해 연예인 음성 모델 보유 예정

• 음성 모델 생성관점에서 전처리 및 후처리를 최소화하여 빠르게 생성

​⇠ 가상음성 듣기 클릭