logo 2.png

We are making progress

to make it easier, faster, smarter。

基于规则推理的

自然语言处理引擎

数据更少,更精确

自然语言理解(Natural Language Understanding)引擎是一种聊天机器人的核心技术,当用户输入由日常用语组成的自然语言文本时, 它会通过掌握用户的意图(Intent)提供与其相应的回复。

通常, 基于规则的聊天机器人需要预先输入大量的表达方式才能处理各种用户的话语,因此构建聊天机器人需要大量的时间和费用,管理起来也相对困难。

Xinapse的NLU引擎基于韩语固有的歧义句式,搭载了以设计出的特定(General-Specific)方法为基础的推论(Inference)功能, 与基于规则(Rule-based)的聊天机器人相比, 即使使用相对较少的数据也可以准确的识别用户意图并提供正确的答案。

主题建模

基于算法而非主观直觉

Xinapse的主题建模(Topic modeling)技术将大数据中拥有共同"主题"的项目捆绑在一起, 结合了LDA(Latent Dirichlet Allocation)和自主开发的技术, 将推论出的主题与主题之间关系以视觉化形式进行内容输出。

以往的投入人力来处理数据的方式, 所投入的人力必须具备相应领域的专业知识, 但主题建模(Topic modeling)技术是由算法对数据进行判定, 即使没有专业领域的知识也可以进行。

由于可以基于准确的数据而非主观意识来进行开发, 因此相对于许多毫无意义的服务, 可以专注于客户真正需要的核心服务, 使时间和资源配置达到最优化

自动标注

更高效,更准确

 

企业和各种机构对于使用非结构化数据来克服大数据(尤其是结构化数据)的局限性往往表现出极大的兴趣, 但问题在于, 由于数据标记不是自动化的, 从而导致低效率和低利用率。Xinapse使用半监督学习(Semi-supervised Learning)技术将现有的手动数据标记升级为自动标记, 从而即使将拥有的数据中的一部分进行标记, 也可以实现对于剩下的其他所有数据的自动标记, 这大大的改善了非结构化数据分析的效率和准确性。自动标注可以实现大数据的自动化预处理, 可以有效的减少手动标注产生的错误, 减少数据处理的时间和费用。 

句子嵌入

上下文之间的逻辑关系

句子嵌入(Sentence embedding)作为自然语言处理领域的一项非常重要的技术, 使人工智能不断学习句子之间的语义关系, 利用它掌握文脉的意义, 并对其进行等级分类。

Xinapse通过应用Facenet技术对文档数据的性质进行分类, 将文件内的文章按坐标计算,从而使人工智能可以对其进行识别。同时,使用三重损失法(Triplet loss)来计算坐标之间的角度和距离, 人工智能通过反复学习, 不断调整坐标间的角度及距离, 来对数据进行等级分类。

机器阅读理解

你想了解什么?

 

MRC是一种基于人工智能的技术, 使人工智能可以像人类一样阅读文档,使用自然语言来理解问题的脉络, 并自动找到相应的答案进行解答。相对于现有的搜索系统下, 在用户输入问题后, 系统找到所有包含相关问题关键字的文档, 供用户一一阅读去寻找答案的模式, MRC技术可以立即对用户的问题给予答案。使用MRC技术, 可以大大提高现有主页或企业协作软件的性能, 有效地查询信息并提高信息共享的水平。

语音合成

点击试听虚拟语音

猜一猜是说在说话

​​

通过利用Mel Filter Bank语音特征提取算法和深度学习技术, 即便使用少量的语音数据可以在短时间内实现自然语音合成。

  • 通过技术的提高生成高于其他技术的音质内容

  • 通过优化系统,改善语音生成的速度(基于同一系统, Google的开放技术约为5秒, Xinapse的自主开发技术约为1秒)

  • 无需后处理, 即可创建高质量的语音内容

  • 与艺人公司合作, 计划建立艺人语音模型

  • 从生成语音模型的角度来讲, 大大减少前处理和后处理过程, 实现语音的快速生成。

©2020 by Xinapse

Images designed by Smashicons, Eucalyp, Good Ware. itim2101, Pause08, pongsakornRed, raw pixel.com, Pixel perfect, freepik.com, wanicon, Gregor Cresnar, Vitaly Gorbachev from flaticon  / Photos by rawpixel.com from Pexels