话题机器学习模型 › Seq2Seq

机器学习模型:Seq2Seq

Query理解在美团搜索中的应用

查询理解是搜索引擎与NLP结合的产物,用来解决搜索相关的一些文本理解任务。本文主要介绍了美团查询理解系统中的主要模块,包括实体识别、查询改写、意图识别。

基于Seq2Seq的信息抽取方法在多轮对话场景的应用

多种特征提取器和优化方案哪种方案效果最优呢?

挖掘旅游热点吸引年轻人,携程自动热点投放系统的背后玩法

从2017年开始,携程用户搜索时使用的关键词发生了一些有趣的变化:虽然传统的热门目的地词如“上海、北京”依然占比很高,但是大量长尾词如冷门景点、新兴景点也开始在搜索热词榜上占据一席之地。

对此团队进行了相应的数据分析,发现这些长尾词的急剧上升与一些外部热点如微博热搜,抖音网红,小红书热门文章等呈现正相关关系。对这个问题深入研究后发现,随着互联网用户的年轻化,网民们探索问题的热情明显变高,认知闭合(cognitive closure)度高的用户数量开始快速上升,他们在外部媒体获取到了目的地的热点和信息后,有意愿来专业旅游网站获取更多的目的地资讯,减少不确定性。因此大量用户会搜索长尾词。

文本表征模型在风控场景下的应用实践

本文介绍了文本表征算法在58信安场景下的探索和实践。信息安全场景下业务种类繁多,在对用户发帖内容进行审核时,通过对文本建模得到其表征,既可以用于对文本的直接分类算法,也可以通过聚类算法快速得将文本信息归类。

How We Improved Agent Chat Efficiency with Machine Learning

随着聊天的持续增长和新的内部工具的出现,帮助我们的代理更有效率和生产力是确保为我们的用户提供更快的支持时间并进一步扩大聊天规模的关键。

从对另一个第三方工具的使用情况进行分析,以及进行一些观察,我们意识到建立一个基于模板的功能不会有帮助。我们需要提供个性化的功能,因为我们的消费者支持专家关心他们的写作风格和语气,而使用模板往往让人觉得是机器人。

我们决定建立一个机器学习模型,称为SmartChat,它通过利用几个内部数据源提供上下文建议,帮助我们的聊天专家更快地打字,从而为更多的消费者服务。

在这篇文章中,我们将解释从问题发现到设计迭代的过程,并分享该模型是如何从数据科学和软件工程角度实现的。

智能标题生成在58招聘业务中的探索

文本生成是自然语言处理(NLP)领域中非常重要且具有一定挑战性的分支。本文以实际业务中标题生成的需求为背景,结合主流的文本生成方法进行实践,并对当前的方法进行改进,有效提升了用户体验与招聘双方的连接效率,实现了为招聘业务赋能。

搜索中的Query扩展技术(二)

Query扩展是搜索技术中重要的组成之一,本文探讨了当Query较长时,我们除了处理实体词,还需要注意些什么。

语音识别中的WFST和语言模型

在语音识别系统中,有限加权状态转换机(Weighted Finite State Transducers, WFST)扮演着重要角色。本文主要介绍发音词典、语言模型和WFST的原理,以及在实践过程中的一些优化方法。

JUST技术:基于深度学习Seq2Seq框架的技术总结

三个里程碑式的方法

滴滴语音交互自然语言理解探索与实践

滴滴是一个让出行变得更美好的公司,语音交互作为出行领域最安全,最自然的交互方式在滴滴内部有着广泛的应用前景,目前滴滴语音交互已经应用在智能外呼,司机端,地图,车机系统多个领域中。语音交互离不开自然语言理解,用户说的每一句话都应该得到正确的理解和反馈,自然语言理解技术让语音助手变得像人一样和用户进行交流。本文主要讲解滴滴语音交互中自然语言理解技术的一些探索和实践。

腾讯信息流热点挖掘技术实践

本次分享主要介绍腾讯在热点挖掘方面的工作。基于搜索数据和自媒体文章,通过时序分析方法和内容聚类相结合的方法挖掘热点,并将热点聚类成事件和话题。

让代码自动补全的全套流程

代码自动补全~

万字长文读懂微信“看一看”内容理解与推荐

技术为眸,看懂内容的“花花世界”

Let's Chatbot一波。

近期Chatbot research总结与大家分享!

基于无监督学习的语义不畅低质文本识别与应用如何撑起58同城海量数据?

对于海量数据的信息审核,58同城这样做

爱奇艺语音转换技术的探索与实践

随着语音技术,深度学习技术以及相关硬件的发展,语音技术应用已经逐渐走进大家的日常生活中。语音识别,语音唤醒是大家比较熟悉的两个应用场景,一个比较新的应用场景——语音转换也逐渐吸引了研究者的注意力。柯南的变声蝴蝶结要成为现实了!

- 위키
Copyright © 2011-2024 iteam. Current version is 2.137.3. UTC+08:00, 2024-12-17 06:26
浙ICP备14020137号-1 $방문자$