话题机器学习模型 › BiLSTM

机器学习模型:BiLSTM

BiLSTM (Bidirectional Long Short-Term Memory) 是一种深度学习模型,它将 LSTM 模型的双向思想和长短时记忆网络的思想结合起来。

它使用了两个独立的 LSTM 网络,分别对序列的正向和反向进行处理。这样可以让模型在处理序列时同时考虑上下文的正向和反向信息,提高了模型的泛化能力。

在自然语言处理领域中,BiLSTM 常用于词性标注、命名实体识别、文本分类、序列标注等任务。由于它能够考虑上下文信息,因此在处理自然语言中的不确定性和模糊性方面表现较好。

强化学习在黄页商家智能聊天助手中的探索实践

本地服务(黄页)微聊代运营模式是指人工客服代替58平台上的商家与C端用户IM沟通聊天以获取商机(如用户联系方式、细粒度需求信息等),再将商机转交给商家,促进商家成单。我们基于58AI Lab自研的灵犀智能语音语义平台构建了智能客服商家版,将其应用在微聊代运营场景下,通过人机协作模式提高商机获取效率,打造了黄页商家智能聊天助手。这里的人机协作模式先后经历了三个阶段:在早期机器人效果较一般时,机器人和人工客服分时工作,即人工客服不上班时才由机器人接待用户咨询。在经过优化机器人效果较优时,先机器人再人工,即当用户来咨询商家时,白天先由机器人接待,若机器人能够聊出商机则结束会话,若不能再转接人工客服,晚上使用纯机器人接待。在机器人效果和人工很接近甚至超过人工时,使用纯机器人接待,人工客服去从事其他更复杂的工作。2021年年初,黄页商家智能聊天助手被商业化,以“微聊管家”命名随会员套餐一起打包售卖给商家,全年共计服务了数万个商家,为公司创造收入超过五千万元。当前,机器人的商机转化率(聊出商机的会话数/总会话数)已达到了人工客服的98%水平,我们实现了纯机器人接待,节省了数十名客服人力。

黄页商家智能聊天助手属于留资机器人,与以回答用户提问为主的QA问答机器人不同,留资机器人的主要任务是引导用户留下资料信息,不仅要做自动问答,还需要做多轮引导,技术挑战更大,对话策略更为复杂。我们在部分黄页类目下实践了基于强化学习的对话策略,商机转化率绝对提升了10%,本文主要分享我们基于强化学习的对话策略实践。

Enabling Offline Inferences at Uber Scale

At Uber we use data from user support interactions to identify gaps in our products and create better, more delightful experiences for our users. Support interactions with customers include information about broken product experiences, any technical or operational issues faced, and even their general sentiment towards the product and company. Understanding the root cause of a broken product experience requires additional context, such as details of the trip or the order. For example, the root cause for a customer issue about a delayed order might be due to a bad route given to the courier. In this case, we would want to attribute the poor customer experience to courier routing errors so that the Maps team can fix the same.

Initially, we had manual agents review a statistically significant sample from resolved support interactions. They would manually verify and label the resolved support issues and assign root cause attribution to different categories and subcategories of issue types. We wanted to build a proof-of-concept (POC) that automates and scales this manual process by applying ML and NLP algorithms on the semi-structured or unstructured data from all support interactions, on a daily basis.

This article describes the approach we took and the end-to-end design of our data processing and ML pipelines for our POC, which optimized the ease of building and maintaining such high scale offline inference workflows by engineers and data scientists on the team.

一种基于LSTM的音频质量检测方案

随着网络技术的发展,各种各样的音视频产品应接不暇,应用场景也越来越多样,使人们的生活更加丰富多彩。与此同时,人们对音频的质量也有越来越高的要求,而如何准确评估音频质量好坏成为了相关行业的研究热点。音频质量评估方法主要分为主观和客观两类。主观方法是通过人根据听觉感受来打分。客观的方法是通过算法来计算评估的,主要分为有参考和无参考两种。有参考的方法在评估音频时需要一个对应的高质量无损音频作为参考,代表算法如PESQ(Perceptual evaluation of speech quality);而无参考的方法直接对音频进行打分,代表算法如P.563。

目前大多数客观的音频质量评估方法属于无参考这一类,这类方法往往更准确。而在现实生活中,人类在没有参考的情况下能直接分辨出音频质量的好坏,这意味着存在一种评价机制来直接对音频质量进行评估而不需要参考。设想一下,如果我们通过神经网络模型来训练学习这种机制,那么这个模型不就能准确评估任何语音的质量吗?基于这样的思路,我们探索和实践了基于LSTM深度学习模型的音频质量检测方案。

爱奇艺短视频智能标签生成实践

如何高效的分发与使用UGC视频?

黄页商家智能聊天助手用户体验深度优化

在58同城生活服务平台上,当用户有保洁、搬家、维修等需求时会通过微聊以文本对话的方式联系58平台上的商家,而商家由于工作繁忙往往无法及时回复用户,造成商机流失 。为了解决该问题,黄页业务线在2020年初推出了微聊代运营模式——构建一支人工客服团队,由人工客服来代替商家接待用户,当人工客服和用户沟通完形成有效商机信息(联系方式、价格、 地点 等)后再转交给商家,以帮助商家提高获客效率。在这样的场景下,我们基于58同城AI Lab灵犀智能语音语义平台的人机对话能力打造了黄页商家智能聊天助手,当用户来联系商家时,先由机器人接待,若机器人能够聊出商机则结束对话,若不能则转接人工客服,这种人机协作的方式可以大大节省客服人力。机器人和人工客服的能力由商机转化率指标来评价,即聊出商机的会话数比接待会话数,当前机器人的能力达到了人工客服的95%水平,共计节省客服人力数十名,黄页商家智能聊天助手已经进行了商业化,以"微聊管家"命名随会员套餐一起打包售卖给商家,折合贡献收入每月达到数百万元。

黄页商家智能聊天助手通过坐席分流、智能问答、商机引导、商机挖掘等功能来提升对话机器人的商机转化率,提升C端用户的对话体验和B端商家的使用体验,本文主要分享我们如何深度优化黄页各类目的智能问答,多轮对话和商机质量识别等,来提升C端用户对话体验和提升B端商家的获客体验,最后做总结和展望。

美团知识图谱问答技术实践与探索

基于问答系统,以自动智能回复或推荐回复的方式,来帮助商家提升回答用户问题的效率,同时更快地解决用户问题。

知识图谱技术概述

“知识图谱”的概念在提出之初特指Google公司为了支撑其语义搜索而建立的知识库。随着知识图谱的不断发展,知识图谱已经成为大数据时代最重要的知识表示形式。

阿里小蜜多模态知识图谱的构建及应用

本文由阿里巴巴达摩院阿里小蜜团队带来,介绍其在知识图谱方面一年多以来的一些工作进展。主要内容包括:① 知识图谱的简介;② 领域知识图谱的构建及应用;③ 多模态知识图谱的构建及应用;④ Takeaways (心得领悟)。

SkyNet:字节跳动泛客诉问题挖掘与风险监控中台实践

随着互联网和智能手机的普及,人们的生活大多时候都离不开移动 App,在信息量与日俱增的大数据时代,用户反馈数据可以帮助发现热点问题、避免安全问题、优化产品体验、提升产品质量等。

SkyNet 天网平台专门聚焦于泛客诉问题数据,包括 App 端内离线反馈、IM(Instant Messaging,即时通讯)反馈、电话热线反馈、举报反馈、各大应用市场评论、App 端内实时评论、内部运营工单等数据,挖掘其中的价值,为各方业务带来收益。

58本地服务《虚拟类目-标签》体系构建

本文介绍了58本地服务《虚拟类目-标签》体系构建的相关工作,包括虚拟类目生成、标签筛选及挂载、同义去重等内容,我们将实际业务需求转化成机器学习问题,并调研实践相关算法模型完成构建工作。通过逐步上线《虚拟类目-标签》内容,方便用户找到所需服务以提高转化率,实现业务提效的目标。

企业知识图谱技术与应用

知识图谱于2012年提出,当时主要被用来提高其搜索引擎质量,改善用户搜索体验。随着大数据时代的到来和人工智能技术的进步,越来越多的企业开始将知识图谱技术融入其已经成型的数据分析业务,本文介绍了爱番番构建企业知识图谱使用到技术及其应用。

NLP在招标项目中的运用与实现

58同城是国内最大的生活服务类信息平台,有着数百万的商家,其中不乏有资质的商家可以参与投标,为了给这些商家提供更多的有效商机和更大的订单量,我们整合了全网招标资源,30+服务行业的招标采购项目至58同城商家版APP平台,在招标服务模块中提供及时有效的本地生活服务领域标书,帮助商家获得最新商机。

情感计算在ugc应用进展

观点、情感以及与之相关的许多概念,如评价、态度、感情和心情,与我们主观的感觉和感受密切相关。我们对于现实世界的感知和感受,包括我们做出的任何选择,也很大程度上受到他人对于当前世界的洞察和观点的影响。情感分析伴随着网络社会媒体(如评论、论坛、微博、新闻资讯网站)的兴起而快速发展。这些也被称为用户生成内容(ugc)的社会媒体数据,社会媒体中用户生成内容蕴含了大量的用户观点信息,要从中挖掘有用知识需要对情感计算与观点挖掘问题进行研究。自2000年来年初以来,情感计算已称为自然语言处理领域最活跃的研究问题之一。情感计算系统几乎在每一个企业、卫生机构、政府乃至整个社会都有广泛应用。

零代码上线小布对话技能:技能平台的实践与思考

前不久,OPPO旗下的人工智能助手“小布助手”月度活跃用户数突破一亿,成为国内首个月活用户数破亿的手机语音助手。

经过2年多的成长,小布助手在能力上实现大幅升级,也融入了我们身边便捷的服务功能。小布团队亦克服了诸多技术难点,为用户带来了更智能的服务。为此,小布团队撰写了一系列文章,详细介绍小布助手背后的技术支撑,本文是揭秘小布背后技术的第四篇,主要介绍技能平台的实践与思考。

微信看一看如何过滤广告文章?

在微信生态体系下每天都会产生大量的文章数据,个别垃圾文章掺杂其中。这些垃圾文章如果出现在看一看中会影响用户的阅读体验,而广告文章作为其中一个占比最大的垃圾子类型值得重点关注。对此我们构建了一套完整的广告识别系统来对严重广告垃圾文章进行过滤。

对话交互:封闭域任务型与开放域闲聊算法技术

小布助手架构是融合了任务型、知识问答型、聊天对话型的综合对话系统。

Home - Wiki
Copyright © 2011-2024 iteam. Current version is 2.137.1. UTC+08:00, 2024-11-05 12:16
浙ICP备14020137号-1 $Map of visitor$