机器学习模型:BERT
网易新闻视频内容标签多模态分析
随着短视频兴起,每天有海量的短视频上传到各大视频平台,面对海量的短视频,如何提升这些短视频的智能分发效率是各大短视频平台面临的重要课题。视频的标签技术是内容理解的一种重要手段,可以对不同兴趣的用户分发属于他们感兴趣的视频,从而提升平台的用户时长和ctr。
淘宝Push智能文案生成
Push是淘宝重要促活手段之一,运营同学通过投放各类营销、产品Push以达到唤端、促活目的。Push素材通常由人群、商品或者活动、文案构成,与用户有直接沟通的便是Push文案,优质的素材文案吸引用户点击起到正向促活作用,而劣质内容不仅可能影响用户体验,更甚者可能引发用户关闭通道。淘宝Push团队构建了统一投递平台方便各个业务方创建任务投放Push,为业务引流。通常业务同学在创建投放任务前进行Push文案创作,任务上线稳定投放后基本处于维护状态极少进行文案更新。Push业务整体文案多样性低,现有素材库内容同质且单一,基本基于电商视角出发,缺少创新和个性化突破;文案人工创作成本高,当前基本由平台与业务手动创建,依据个人文案创作能力进行输出,缺少丰富文案参考与创意输入;Push平台缺乏对文案的统一沉淀和推荐。历史优秀文案无法及时反馈到文案创建环节,缺乏算法智能化的文案创意。
基于以上问题,业务同学联合淘宝Push算法提出了智能文案生成项目,期望通过文案智能化生产和文案推荐,赋能文案创作、管理、实验、优化各个环节,提升文案丰富程度和更新频率,辅助提升 Push 点击率。
东鸽用 Go 语言写了一个能够自动解析新闻网页的算法
输入网页文本(不需要输入 xpath),自动结构化输出标题、发布时间、正文、作者、来源等信息。
前端工程师如何快速使用一个NLP模型
- 了解 NLP 发展历程 和 NLP任务边界
- 学会 如何快速使用一个NLP模型
爱奇艺短视频智能标签生成实践
如何高效的分发与使用UGC视频?
美团搜索中查询改写技术的探索与实践
本文主要讲述在美团的搜索场景下查询改写项目的迭代方向和实现思路,希望能对从事搜索、广告、推荐中召回相关工作的同学有所启发或者帮助。
下拉推荐在 Shopee Chatbot 中的探索和实践
本文将介绍 Shopee Chatbot 团队在 Chatbot 中从 0 到 1 构建下拉推荐功能的过程,并分享模型迭代优化的经验。
聊聊电商搜索的语义理解问题
聊一聊大数据时代的电商搜索问题,如何构建商品向量、如何解决搜索词与商品名称之间的语义鸿沟问题、如何解决店铺特征稀疏等问题以及如何给用户推荐合适的商品。
得物交易推荐「DSSM」在各小场景的通用推荐实战
得物是一家潮流文化的电商平台,用户在这里能够寻找、发现自己喜爱的潮流商品。交易推荐负责所有商品的流量分发,在得物商品推荐中发挥着至关重要的作用。个性化推荐效果不仅影响用户浏览体验,还关系着公司技术和品牌形象。
商品知识图谱的构建思路
在现实生活中,要理解一段语言,除了语言本身的意思,一般还要结合上下文语境,以及相关的背景知识。
用计算机处理自然语言,也是类似的思路。其中一个难点是,如何把知识结构化,从而让算法模型能根据背景知识进行推断。
例如,在电商背景下,一个用户搜索“豆豆鞋”。我们希望模型不仅能识别用户要买鞋,还要推断出这种鞋适合的人群、场景等相关信息。
把知识进行表征常用两种方式:一是知识图谱,通过图的方式表达知识的结构;二是向量,把知识用有限维的向量来表达。
这两种方式并不是割裂的,我们可以用向量构建知识图谱,也可以把知识图谱向量化。本文主要介绍电商领域知识图谱的构建方法。
闲鱼搜索召回升级:向量召回&个性化召回
在搜索系统中,召回环节位于排序漏斗的最底层,决定了下游排序的空间大小,其重要程度毋庸置疑,在闲鱼搜索场景亦是如此。然而由于机器和人力资源的限制,长期以来闲鱼搜索的召回都是使用最简单的基于文本的召回方式,其优化迭代方式也只是在基础商品字段(标题、描述)之上,增加扩展字段。
QQ音乐歌词AI辅助创作技术
在音乐创作中,是作曲困难还是作词困难?我们发现,没有接触过完整乐理教育的人会觉得作曲比较困难。我们希望通过AI技术,尤其是自然语言处理以及自然语言生成技术,帮助音乐人高效、快速创作合格品质的歌词,节约成本与时间。
智能问答技术概览及在小爱同学的实践
人通过获取和应用知识,能够实现对客观事物的认知和推理。从脑科学、神经科学的角度来说,人类的认知推理能力是一个非常复杂的系统,研究者对其机理的认识还非常有限。从人工智能的角度来说,研究者试图通过人工智能的技术去模拟人类的认知和推理的过程。问答就是一种典型的认知推理过程。智能问答,指的是根据预先构建的知识,对用户提出的问题给出答案。这里,我们通过介绍智能问答技术,来探讨人工智能如何实现认知推理。
人回答问题的过程,就是根据所掌握的知识来进行推理应用,从而得到答案的过程。一个全面而又庞大的知识储备是强大的推理能力的基础。人所掌握的知识可以是语义型(如:篮球比赛的场上人数是10人)、场景型(如:上周参加篮球比赛的情形)、经验型(如:篮球比赛最后几秒小比分落后该用的战术)、常识型(如:受伤了就不能上场比赛)等。那么,我们就可以结合这些知识回答各类问题(如图1所示)。
微信图片翻译技术优化之路
微信(WeChat)作为 12 亿+用户交流的平台,覆盖全球各个地区、不同语言的用户,而微信翻译作为桥梁为用户间的跨语言信息交流提供了便利。目前微信翻译每天为千万用户提供数亿次的翻译服务,且团队技术持续钻研,累计发表数十篇顶会论文、夺得多项 WMT 冠军。随着翻译质量的提升,微信翻译的应用形态从文本逐步扩展到图片、语音、网页、文档、视频等众多场景。本文以微信图片翻译为例介绍近一年的技术优化。
语音合成(TTS)技术在有道词典笔中的应用实践
如何更快地、更稳定地在有限资源下提供高质量的语音合成技术是有道AI团队的目标和关注的重点。
Using Rich Image and Text Data to Categorize Products at Scale
We reevaluated our existing product categorization model to ensure we’re understanding what our merchants are selling, to build the best products that help power their sales.