AI模型架构:BERT
基于智能算法的舆情分析技术研究与实践-理论基础与舆情模型构建
近年来,金融市场信用风险环境发生了显著变化,违约事件频发,随着证券公司信用业务种类和敞口增加,资讯舆情风险监测能力逐步成为证券公司的重要竞争力;证券公司需要针对自身需求场景,多角度发掘企业主体的经营风险和潜在价值信号,实现对舆情资讯精准高效的分析分类。提高了业务部门接收市场舆情的精准度和时效,助力业务人员识别风险和发掘价值机会。
预训练语言模型在自动作文评分中的应用
本文介绍了AES领域的相关方法和问题,并针对预训练模型在AES领域的问题进行分析和改进,在流利说内部和外部数据数据上取得了较好的结果,也为长文本编码提供了一种有效的编码方式。
Using predictive technology to foster constructive conversations
Nextdoor’s purpose is to cultivate a kinder world where everyone has a neighborhood they can rely on. We want to give neighbors ways to connect and be kind to each other, online and in real life. One of the biggest levers we have for cultivating more neighborly interactions is by building strategic nudges throughout the product to encourage kinder conversations.
Today, we use a number of mechanisms to encourage kindness on the platform, including pop-up reminders that slow neighbors down before responding negatively. Over the past few years, we’ve used machine learning models to identify uncivil and contentious content.
Words All the Way Down — Conversational Sentiment Analysis
Explore challenges, methodologies and datasets around conversational sentiments and learn how PayPal analyses customer sentiment.
从跨模态和上升通道谈富媒体内容的冷启动
富媒体内容相比于传统的文章、图片、音乐等单一载体内容,在“注意力经济”的时代,是能够最大限度传递信息、吸引消费者注意力的内容形式,因其丰富的呈现形式成为平台创作者最佳的表达工具,冷启优化至关重要。
基于双模检测的通话录音质检解决方案
本文针对客服通话录音质检场景,提出了一套智能质检解决方案,可对通话内容中标准话术、红线词和相似语义话术进行检测,通过双模检测模型同时提升了检测算法的准确性和泛化性。
网易新闻视频内容标签多模态分析
随着短视频兴起,每天有海量的短视频上传到各大视频平台,面对海量的短视频,如何提升这些短视频的智能分发效率是各大短视频平台面临的重要课题。视频的标签技术是内容理解的一种重要手段,可以对不同兴趣的用户分发属于他们感兴趣的视频,从而提升平台的用户时长和ctr。
淘宝Push智能文案生成
Push是淘宝重要促活手段之一,运营同学通过投放各类营销、产品Push以达到唤端、促活目的。Push素材通常由人群、商品或者活动、文案构成,与用户有直接沟通的便是Push文案,优质的素材文案吸引用户点击起到正向促活作用,而劣质内容不仅可能影响用户体验,更甚者可能引发用户关闭通道。淘宝Push团队构建了统一投递平台方便各个业务方创建任务投放Push,为业务引流。通常业务同学在创建投放任务前进行Push文案创作,任务上线稳定投放后基本处于维护状态极少进行文案更新。Push业务整体文案多样性低,现有素材库内容同质且单一,基本基于电商视角出发,缺少创新和个性化突破;文案人工创作成本高,当前基本由平台与业务手动创建,依据个人文案创作能力进行输出,缺少丰富文案参考与创意输入;Push平台缺乏对文案的统一沉淀和推荐。历史优秀文案无法及时反馈到文案创建环节,缺乏算法智能化的文案创意。
基于以上问题,业务同学联合淘宝Push算法提出了智能文案生成项目,期望通过文案智能化生产和文案推荐,赋能文案创作、管理、实验、优化各个环节,提升文案丰富程度和更新频率,辅助提升 Push 点击率。
东鸽用 Go 语言写了一个能够自动解析新闻网页的算法
输入网页文本(不需要输入 xpath),自动结构化输出标题、发布时间、正文、作者、来源等信息。
前端工程师如何快速使用一个NLP模型
- 了解 NLP 发展历程 和 NLP任务边界
- 学会 如何快速使用一个NLP模型
爱奇艺短视频智能标签生成实践
如何高效的分发与使用UGC视频?
美团搜索中查询改写技术的探索与实践
本文主要讲述在美团的搜索场景下查询改写项目的迭代方向和实现思路,希望能对从事搜索、广告、推荐中召回相关工作的同学有所启发或者帮助。
下拉推荐在 Shopee Chatbot 中的探索和实践
本文将介绍 Shopee Chatbot 团队在 Chatbot 中从 0 到 1 构建下拉推荐功能的过程,并分享模型迭代优化的经验。
聊聊电商搜索的语义理解问题
聊一聊大数据时代的电商搜索问题,如何构建商品向量、如何解决搜索词与商品名称之间的语义鸿沟问题、如何解决店铺特征稀疏等问题以及如何给用户推荐合适的商品。
得物交易推荐「DSSM」在各小场景的通用推荐实战
得物是一家潮流文化的电商平台,用户在这里能够寻找、发现自己喜爱的潮流商品。交易推荐负责所有商品的流量分发,在得物商品推荐中发挥着至关重要的作用。个性化推荐效果不仅影响用户浏览体验,还关系着公司技术和品牌形象。
商品知识图谱的构建思路
在现实生活中,要理解一段语言,除了语言本身的意思,一般还要结合上下文语境,以及相关的背景知识。
用计算机处理自然语言,也是类似的思路。其中一个难点是,如何把知识结构化,从而让算法模型能根据背景知识进行推断。
例如,在电商背景下,一个用户搜索“豆豆鞋”。我们希望模型不仅能识别用户要买鞋,还要推断出这种鞋适合的人群、场景等相关信息。
把知识进行表征常用两种方式:一是知识图谱,通过图的方式表达知识的结构;二是向量,把知识用有限维的向量来表达。
这两种方式并不是割裂的,我们可以用向量构建知识图谱,也可以把知识图谱向量化。本文主要介绍电商领域知识图谱的构建方法。