AI模型架构:BERT
How eBay Created a Language Model With Three Billion Item Titles
By leveraging deep learning techniques to compare the titles of product listings, we greatly improved the relevance of our recommended items on eBay’s View Item page.
QQ浏览器是如何提升搜索相关性的?
QQ浏览器搜索怎么和搜狗搜索融合?搜索相关性如何提升?
字节跳动模型大规模部署实战
字节跳动内部模型部署方案,利用编译技术实现了模型前后处理的训推一体化,在字节跳动内部以中台的形式服务了大量核心业务,相关的方案已经开源。
美团外卖推荐智能流量分发的实践与探索
美团外卖推荐团队在推荐算法的长期落地实践中,针对外卖业务情境化特点对排序模型进行深入探索与优化。
Attempting to Predict the CEFR Level of English Texts
This time I wanted to see if I could predict the CEFR level of a given text. This kind of system is a useful tool for teachers or self-studying students as it helps them find reading material of an appropriate difficulty level.
EasyModeling算法框架介绍
经营数字化、助力商家精细化经营符合公司“一体两翼”的战略目标,同时也是大势所趋。机器学习、深度学习算法基于历史积累的数据信息进行决策,为商户赋能提供了可能。
小数据量语音合成技术在作业帮的应用
语音合成是将文字内容转化成人耳可感知音频的技术手段,传统的语音合成方案有两类:基于波形串联拼接的方法和基于统计参数的方法。随着深度学习的发展以及计算能力的不断提升,基于神经网络的语音合成方案逐步成为语音合成领域的研究热点。
相较于传统的语音合成方案来说,基于神经网络的语音合成技术最大的特点就是结构简单。端到端的语音合成方案可以直接输入文本或者字符,合成系统就能将与之对应的音频波形直接输出,降低了开发者对语言学和声学知识的掌握要求,同时该方案下生成的音频无论拟人化程度,还是对原始录音数据情感风格的还原情况都远优于传统方案。
Ernie-SimCSE对比学习在内容反作弊上应用
将前沿文本表示学习引入与spammer的持续对抗中,不断提升反作弊能力,提高spammer作弊成本。
深度学习在携程搜索词义解析中的应用
搜索准确率和召回率提升,适应长尾搜索词,大幅改善搜索体验。
主动学习技术在作业帮业务场景中的创新与实践
如何少标数据,但又兼顾不确定性和多样性。
检索式对话系统在美团客服场景的探索与实践
美团语音技术团队设计并迭代了一套基于检索式对话系统的框架,以推荐回复的方式,基于对话上文为坐席提供候选回复,提高坐席效率进而提升用户体验,在美团众多业务上均取得了显著的效果。
对比学习算法在转转的实践
CL 的技术源泉来自度量学习,大概的思想是:定义好样本的正例和负例,以及映射关系(将实体映射到新的空间),优化目标是让正例在空间中与目标样本的距离近一些,而负例要相对远一些。
聊聊机器如何“写”好广告文案?
创意作为一种信息载体,将广告主的营销内容呈现给用户,辅助用户消费决策,乃至激发潜在需求。通常,创意可表现为文本、图片及视频物料的单一或组合形式,而创意优化旨在提升创意物料的业务价值,本文简要聊聊针对创意文案自动撰写的一些探索与实践,整体分五部分:第一部分简述广告文案优化的必要性;第二部分介绍文本生成相关概念及主流方法;第三部分介绍在文案生成方面的探索实践;第四部分借鉴业界研究成果,探讨文案自动生成未来的一些工作思路;最后做下小结。
基于CNN的新词发现算法
借鉴经典图像算法,NLP领域“新词发现”任务的一种创新解法。
Transformer技术在好大夫在线的落地探索
众所周知,好大夫在线拥有数十亿条医患交流和数亿张医疗相关照片。它们占有着大量的存储空间,且由于标记成本过高,而没办法被利用。Transformer技术给了我们一个将它们利用起来的机会,从而给医患群体提供更可靠的帮助。
“软硬结合”- 转转搜索少无结果模块简介
搜索场景下,相关性与流量效率都是两大核心目标。转转少无结果与转转主搜就是这样的两个模块,转转少无结果模块是转转主搜模块的兜底,当用户在APP搜索时,主搜商品展示完毕或者主搜商品过少时,会向用户展示“猜你喜欢”商品。即少无结果模块。