AI模型架构:BERT
QQ浏览器是如何提升搜索相关性的?
QQ浏览器搜索怎么和搜狗搜索融合?搜索相关性如何提升?
字节跳动模型大规模部署实战
字节跳动内部模型部署方案,利用编译技术实现了模型前后处理的训推一体化,在字节跳动内部以中台的形式服务了大量核心业务,相关的方案已经开源。
美团外卖推荐智能流量分发的实践与探索
美团外卖推荐团队在推荐算法的长期落地实践中,针对外卖业务情境化特点对排序模型进行深入探索与优化。
Attempting to Predict the CEFR Level of English Texts
This time I wanted to see if I could predict the CEFR level of a given text. This kind of system is a useful tool for teachers or self-studying students as it helps them find reading material of an appropriate difficulty level.
EasyModeling算法框架介绍
经营数字化、助力商家精细化经营符合公司“一体两翼”的战略目标,同时也是大势所趋。机器学习、深度学习算法基于历史积累的数据信息进行决策,为商户赋能提供了可能。
小数据量语音合成技术在作业帮的应用
语音合成是将文字内容转化成人耳可感知音频的技术手段,传统的语音合成方案有两类:基于波形串联拼接的方法和基于统计参数的方法。随着深度学习的发展以及计算能力的不断提升,基于神经网络的语音合成方案逐步成为语音合成领域的研究热点。
相较于传统的语音合成方案来说,基于神经网络的语音合成技术最大的特点就是结构简单。端到端的语音合成方案可以直接输入文本或者字符,合成系统就能将与之对应的音频波形直接输出,降低了开发者对语言学和声学知识的掌握要求,同时该方案下生成的音频无论拟人化程度,还是对原始录音数据情感风格的还原情况都远优于传统方案。
Ernie-SimCSE对比学习在内容反作弊上应用
将前沿文本表示学习引入与spammer的持续对抗中,不断提升反作弊能力,提高spammer作弊成本。
深度学习在携程搜索词义解析中的应用
搜索准确率和召回率提升,适应长尾搜索词,大幅改善搜索体验。
主动学习技术在作业帮业务场景中的创新与实践
如何少标数据,但又兼顾不确定性和多样性。
检索式对话系统在美团客服场景的探索与实践
美团语音技术团队设计并迭代了一套基于检索式对话系统的框架,以推荐回复的方式,基于对话上文为坐席提供候选回复,提高坐席效率进而提升用户体验,在美团众多业务上均取得了显著的效果。
对比学习算法在转转的实践
CL 的技术源泉来自度量学习,大概的思想是:定义好样本的正例和负例,以及映射关系(将实体映射到新的空间),优化目标是让正例在空间中与目标样本的距离近一些,而负例要相对远一些。
聊聊机器如何“写”好广告文案?
创意作为一种信息载体,将广告主的营销内容呈现给用户,辅助用户消费决策,乃至激发潜在需求。通常,创意可表现为文本、图片及视频物料的单一或组合形式,而创意优化旨在提升创意物料的业务价值,本文简要聊聊针对创意文案自动撰写的一些探索与实践,整体分五部分:第一部分简述广告文案优化的必要性;第二部分介绍文本生成相关概念及主流方法;第三部分介绍在文案生成方面的探索实践;第四部分借鉴业界研究成果,探讨文案自动生成未来的一些工作思路;最后做下小结。
基于CNN的新词发现算法
借鉴经典图像算法,NLP领域“新词发现”任务的一种创新解法。
Transformer技术在好大夫在线的落地探索
众所周知,好大夫在线拥有数十亿条医患交流和数亿张医疗相关照片。它们占有着大量的存储空间,且由于标记成本过高,而没办法被利用。Transformer技术给了我们一个将它们利用起来的机会,从而给医患群体提供更可靠的帮助。
“软硬结合”- 转转搜索少无结果模块简介
搜索场景下,相关性与流量效率都是两大核心目标。转转少无结果与转转主搜就是这样的两个模块,转转少无结果模块是转转主搜模块的兜底,当用户在APP搜索时,主搜商品展示完毕或者主搜商品过少时,会向用户展示“猜你喜欢”商品。即少无结果模块。
prompt 综述
prompt的初衷是能够运用于zero shot和few shot的场景,使得语言模型可以在预训练阶段利用尽可能多的信息进行训练,后续也能最大效率的发挥其作用。