话题机器学习模型 › BERT

机器学习模型:BERT

BERT在网易新闻时效性上的应用

如何根据具体的任务情景来调整BERT模型以更好判断在判断新闻时效性?本文做出了如下探讨。

智能预警在风控场景中的实践与思考

本文以58信息安全风铃监控预警系统为原型,重点从线上数据生产到指标计算、存取、阈值设置的角度介绍一些实践中的通用技术点,以解决信息安全风控对抗过程中在高并发情形下面临的问题和挑战。

高德POI数据生产中的计算机视觉技术

高德有7000万以上的POI(Point of Interest,兴趣点)数据。每年还会出现很多新增的POI,也会有一部分POI停止营业、关门倒闭。这些POI如何制作和更新?从采集方式来看会有很多获取POI的方式,有一种重要而且直观的采集方式,高德通过众包方式采集街边店铺的图像,利用计算机视觉技术(以及人工辅助)从图像中提取POI数据。

下图演示了一次众包化采集过程。高德的采集人员从这条街走过,拍摄连续图像。最后把图像和GPS坐标,上传给高德。

对话交互:封闭域任务型与开放域闲聊算法技术

小布助手架构是融合了任务型、知识问答型、聊天对话型的综合对话系统。

iFeedback智能分类

iFeedback智能分类系统,提供了基于BERT模型分类和基于规则分类两种模式,通过对海量用户反馈进行快速自动化分类/打标签,提高了问题跟进和反馈分析处理的效率。

帮帮商家版智能问答模型优化实践

58同城是国内最大的生活服务信息服务平台,连接着数千万C端用户和数百万B端商家,为了提升B端商家和C端用户的有效连接,基于智能对话机器人我们构建了帮帮智能客服商家版,其中一项功能为在微聊中对用户问题进行智能回复。

基于深度学习的短文本相似度学习与行业测评

相比于长文本的相似度计算,短文本的相似度计算存在更大的挑战。

AI落地场景探索:医学报告单结构化

在好大夫在线每天的线上问诊中,包含了大量的各种医院报告单、化验单等图片,如何识别并格式化这些报告单数据,成了我们面临的一大难题。

帮帮商家版黄页微聊代运营中的商机槽位识别实践

帮帮商家版黄页代运营中的商机识别原理实践

智能客服新三网场景问答模型优化实践

帮帮智能客服是58同城自主研发的智能客服系统,新三网场景是58智能客服在房产领域垂直深耕的一个典型场景。该场景面向的是赶集网、安居客、58同城的房产经纪人用户。随着新三网使用量的增加我们对新三网场景的问答模型进行了迭代优化,为用户提供更加准确、快速、高效的服务,以节省人工客服成本,提高人效。

闲鱼是怎么让二手属性抽取准确率达到95%+的?

让算法“读”懂二手商品。

文本预训练模型在信息安全场景的探索和实践

本文介绍文本预训练模型在信息安全场景的一些探索和实践,主要聚焦于对话文本分类。信息安全场景种类繁多,其中一项具体业务是对用户提交的举报内容进行审核,判断被举报对象是否有违规问题。用户提交的举报材料有多种形式,而双方沟通的文字对话记录是一项关键证据。少量的对话文本可以通过人工的方式进行审核,而更大量、更快速的识别还需要借助算法。

搜索中的Query扩展技术(二)

Query扩展是搜索技术中重要的组成之一,本文探讨了当Query较长时,我们除了处理实体词,还需要注意些什么。

互联网广告黑产盛行,如何反作弊?

广告点击反作弊实践。

“深耕内容”背景下,携程如何做景酒优质内容的挖掘

伴随信息时代的快速发展,消费者的消费观念趋于理性、客观,对产品本身的质量要求也越来越高。在用户难以直接接触到产品的情况下,能否第一时间让用户对目标产品有快速、深入的了解,已经成为产品推荐的关键。因此,优质、多样、精简、信息含量高的内容素材,对提高产品吸引力至关重要。

就旅行场景而言,通过给景酒打上不同维度的标签,既有利于平台通过用户偏好更加合理地推荐相应产品,也能帮助用户对景酒有更快速的了解。同时,我们在景酒标签的基础上,进行更加深刻的内容挖掘,结合标签相关的、内容优质的推荐理由,大幅度加深用户对产品特色的了解,帮助客户快速挑选出最心仪的产品,提升用户体验。

用万字长文聊一聊 Embedding 技术

现在主流的 Embedding 技术和原理。

Accueil - Wiki
Copyright © 2011-2024 iteam. Current version is 2.139.0. UTC+08:00, 2024-12-25 14:25
浙ICP备14020137号-1 $Carte des visiteurs$