公司:58同城
58同城(NYSE:WUBA),简称58,是一家位于中国北京市的生活服务及分类信息网站,以在地服务为主,举凡租房、招聘、交友、水电、二手交易等等,由北京五八信息技术有限公司拥有,创始人是姚劲波,成立于2005年12月12日。该网站是中文最大的生活信息网站,该网站的口号是“一个神奇的网站”。
文本匹配算法在智能语音机器人中的对比分析实践
本文主要针对经典的文本匹配技术在语音机器人中标准问题匹配上进行实践对比,文中先是介绍了经典孪生网络 SiameseLSTM,BiMPM,ESIM原理及其使用方法,其次是分析对比了Bert 系列预训练模型对标准问题匹配的影响,最后介绍了对抗训练与模型集成等 Tricks在文本匹配中应用,最终在测试数据集下文本匹配准确率从 97.23% 提升到 99.5 %。
转转搭建 iconfont 平台实践
icon 的管理是设计稿转代码过程中,重要但容易被忽视的环节。
所以在实际的业务代码中 icon 问题的解决方案往往也是八仙过海,能用就行。比如导出为 png, svg 格式的文件,在项目中作为静态资源直接引用,或者上传到 CDN 作为外链引用。显然这些方案多少都存在着一些小问题:
- 在用户体验上,包括在高分辨率屏幕上显示模糊、增加额外的 http 请求、异步加载造成页面抖动等;
- 在开发体验上,包括无法通过 CSS 控制样式以便和文本保持一致、难以复用和更新等。
为了解决上述问题,规范一点的做法是把设计稿 icon 转换成 iconfont 字符集,在项目中导入字体文件使用。对于初创团队而言,淘宝免费的 iconfont 网站无疑是快速的解决方案:上传 icon ——生成项目——一键下载,非常方便。然而有几个问题阻碍了它成为企业级的解决方案:
- 一个是项目间无关联,相同 icon 无法复用和统一更新;
- 一个是无法强绑定企业账户,在团队协作和人员更迭交接时不可控;
- 最后一个是 icon 的版权问题,所有人都可以免费使用所有人上传到平台的 icon ,这可能不是公司所希望的。
所以上述的解决方式在项目初期可能确实可以快速解决问题,但随着业务复杂度的指数级别增长,开发周期的拉长,以及项目维护人员的更迭, 这都可能成为后期无法维护的技术债,降低开发效率,影响用户体验。在转转的技术体系中,iconfont 平台作为物料中心建设的组成部分,是不可或缺的一环。
58同城-北斗前端监控系统的挑战与实践
北斗前端监控系统是58集团前端监控基础设施,目标和未来的发展方向是打造前端全技术栈的线上质量监控系统,并对前端各种线上质量数据做整合,最终形成一个前端线上数据平台,对内各业务提供数据服务。在北斗团队不断迭代和完善系统的过程中,我们遇到了很多挑战,这些挑战来源于越来越广泛的业务场景,不断提升的流量负载,以及系统规模不断扩大而引发的维护成本提升。
58同城数据应用指标体系建设
当前数字化运营已经成为企业驱动业务发展的重要利器,但搭建一套数据中台满足产品、开发、运营的日常迭代及开发以及领导的决策,首当其冲面临的一个问题是,企业内部指标间纷繁复杂,如何拨开云雾,统一指标口径,将指标管理得井井有条,成为企业数据治理过程中必须面临的挑战。
本文主要讲解了58商业数据团队数据指标体系如何从构思到实际应用中落地的全过程。
詹坤林:AI技术助力CRM系统智能化
58同城生活服务平台包括房产、汽车、招聘、本地服务(黄页)四大老牌业务,平台连接着海量C端用户和B端商家,B端商家可以在平台上发布房源、车源、职位、生活黄页等各类信息(我们称之为“帖子”),平台将这些帖子分发给C端用户供其浏览,帮助不同业务下的B端商家获取目标用户,助力B端商家获得更大收益。58平台上的B端商家来自于房产中介、二手车商、中小企业、黄页商家等客户,各业务线的销售团队会向这些客户做营销推广,售卖会员套餐,吸引客户成为58商家,客户成为58商家后便可以利用58平台的流量优势获取更多商机。在这样的业务模式下,每年销售团队售卖的会员套餐为58贡献了大量的收入。销售人员会使用客户关系管理(CRM,Customer Relationship Management)系统作业,如何打造智能化CRM,提高销售人员工作效率和业绩至关重要。2020年6月,AI Lab全面接手了CRM智能化算法工作,我们将个性化推荐/搜索、语音、NLP和人机对话技术应用在黄页(本地服务)业务线CRM系统中,助力了CRM系统智能化。
智能问答机器人问答引擎架构实践
58智能问答机器人是由58AI Lab自研的一套人工智能问答系统,结合自然语言处理、深度学习、语义理解、智能推荐等多种人工智能技术,通过自主学习,精确识别用户意图,实现与用户进行智能问答。实现了QABot业务咨询问答、TaskBot任务多轮对话、问答推荐等多种能力。智能问答机器人在帮帮智能客服场景下整体问题解决率以及在帮帮商家版场景下商机转化率都达到了接近人工客服的水平。
星火在CRM商机智能分配场景的应用实践
为了更好地支持销售人员获取商机,CRM系统提供了商销匹配、未覆盖分配、一键申领、新增商机分配、刷新商机分配等多种功能。AI侧使用个性化推荐算法、个性化搜索排序算法,通过直接提高成单链路中间环节的关键指标的方式,来提高最终的成单转化率。
流式和离线语音场景下VAD语音端点检测算法实践
近年来,AI智能语音应用在58同城广泛落地。无论是智能语音交互平台还是“灵犀”智能语音分析平台,都需要对电话语音进行处理分析,服务上层应用。如果把音频信号比作水流,语音端点检测(VAD, Voice Activity Detection)就是控制水流的阀门,其结果决定了系统的后续动作。
本文主要讲述了58自研的VAD系统在流式、离线两大场景中的实践过程,第一部分简单介绍这两大场景,第二部分是对VAD算法的一个概述,第三、第四部分分别描述了流式、离线场景中遇到的不同问题以及解决方案,第五部分是评测结果,第六、第七部分是总结和参考文献。
见微知著 - 转转离线包设计实践
离线包,就是在有网络的情况去下载到本地的压缩包,在无网的时候可以进行加载。今天带大家来看看转转的离线包实战方案!
见微知著 - D3JS这个极客很爱的可视化框架
D3JS在可视化框架中算是比较经典的一个了,众人皆知,极客很爱(因为比起ECharts等上手有难度),有兴趣的猿友跟我来一起浏览一下D3JS这个框架的酷炫例子(earth-master)和基本使用吧!
58黄页标签提取及海量多分类优化
58黄页是一个用户找服务的平台,主要靠商家发帖,用户通过帖子找服务。但商家的帖子标题描述及用户的评价等都是纯文本的,不是结构化的数据。用户检索时无法对帖子核心内容进行突出展示,召回等。由此,需要从文本里提取标签,标签是通过对帖子内容分析得到的高度精炼的特征词或短语,将帖子内容标签化可以突出帖子特性,实现帖子内容结构化,帮助用户更快定位到所需要的服务,提升用户体验。
Swoole基于IPC通信的跨进程连接池
池化技术的核心思想是空间换时间,使用预先创建好的对象来减少频繁创建对象的性能开销,降低对象的使用成本,其一直是高并发系统设计必不可少的利器,但在php语言中,我们却很少提到这个技术,原因何在?让我们来一探究竟,捡起这把利剑,披荆斩棘。
见微知著 - 1000字带你掌握nextTick背后的原理
你知道nextTick原理吗?本篇带你从源码入手,轻松Get!!!
Swift Hook新思路--虚函数表
业界对Swift的Hook大多都需要依靠OC的消息转发特性来实现,本文从修改Swift的虚函数表的角度,介绍了一种新的Hook思路。并以此为主线,重点介绍Swift的详细结构以及应用。
见微知著 - 浅述浏览器的发展历程
提到浏览器,我们想到的就是url的请求渲染流程、优化渲染性能,但是你真的知道浏览器是怎么组成的,浏览器又是怎么演变成现在的样子的呢?
Flutter代码覆盖率研究
Android java代码覆盖有Jacoco等工具,iOS也有对应的原生代码覆盖率工具,然而,目前尚未有任何关于Flutter覆盖率的工具或者插件等,属于空白区域,因此需要从无到有的开发该工具,本文将详细说明Flutter代码覆盖率该工具的原理及其实现。