cover_image

一个商品的"开车"之旅

朔月 MOGU广告技术
2017年06月27日 09:15

    随着互联网的发展,流量变现是每个公司需要考虑的问题,蘑菇街作为垂直女性电商领域,我们有哪些变现方式,如何去搭建广告系统,接下来就带大家一起来看一下广告系统的基本构成,通过讲解一个商品在广告系统中的投放之旅,帮助大家了解广告系统各个模块之间是如何工作的。


一、蘑菇街广告概况:

   1.当前蘑菇街主要的广告形式

     CPC:每次点击付费,当用户点击CPC广告后获得相应的收入

     CPM:千人成本指由某一媒介或媒介广告排期表所送达1000人所需的成本,千人成本=(广告费用/到达人数)×1000。目前,CPM已经作为"按广告每千次被展现收费"的广告模式。

     CPS:以实际销售产品数量来换算广告刊登金额。广告主为规避广告费用风险,按照广告点击之后产生的实际销售笔数付给广告站点销售提成费用。

     

    2.为什么要投广告

图片

上新:在蘑菇街平台,每天都有大量的商家上新品,一般商家每次上新都会在50~100款不等,有的商家甚至几百款, 在商家的上新品的阶段,伴随着商家对新品的一系列行为(测款、淘汰一些款、对一些效果好的款加大宣传力度等),来确定哪些商品适合销售,在自然流量中虽然对新品有一定的流量扶持,但是商家对商品的能动性不强,在一定程度上需要慢慢的积累数据,这样周期比较长,带来的是商家运营成本上的提高;作为广告在这个阶段可以大大加强商家的能动性,在广告流量中商家可以通过调整价格、投放位置、人群、关键词、创意等方式来快速活动更多的流量,提高商家对新品优劣的甄别效率。


开单、打造爆款:作为广告系统,商家对自身店铺的流量有了一定的支配的权利,当商家对商品的优劣有了初步的认识后,商家就可以展开一系列的投放策略,比如对某些搜索词、类目词、人群进行一定的加价,获取这些坑位下更上乘的流量,来帮助商家活动更好的收入,尤其是作为类似服装等类目有明显季节性的商品,可以通过广告的方式和自然流量达到更好的流量的配合打造爆款。虽然广告的投入带有一定的消耗和风险,更需要商家在商品的选择上需要更慎重,只要好的、获得市场认可的商品再加上得当投放策略,才是王道。


二、当前广告系统架构

广告系统主要组成部分:

   1.广告投放系统:

      商家在广告投放系统进行广告的投放和通过系统实时数据的反馈,帮助商家进行一系列投放策略的优化(时段、人群、词、创意等)。

    基本概念解释:

     计划:商家可以根据不投的投放需求和策略建立投放计划。

     宝贝:一个商品投放到一个计划后既是宝贝。

     广告:一个宝贝投放一个词、人群后都对应一个广告,这个也是和自然流量不同的地方,广告投放以广告维度进行投放,自然流量是以商品为维度进行投放的。

     创意:用户进入蘑菇进行搜索后,会出现一个很多商品的图墙,被展现在图墙上图片可以是商品的主图、也可以是商家自己投放的创意,商家可以通过在广告系统进行投放多个创意,系统投放这些创意,最后商家选择效率最高的创意进行投放和优化主图图片等, 一张合适的图在整个投放的过程中是非常重要的,有一句话叫一张高点击率的图片雄霸天下,创意在投放的过程中就是通过商家的能动性,结合数据帮商家选择一张可以雄霸天下的图

图片

图片



2. dump系统

      dump系统的职责是规范和管理搜索数据流,以统一的方式将上游的数据源同步到下游的存储,比如实时更新商家的投放行为、商品上下架等数据到搜索引擎或缓存库。在数据的可靠性上也提供有效和实时性的保障。


3.Topn 

       topn是搜索系统的统一入口。向上通过统一的接口和检索协议对接不同的搜索业务,业务层只需要关注数据透出结构和来源,不用关注引擎细节和算法逻辑;向下则对接不同的搜索引擎和排序系统,这些系统只需关注自身的搜索及排序逻辑,不需要关心不同的业务接入。同时,topn集成了abtest分流系统及提供算法配置后台,使得多个算法的并行测试和日常上下线非常便捷;另外,通过分组隔离和标准化部署,在可用性和扩展性上提供了最大保障。


4. QR

     QR系统的主要功能是实现query的改写(Query Rewrite)来扩展query。通常用户输入的搜索词是比较简单的,会根据算法的逻辑进行扩展,然后带到引擎中进行召回和计算。典型的改写功能如切词、同义义词扩展、类目相关性预测、品牌词加权等。QR系统实现上也比较灵活,支持算法的插件化开发,插件之间可以根据业务需求灵活组合。


主要针对以下两个方面的query扩展:

  1.基于类目相关性进行扩展;

  2.同义词扩展;

图片

                                      (图:基于图墙搜索“连衣裙”的扩展)


5.搜索引擎

       基于自研的统一底层框架zindex实现的高性能C++搜索引擎;支持检索、过滤、统计、排序等标准功能;支持海选和多轮排序,提供插件化的排序框架,方便算法同学开发排序算法;支持灵活的索引结构和召回逻辑等。

图片


6.算法引擎

   基于各种模型,离线、实时计算各个商品的分数,提供给搜索引擎进行排序。


三、广告各个模块之间相互配合

      从数据特性和系统需求上,提供三种数据更新形式:增量、全量、小全量。

       增量:商品的广告投放状态发生变更、投放新的广告、商品发生上下架等信息的变化都以增量的方式实时同步给引擎和缓存库,主要解决实时数据的变更和推送。

      小全量:主要是算法数据的更新,实时的引擎不单单是商品状态状态和投放状态发生变更,还有的就是商品在投放的过程中,线上的实时数据发生变更,比如商品的曝光、点击、下单量、退款等一系列数据;算法引擎需要根据这些数据通过模型对商品进行分数的更新,并同步给引擎,由于线上数据量大,数据需要进行一定维度的聚合,进行定期的更新给引擎,1小时或2小时一次,称为小全量。

      全量:搜索引擎实现对动态文档和实时搜索的支持,为了提高查询的效率,倒排索引会载入内存,但是服务器的内存总是有限的。在电商的引擎中,每天都有商品的上下架,下架的商品在索引中可以剔除;在广告系统中,一个商品可以随时调整价格、投放时间段、地域等进入增量索引, 随着时间的推移增量索引会越来越大, 直接影响后期的查询效率;同时数据以增量的方式更新失败,导致少量数据异常,如何不进行全量,异常数据会影响很久,因此需要定期进行一次对索引进行一次全量的更新。


四、广告系统整体架构和在线搜索流程

图片


五、在线搜索流程

图片

  1. 开始检索,用户在蘑菇街网站输入检索的条件(1.类目词;2.搜索),同时业务带上当地检索发起的场景信息(比如:APP图墙、APP搜索、微信图墙、微信搜索等);

  2. 请求首先会发送到图墙系统,图墙会根据不同的场景信息,确定这个场景确定:1.是否需要出广告商品;2.广告和自然商品展现的比例和请求商品的数量;并组织query发送到TopN;

  3. TopN根据收到query里获取广告和自然商品的数量,分别走自然和广告的检索流程,并将检索结果合并返回给图墙系统(自然检索参见:www.baidu.com)。

  4. 搜索:TopN向QR系统发送检索请求,由QR对检索词进行扩展,召回更丰富的商品集。类目:TopN直接发请求到搜索引擎。

  5. 搜索引擎接收到请求后:取出相应的倒排链(全量倒排链(全量倒排链往往较大,在索引全量的时会根据广告的粗排分生产的一个有序的队列,在召回中会进行截断;比如只会取出前5000个进入下一轮的粗排)、增量倒排链(检索中会取出全部的信息进行下一轮的粗排)),并过滤下架的一些广告。引擎取出全量、增量倒排链后根据粗排分进行一轮粗排。

  6. 精排:粗排接收后会进行多轮的精排,精排主要是做个性化重排序以及根据不同的业务进行重排序,最终返回TOPK排序结果给TOPN,完成整个在线请求。

六、总结        

       本文主要介绍蘑菇街广告系统的整体架构,以及各个模块之间在承接图墙流量时是如何配合完成在线请求的,当然整个广告系统还包含引擎的运维平台、算法的特征管理平台、AbTest平台、数据流控制平台来支持系统的发布和引擎全量和增量更新、流量的分配以及流量的AbTest;        

        本文也是走马观花似的让大家对蘑菇街当前广告搜索系统架构有个整体的印象,在广告系统中还有很多业务、算法上(比如如何去用户、平衡广告主、平台三方的关系;如何设置竞价机制;如何排序和流量分配等);在系统架构上(如何快速适应业务的变化和提升性能)每一个系统每一环节还有很多有价值的细节可以挖, 同时希望在后续的文章和大家分享。敬请期待!




更多流量广告搜索算法相关内容, 敬请关注“美丽联合数据技术”公众号

图片




继续滑动看下一个
MOGU广告技术
向上滑动看下一个