资讯专栏INFORMATION COLUMN

面向电信行业存量用户的智能套餐个性化匹配模型(top6)

RyanHoo / 1291人阅读

摘要:赛题链接面向电信行业存量用户的智能套餐个性化匹配模型赛题任务利用已有的用户属性如个人基本信息用户画像信息等终端属性如终端品牌等业务属性消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。四个月的费用分别进行。

1、赛题链接:面向电信行业存量用户的智能套餐个性化匹配模型

2、赛题任务: 利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。

3、数据解读及预处理:

多分类任务-->11分类;根据service_type来划分套餐 ,一类8个,另外一类3个(下文图片里面的大宝卡以及腾讯王卡系列)。

11个套餐表所对应的卡,通过对1_total_fee进行value_counts和网上套餐比较可以大致推出来。

数据预处理---->清洗数据以及对1234_total_fee进行类似3sigma的进行标记。

4、特征工程:

对1-2-3-4_total_fee进行min ,max ,std ,mean等操作;最后发现四个月话费的最小值是比较强的特征,从EDA来看对套餐区分是比较明显的。

本月流量以及上个月流量的差值特征;并且发现某些用户上个月的流量是一个完整的数值,比方说1024,2048,3072这种数值,对这种用户进行了简单的标记。

用当月费用减去超出通话时长的钱。1_total_fee - (service1_caller_time)*0.15

计算每个用户的基本费用(base_fee)

判断四个月的话费是否是一个整数。比方说套餐36的用户如果账单里面出现了36和36.0的话,那么后者36.0可能是其他base_fee通过开加油包等超出套餐费用叠加上来的。

四个月的费用分别groupby("complaint_fee")进行count。

5、搭建模型:

模型: 十折的lightgbm模型 + 五折的xgboost模型

xgboost实在是太慢了,没有GPU加成的话貌似要跑差不多一个白天,但是用上GPU精度就降低了。

6、模型融合: 通过林有夕大神分享的投票代码进行融合,有一点收益但是不大。

7、处理:

我们队伍是失败了,大概思路就是对模型分不开的两个套餐加一个权重。决赛队伍应该都是有分享的。

还有就是植物之前ijcai2018所用过的"食之无味,弃之可惜",惜的是我们也失败了。


最后附上我们队的github链接(记得点个星星哦~)

开源代码地址:2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6

这个比赛第一名,第二名,第四名貌似都有开源,还有砍手豪大佬对植物嫁接的进一步深入在知乎上都有文章,可以进行参考。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/43538.html

相关文章

  • 当你和天猫精灵对话时,它在想什么?阿里智能对话技术深度解读

    摘要:目前资讯播报时区限行历史上的今天单位换算油价日历等技能天猫精灵上线技能触发率,准确率即对话管理,是对话系统的关键部分,负责维护对话上下文,管理对话流程,保持对话过程的流畅。 术语对齐 TaskBot引擎: 核心处理对象是技能,我们把技能定义成结构化(query+content)、垂直场景化的任务,比如实时场景查询、工具类、控制类等QABot引擎: 包括KG-QA引擎、QAPair引擎、...

    时飞 评论0 收藏0
  • 当你和天猫精灵对话时,它在想什么?阿里智能对话技术深度解读

    摘要:目前资讯播报时区限行历史上的今天单位换算油价日历等技能天猫精灵上线技能触发率,准确率即对话管理,是对话系统的关键部分,负责维护对话上下文,管理对话流程,保持对话过程的流畅。 术语对齐 TaskBot引擎: 核心处理对象是技能,我们把技能定义成结构化(query+content)、垂直场景化的任务,比如实时场景查询、工具类、控制类等QABot引擎: 包括KG-QA引擎、QAPair引擎、...

    孙淑建 评论0 收藏0
  • 中金易云:为出版社找到下一本《解忧杂货店》

    摘要:中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。 摘要: 以供给侧结构性改革的角度来看,出版社即是最直接的供给侧,出版高质量、畅销度高的图书,建立出产高质量图书及图书IP的体系,即是提高供给体系质量。中金易云出版发行大数据平台正是以数字化转型为核心思路,以大数据中台与智能算法为基础的出版业供给侧结构性改革的成果。 201...

    番茄西红柿 评论0 收藏0
  • 漫谈边缘计算 (二):各怀心事玩家

    摘要:对于这类企业来说,边缘计算是从云计算中心层层向外推出去的,成长路径是自顶向下,由内而外。这是云计算公司力推边缘计算的商业逻辑。相对于其他玩家,电信运营商拥有的资源优势和基础布局,在边缘计算的竞争中赢在了起跑线上。前一篇文章(漫谈边缘计算(一):边缘计算是大势所趋)提到我对边缘计算的理解,认为边缘计算是在一定程度上弥补传统云计算的不足,相对于传统的全集中模式的云计算中心,边缘计算节点可以在现场...

    SexySix 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<