数据挖掘工程师简历模板(专业技能展示)
编辑:幻主简历 时间:2024-04-23 来源:幻主简历

数据挖掘工程师简历模板(专业技能展示)

一份出色的简历,对于数据挖掘工程师求职来说尤为重要,不仅是展示专业技能和工作经验的平台,更是向招聘方传递自身价值和潜力的关键。下面是小编整理的一篇数据挖掘工程师简历模板范文,欢迎大家参考阅读。

数据挖掘工程师简历模板(专业技能展示)

求职意向

求职类型:全职   

意向岗位:数据挖掘工程师   

意向城市:广东广州   

薪资要求:面议   

求职状态:随时到岗   

教育背景

时间:20xx.9-20xx.7   
学校名称:幻主简历大学 
专业名称:电子商务   
学校描述:主修课程包括高等数学、线性代数、概率论与数理统计、运筹学、C语言、Java、数据库系统概念、网页设计与制作等,成绩优异,多次获得校级奖学金。

工作经历

时间:20xx.3-至今   
公司名称:幻主简历工作经验案例1
职位名称:数据挖掘工程师、服务端开发工程师   

广告系统(DSP)设计与开发

  • 架构设计:负责设计了广告系统的整体架构,提高了系统的可扩展性和稳定性。

  • CTR/CVR预估:通过机器学习算法,提高了广告点击率(CTR)和转化率(CVR)的预估准确率,CTR提升了15%,CVR提升了10%。

  • 系统开发:领导团队完成了广告系统的核心功能开发,包括广告投放、效果跟踪和数据分析等模块。

  • 性能优化:通过优化数据库查询和缓存机制,减少了系统响应时间,提高了广告服务的性能。

推荐系统设计与开发

  • 架构设计:构建了高效、可扩展的推荐系统架构,支持亿级用户量和百亿级数据量的处理。

  • 召回与排序算法:调研并实现了多种召回和排序算法,包括协同过滤、内容推荐和深度学习等,提高了推荐的准确性和用户满意度。

  • 算法优化:通过A/B测试和用户反馈,不断优化推荐算法,使得用户点击率提升了20%,用户留存率提升了15%。

时间:20xx.10-20xx.11   
公司名称:幻主简历工作经验案例2
职位名称:Java开发工程师   
  • CAS单点登录项目开发:参与了CAS单点登录项目的开发,实现了多系统间的统一身份验证,提高了用户体验和系统安全性。项目上线后,用户登录成功率提升了10%,同时减少了用户因多次登录不同系统而产生的烦恼。

  • 权限管理项目开发:负责设计和开发了权限管理系统,实现了细粒度的权限控制,保障了系统数据的安全性。通过该系统,企业能够更灵活地管理用户权限,降低了因权限泄露而引发的风险。

  • 门户项目技术支持:为公司的门户项目提供技术支持,解决了在项目开发过程中遇到的技术难题。通过优化代码和数据库性能,提升了门户网站的访问速度和稳定性。在项目期间,网站访问量增加了20%,用户满意度也相应提升。

项目经验

时间:20xx.5-至今   
项目名称:幻主简历xxx项目案例
项目角色:DSP广告平台(算法负责人、服务端架构设计开发)   
项目描述:
DSP广告平台是一个面向广告主的广告投放平台,目标是为了提升流量变现效率,增加公司广告营收。DSP广告平台的主要功能包括广告主的注册、添加广告计划、添加广告创意,配置广告投放的定向条件、支持多种类型的结算方式(CPM、CPC、oCPM等)、实时计费、以及最重要的流量优化功能。广告算法的主要目的就是提升流量利用效率。在以CPC结算形式的广告投放中,为了使得每次广告投放的收益最大,需要对下发广告的CTR进行预估预估,并结合广告的CPC出价,计算本次广告投放的ecpm值,按照ecpm从大到小排序,选择ecpm较高的广告下发。在oCPM结算的广告投放中,除了需要预估广告下发的CTR外,还需要预估广告的CVR,然后结合广告的转化出价计算ecpm,选择ecpm收益较大的广告下发。广告算法的主要工作在于CTR预估和CVR预估。
工作内容:
  • 广告CTR预估的调研实现及优化:在算法方面,调研并测试业内CTR预估解决方案,比如逻辑回归(FTRL)、Wide&Deep、DeepFM等算法,在通过离线测试之后,进行工程化设计并部署上线;在特征工程方面,根据实际业务场景,探索并测试可能提升模型能力的特征,除了基础的用户特征,物品特征,上下文特征之外,尝试使用各种统计类特征来提升模型能力,经过诸多特征工程的测试后,CTR预估模型的AUC指标提升18%;在模型训练方面,采用负采样的方式,大幅降低模型训练时长,且提升了模型效果和AUC指标的稳定性;在CTR校准方面,探索预估CTR存在偏差的原因、CTR偏差衡量指标(ctr_ratio,Q曲线)、及CTR偏差的解决方案(基于模型预估结果的正负样本分布的方法,基于公式的校准,基于保序回归的校准),在加入CTR预估校准的逻辑后,预估的偏差明显缓解,ctr_ratio指标在1附近小幅波动,Q曲线基本拟合y=x直线;在工程方面,封装算法SDK,提供简便易用的模型调用方法,减少服务端对接模型的开发工作,降低因模型对接而产生bug的可能。

  • 广告CVR预估的调研实现及优化:在算法方面,调研并实现了Yahoo CVR预估算法,测试了阿里ESMM模型;在工程方面,封装CVR预估模型SDK,方便服务端调用,减少模型对接产生的bug;在具体实现上,解决了不同广告主转化标准不一致的问题(使用不同转化标准的数据训练模型,会导致模型预估准确率不高)

  • 服务端的重构设计及开发:快速梳理广告业务逻辑,提出合理的广告平台架构,实现模块之间实现耦合,业务逻辑清晰,易于扩展迭代,并且落地实现。重构后的DSP广告平台对外开放,运行稳定,相比将流量卖给广点通、广告联盟,收入增长翻倍。

项目成果:
广告CTR预估模型的上线,平台整体广告点击率提升50+%,CPM提升50+%,大幅提升了平台的流量利用效率。CVR预估模型的上线,使广告平具备以oCPM结算的能力,降低了广告主的广告投放风险,提升广告平台在市场上的竞争能力。
项目技术:
Python,Spark,Tensorflow,Java,Redis,Hive,Storm
时间:20xx.10-20xx.10   
项目名称:幻主简历xxx项目案例
项目角色:推荐系统(算法调研优化、服务端架构设计开发)   
项目描述:
推荐系统主要目的是提升用户的产品体验,增加用户粘性,进而提高用户留存和用户活跃时长。信息流推荐的主要功能是为用户提供个性化的内容。从工程的角度来看,信息流推
荐系统分为推荐算法和推荐引擎两部分,推荐算法部分是为推荐引擎提供召回列表、用户特征、物品特征及模型等数据,推荐引擎部分则负责读取算法数据,并对内容进行排序,
在极短的时间内响应用户的请求。从推荐算法的角度来看,信息流推荐分为两个阶段,第一阶段是召回阶段,该阶段中通过一些召回算法,比如基于规则的召回、协同过滤、用户画像、基于社交关系的召回及基于Embedding类算法的召回等算法,从不同的角度获取到用户可能感兴趣的物品,并将物品存入高速缓存;第二阶段是排序阶段,排序阶段通过使用排序模型,输入用户特征、物品特征、上下文特征等信息,对每个召回的物品输出一个用于排序的分数,推荐引擎按照排序分数从高到底对物品进行排序,再经过一些规则调整之后,取出topK的物品,返回给用户。
工作内容:
  • 召回算法的调研实现及优化:包括协同过滤算法(用户协同、物品协同、基于模型的协同)、基于内容主题的召回算法、 基于内容关键词的画像召回算法、基于规则的算法(热榜、新榜等)、基于社交关系的推荐(好友在看)、探索利用类算法(e-greedy、汤普森采样、UCB)、 Embedding类算法(item2vec、deepwalk)

  • 排序算法的调研实现:FTRL算法的调研上线及特征工程,fm及ffm算法的调研测试,深度排序模型的调研测试,如:wide&deep、deepFM、NFM、FNN、PNN、DCN等算法

  • 推荐引擎的重构设计及开发:梳理推荐业务逻辑,将推荐模块从其他业务中剥离,成立独立的推荐服务,并根据推荐业务的具体情况, 加入了日志模块(便于追踪每一次用户请求的处理过程,方便追踪推荐结果及分析推荐结果产生的原因), 流量配置模块(对于特定的流量,配置推荐逻辑,为推荐算法的优化迭代、AB测试提供极大的便利), 重构后的推荐引擎采用大量并行处理逻辑,大幅降低了相应延迟,响应时长100ms内的请求由原来的90%提升到99.9%

  • 推荐效果的监控:在召回阶段,监控各召回算法的召回条目数、点击率,阅读时长、召回内容的多样性等指标;在排序阶段,监控最终排序结果的多样性(包括推荐内容的种类数,推荐内容的信息熵); 分时段的监控请求量,曝光量,点击量,ctr、各召回算法占比以及响应时长等指标。推荐指标的监控对于推荐业务中一些现象的分析, 提供了极大的便利,对于算法的调优有很大的指导作用。

项目成果:
整体来看,召回算法的添加,以及排序算法的优化和特征工程等工作,将图文信息流的ctr提升18%。 对于推荐内容的多样性,从用户问卷调查的结果来看,有明显的改善
项目技术:
Python,Spark,Tensorflow,Java,Redis,Hive

自我评价

  • 善于思考总结,发现问题分析问题,并能给出合理的解决方案,且能落地实现(比如梳理广告业务逻辑,给出清晰的架构设计并落地实现;梳理推荐系统的业务逻辑,并给出合理的架构设计并落地实现;广告CTR预估、CVR预估模型的调研、实现、优化;推荐算法的调研实现、及算法的封装、算法计算效率上的优化等)

  • 有较强的自学能力,自学机器学习、深度学习等算法

  • 有较强的工程化能力,对于项目的设计、开发、部署运维轻车熟路

  • 数学基础扎实,高数、线性代数、概率论基础比较扎实,了解泛函分析、随机过程中的一些概念。对于常见的机器学习模型(比如相对简单的线性回归、逻辑回归算法,相对比较复杂的SVM、EM算法等)、深度学习模型都做过数学推导

  • 英语六级,能够阅读英文文献、做英文文献的技术调研

个人技能

  • 熟悉Linux开发环境,熟练使用python、Java、SQL语言

  • 熟悉常见的传统机器学习算法,如k近邻、朴素贝叶斯、逻辑回归、支撑向量机、决策树、提升方法、EM算法、HMM算法、K-means、SVD等;了解深度学习算法,如MLP、CNN、RNN、Transformer等

  • 熟悉信息流推荐业务及常见的推荐算法,如协同过滤、基于规则推荐、基于社交关系的推荐、探索利用(E&E)算法,Embedding(item2vec、DeepWalk)类算法、FTRL、wide&deep、DeepFM、NFM等

  • 熟悉广告业务及广告相关的算法,对广告CTR预估、特征工程、Calibration、广告CVR预估有丰富的实战经验

  • 熟悉Hadoop生态,对于Spark、Hive、Impala、Storm等大数据组件,有丰富的实际使用经验

  • 熟悉Java服务端开发,有亿级流量服务的设计、开发、部署经验

  • 熟悉常用的python数据分析库、数据可视化库、机器学习库,如numpy、scipy、pandas、matplotlib、scikit-learn、xgboost、gensim、Tensorflow等

  • 数学基础扎实,对于大部分传统的机器学习算法、深度学习算法都做过数学推导

  • 良好的英文阅读能力,能够独立的进行算法调研,并且实现落地。

资讯来源说明:本文章来自网络收集,如侵犯了你的权益,请联系QQ:509053849。
继续阅读相关文章
最新更新