基于模糊数学的“拍照赚钱”任务定价最优方案研究
摘要
随着移动互联网的快速发展,越来越多的企业将大量线上、线下需求分解成微型兼职任务给广泛的大众执行,这样能够快速解决企业的弹性劳务需求,同时用户也能通过手机轻松赚钱。“拍照赚钱”APP就是其中的典型代表。本文利用附件相关数据,分析空间任务分布密度、任务供需情况、任务完成率等指标,建立综合吸引力模型,给出不同任务分布密度下的最优定价方案。我们的主要工作如下:
问题一要求给出任务定价规律,并给出任务失败原因。我们对附件一中所数据进行分析,将任务分布区域(经度 ,纬度 )划分为 个子区域,统计每一子区域的任务密度和任务平均定价并拟合出任务密度与定价间的数学关系。此外,我们将所给数据分为成功组和失败组并分别做出其任务分布密度和任务定价散点图和等高线图,对比分析任务失败原因。观察得失败组任务分布主要集中于经度 、纬度 以及经度 、纬度 这两个范围间,且定价较低。此外结合附件二会员位置信息和任务请求上限,分析成功组和失败组各子区域的任务供需匹配度发现失败组供大于需,缺少完成任务会员。最终总结出任务失败的原因有以下三点:(1)地理位置的原因;(2)定价及定价随任务密度增加的变化速率的大小;(3)任务密度与附近会员的数目的匹配程度。
问题二要求给出新的定价方案,并对其做出评价。对此我们根据模糊数学中隶属函数的方法,从会员心理层面出发,研究任务定价对会员的吸引力。查阅资料知当任务定价为68.56时吸引力达到0.5,该定价合理。此外我们根据会员信誉值对吸引力函数进行修正,综合考虑定价对公司成本,会员吸引力和任务难易度这三项指标的影响,利用熵值取权法确定各项指标权重,构建综合吸引力模型。通过实码加速遗传算法求解得任务最优定价为73.2,并利用该定价修正任务密度与定价间的函数关系,得到不同位置的任务定价。为确定该方案的合理性,我们利用附件一所给任务信息构建朴素贝叶斯分类器,判断该方案任务完成情况。经检验分类器准确率达到100%,且新方案下任务完成率提高了约20%,达到82.2%,该方案合理可行。
问题三要求给出任务打包发布是的任务定价方案,并分析该方案对任务完成情况的影响。对此我们按照每3份任务进行打包,经分析知任务打包发布会增加会员日均任务完成量、提高任务完成率且为公司节约成本。在相同吸引力值的情况下,单笔任务定价减少为60,对此我们修正综合吸引力函数,给出不同位置处的任务定价,并利用贝叶斯分类器对其进行检验。该方案下任务完成率达到85.4%,有明显提高。
问题四要求给出新项目的定价方案并评价其效果。我们将任务分布空间化分为 个子区域,分析知任务主要集中在少数几个区域。求解每个子区域的任务密度,并将问题二中的最优定价作为任务定价均值,确定不同任务密度下补贴方案。经检验该定价方案任务完成率达到79.4%,该方案合理可行。
关键词:任务定价方案、任务分布密度、吸引力函数、朴素贝叶斯分类器
一、问题重述
传统的产品铺货率调查一般是由市场调查公司来做的,如果是全国性的铺货率调查项目,一般情况甲方会委托一个全国性的市场调查公司来进行。然而随着移动互联网的普及,一种基于移动互联网的商业检查领域的自主式兼职劳务分包平台正在蓬勃发展,其中“拍拍赚”就是典型代表[1]。与传统市场调查方式相比此方式具有数据采集过程更加高效、总体质量更加有保障、成本更加有竞争力等特点[2]。在这样的背景下,公司如何更为合理高效的管理平台上运行的APP成为了工作的中点,而APP中的任务定价又关系到任务的完成率,直接决定了公司的收益和APP的普及程度。因此任务定价是整个环节的关键因素。
基于以上背景,利用附件提供数据,建立数学模型研究如下问题:
- 给出合适的模型来反映附件一中项目的任务定价规律,并基于该模型分析任务未完成的原因。
- 依据不同指标给出新的定价方案,并与原来的定价方案比较分析其可行性。
- 建立任务打包发布时的定价模型,并分析在这种方案下的任务完成情况。
- 根据上文的定价方案模型对附件三中的新项目给出任务定价方案,并评价该方案的实施效果。
二、模型假设
- 假设附件所给数据均真实、可信。
- 假设附件一和附件二中所给数据来自同一段时间、或时间相差不多。
- 研究时间段,平台运行正常,任务和会员的数量及分布密度没有太大变化。
- 附件中所给任务均能被用户预定。
- 会员可通过APP得知周围所有任务分布情况。
三、符号及变量说明
四、问题分析
4.1 问题一的分析
问题一要求确定任务的定价规律并分析任务失败的原因。我们首先对附件一所给数据进行预处理,检查是否存在错误数据和空缺数据。然后根据数据确定任务分布的大致区域并将其划分为20个子区域,观察每一子区域的任务分布情况。通过统计所得每一子区域的任务密度和该子区域的任务定价均值来寻求任务定价与任务分布密度的关系。此外我们利用附件二所给会员位置信息分析成功组、失败组每一子区域的任务供需匹配度,同时对比任务成功组和失败组任务分布的区域、任务密度、任务定价均值来寻求任务失败原因。
4.2 问题二的分析
问题二要求给出行的任务定价方案,并分析方案的可行性。方案定价是否合理可行涉及到多方的博弈,会员希望任务简单、定价高,而公司则希望利润大、任务完成率高。为此我们同时考虑公司成本、任务完成率和任务定价对会员吸引力,建立综合吸引力模型求解任务最优定价均值,并根据问题一所得结果给出不同任务分布密度下的任务定价。在此过程中我们充分考虑双方的利益以实现多赢。对于任务定价的可行性分析,选择附件一中任务成功组数据作为训练样本,构建朴素贝叶斯分类器求解新的定价下任务完成率,讨论方案是否可行。
4.3 问题三的分析
问题三要求确定任务打包发布时的定价,并分析此方式下任务的完成情况。对此我们将每三个任务进行打包,分析任务打包发布时对会员吸引力的变化,修正上文所给的任务定价吸引力隶属函数,重新求解任务的最优定价。并给出不同任务分布密度下的定价。利用上文训练好的朴素贝叶斯分类器确定任务完成率,分析任务完成情况。
4.4问题四的分析
问题四要求对附件三中新的任务数据给出定价方案,并分析其可行性。对此我们对附件三所给数据进行预处理,并分析任务分布大致区域和每个子区域任务的密度。依据上文确定的任务分布密度与定价间的函数关系给出新任务的定价。利用朴素贝叶斯分类器对任务完成情况进行分析。
五、模型的建立与求解
5.1 根据任务分布密度分析定价规律和任务失败原因
由附件一所给数据知,“拍照赚钱”任务的分布情况(经度和纬度)和任务的定价存在一定的联系。而任务的分布规律和定价又决定着任务的完成情况。因此本文通过对所给数据进行分析、预处理,利用数据挖掘技术[3]分析其任务定价的原因和任务失败的情况。
5.1.1 数据的预处理
对附件一中所给数据进行预处理。统计个定价的数目及其所占比例做饼状图如下所示。
如图1.1和表1.1所示,任务的定价分布在 这个区间内,且定价在 这个范围内的数据约占51%。而定价在80以上的数据仅占4.8%。定价主要集中于65,65.5,66,66.5,70和75这几个数中。其它定价相对较少。
5.1.2 定价的标准化处理
由于定价数值相对较大,不便分析和处理,且为消除不同定价间维度的影响我们对数据进行标准化处理。
数据的标准化是指将数据按比例缩放,使之落到一个较小的特定区间。若落到0-1区间,即为数据的归一化处理通过归一化处理除去数据的单位限制,将其转化为无量纲的纯数值。在进行数据的分类和处理中便于不同单位或量级的指标能够进行比较判别。
\(MIN-MAX\)标准化
\(MIN-MAX\)标准化是对原始数据的线性变化。设 分别为属性 的最小值和最大值,将 的一个原始值 ,通过 标准化将其映射在区间[0,1]中的值 ,其公式为:
若选择均值方差标准化将会有负值出现,与定价的含义矛盾,故我们选择 标准化。我们将任务的横纵坐标作为x轴和y轴,将标准化后的任务定价作为z轴,做出任务分布与定价的三维散点图,peak图及等高线图如下所示。
如上图所示在经度 113.2~114.2,纬度 22.5~23.5这个范围内任务较为集中,故其定价较低。而任务较为分散的区域定价往往较低。
为量化任务分布密度与任务定价间的对应关系,寻求两者间的内在关联,我们建立基于任务分布密度的定价模型。
5.1.3 分析任务分布密度与任务定价间的数学联系
任务分布密度的表达式如下所示
由附件一所给数据知,该任务分布的区域在经度 ,维度 这个矩形区域内。为统计不同子区域的任务分布密度,我们取经、纬度步的长为0.04,将该正方形区域划分为5*4的小格。其中,每一个小格代表一个子区域,统计不同子区域内任务分布的数量及任务定价均值。如下表所示。
表1.2 任务数量与任务定价均值统计表
为更好的了解任务分布情况与任务定价间的对应关系,同时消除不同数量间维度的影响,我们将任务分布数量转换为任务密度,研究任务密度与任务定价间的关系。如图1.5所示,将任务定价标准化处理后调用Matlab cftool工具箱,拟合任务分布密度与任务定价归一化数据间的函数关系。