我正在尝试基于混合城市郊区环境中与其他要素的距离来构建地理空间要素的预测模型,例如,根据距最近道路,住宅区和购物区的距离,办公楼位于某个位置的可能性。我有一组特征位置,但是在某些区域中,这些区域非常稀疏,而其他区域非常密集,因此它们并不是均匀分布在整个区域中。使用决策树来预测某个地点学校的存在与否,我需要一套正面和负面案例的培训集。我应该如何创建此类案例的样本?
最佳答案
您将需要以下格式的数据:nearestRoad
,housingEstate
,shoppingDistrict
,...,schoolPresent
nearestRoad
是realNumber
,housingEstate
和shoppingDistrict
是二进制变量(我猜是)。你检查谷歌地图吗?他们是否为您提供了一个API,可让您查询特定的(纬度,经度)坐标?如果确实如此,则可以按如下所示生成数据集:
假设学校位于坐标(x,y)
。然后执行半径为5英里的gridsearch
以获取每个特征的精确值。因此,例如,也许您在坐标(x+1, y+2)
处找到了购物区,因此对于该特定实例,该要素将等于1。
这可能很乏味,但是如果存在这样的API,则肯定是有可能的。
关于machine-learning - 地理空间机器学习的人口抽样,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/40982679/