论文部分内容阅读
随着科技的发展,移动互联网越来越多的出现在人们的视野当中,与其相关的各种应用都潜藏着巨大的商业价值,出行方式识别是伴随着智能技术或服务领域的发展而提出的,具有广阔的应用前景。现在的智能手机早已不再是只能打电话、发短信的通信工具,它更像一个微型电脑,不仅具有强大的运算感知能力,还具有较大的存储空间,几乎可以解决一切衣食住行问题。当前在出行方式识别研究领域中,单一的数据来源制约着算法性能的发挥,此外,算法在不同场景下的适应能力差异很大,这些都是阻碍着出行方式识别准确率提高的瓶颈,需要逐一解决,本文的研究正基于此。本文利用改进的随机森林算法,通过智能手机拥有的GPS模块,陀螺仪,速度和加速度传感器等获取的特征数据来显著改善单一数据来源问题,并实现基于智能手机的出行方式识别系统,主要包括以下工作内容:本文引入多种数据到现有的出行方式识别算法中,并通过实验分析每一类特征数据对系统识别准确率的影响,并最终筛选出最有效的特征数据,兼顾了识别准确率和系统运行性能;本文通过设置参数综合对比分析不同算法的性能差异,特别是对随机森林林算法和支持向量机算法通过实验数据进行了比较研究,分析了各算法的优势和劣势,并且对随机森林算法存在的问题进行了一定的分析与研究,相比较其他算法,它更适合应用于出行方式识别中,只是需要克服其不平衡分类的问题。由于负类样本较少,本文通过人为增加的方式解决这种现状,并对其方法进行革新;本文完成了系统设计与实现,给出了数据采集、特征提取和识别模型构建的完整设计思路,完成了六大核心模块:系统交互、特殊数据采集、特殊数据存储、控制、特征数据提取和判别模块的创建。经过测试表明,本文涉及的具体出行方式包括静止、步行、跑步、自行车、公交车、自驾和地铁七种方式,对出行方式识别的准确率可以达到理想效果,具有良好的应用价值和实用意义。