首页 > 要闻 > > 正文
2019-11-07 15:47:44

AI预测Airbnb价格准确率为69%

导读 人们不必预测Airbnb上市价格的预测 -AI模型提供客户评论和租赁功能将成功。这是斯坦福大学研究生团队得出的结论,他们在一篇关于Arxiv org

人们不必预测Airbnb上市价格的预测 -AI模型提供客户评论和租赁功能将成功。这是斯坦福大学研究生团队得出的结论,他们在一篇关于Arxiv.org的论文(“使用机器学习和情感分析的Airbnb价格预测”)系统中进行调查,该系统利用机器学习和自然语言处理来预测未来的Airbnb费率。

除了论文,他们还在GitHub上提供了优化模型。

“在Airbnb上定价租赁物业对业主来说是一项具有挑战性的任务,因为它决定了该地区的客户数量。另一方面,客户必须在对房产的最佳价值知之甚少的情况下评估所提供的价格,“共同作者写道。“本文的目的是利用机器学习,深度学习和自然语言处理技术开发一种可靠的价格预测模型,以便在给予房产最少的可用信息的情况下,对房产所有者和客户进行价格评估。”

为了培训他们的价格预测系统,研究人员为纽约市提供了Airbnb公共数据集,其中包括50,221个条目,总共有96个特征。他们检查了每个功能,以删除频繁且无法修复的缺失字段并将布尔值更改为二进制文件,并删除重复和“无信息”功能,如主机图片URL。(这将功能数量减少到22个。)在培训过程中,团队使用了90%的原始数据(39,980个样本),保留了5%用于验证和测试(9,996个样本)。

在培训之前,该团队利用开源TextBlob语料库来分析列表评论的情绪,其中每个评论的得分为-1(非常负面情绪)和1(非常积极的情绪)。在与给定列表相关联的所有评论中对得分进行平均,并将其作为训练数据集中的新特征包括在内。

该团队测试了几种价格预测机器学习技术,包括线性回归,基于树的模型,SVR和神经网络。但他们报告说,性能最佳的模型 - 支持向量回归(SVR) - 在测试集上实现了69%的得分(衡量预测与实际数据点的接近程度)的69%。

“鉴于数据集的异质性以及涉及的隐藏因素和交互条款,包括业主的个人特征,这是不可能考虑的,这种准确度是一个很有希望的结果,”共同作者写道,他们留待未来的工作收集更多培训实例和新型神经网络架构的实验。