作者del680202 (HANA)
看板DataScience
标题[问题] 请教一个机率问题
时间Sun Jan 12 14:39:30 2020
大家好 小弟想请教一个机率模型问题
最近在处里一个预测订房机率的问题
手上有两个类型房间 单人房跟双人房的历史订单数据
现在想预测的是两个类型房间 在未来某一天被订购的机率有多少
input features这边先假设就是(日期, 房间类型, 各种feature)
这边想请教的对於目标函数的设定
目前就是假定目标Y就是某个房间类型在某一天的订购机率
现在很简单的设定当天的订购机率就是 某一天的订购数量/房间数量
所以训练数据的长相像是
(2019/12/01, 单人房, 各种feature, 订购机率)
但现在遇到一个问题 这个机率会是一个离散的数字
比如说双人房只有一间可以订 他的目标机率要嘛是100% 要嘛是0%
但是单人房有100间,他的机率分布会比较漂亮 可以画出一个近似高斯的图形
想请教这种情况下 这个目标函数的设定是否合乎逻辑
有没有办法改善对於Y的定义
还请高手指教m(_ _)m
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 92.203.228.53 (日本)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/DataScience/M.1578811172.A.830.html
1F:推 rockhotdog: 直接拿 是否(1/0)被订购 这个feature做为target就好? 01/13 16:58
2F:→ del680202: 嗯 ...直接对单笔纪录做整理好像也行 01/14 11:24
3F:→ Pieteacher: 想成1/0分群 在估算机率就好啦 01/14 23:18
4F:→ Kazimir: 我是有点看不懂 一个硬币投下去也不会有0.5的结果不是吗 01/15 17:48
5F:推 qwaszx780917: 觉得你要预测的比较不像是机率,应该比较像是单/双 01/16 16:08
6F:→ qwaszx780917: 人房的 订房率 (例如 单人房被订间数/全部单人房 01/16 16:08
7F:→ qwaszx780917: 的房数) 01/16 16:08
8F:推 qwaszx780917: 我的想法是直接预测订单数 如果有收的话也把客满接 01/16 16:19
9F:→ qwaszx780917: 不下的订单也纳入预测target,预测完再转成订房比例 01/16 16:19
10F:→ qwaszx780917: ,个人浅见供您参考 01/16 16:19
11F:→ del680202: 感谢意见 01/16 18:37