作者ken83715 (冒煙的宏)
看板DataScience
標題[問題] 可以事先取得的流動資料
時間Mon Sep 17 10:53:47 2018
大家好
在使用模型做回歸或分類時
通常是依據當下給的許多參數(feature)來進行預測
但是現實世界中
常常許多參數是當下無法立即取得的
例如以台北市作為預測的場景
要取得未來某個時間的天氣
一小時內某個公車站的公車通過數量
或者是捷運搭乘人數等等
因此有時候我們只能以當下擁有的資訊作為參數
例如星期幾
年 月 日 小時
是否為假日
連假(可以預先知道)
想請問大家
還有什麼資訊
是可以提前很多預先知道
並且會隨時間變化呢?
謝謝大家~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.96.111.100
※ 文章網址: https://webptt.com/m.aspx?n=bbs/DataScience/M.1537152829.A.94A.html
1F:推 st1009: 基本上都是用現在及過去資訊去推測吧?天氣可能用風向,水 09/18 21:37
2F:→ st1009: 氣,氣溫,搭配過去的紀錄訓練然後推測 09/18 21:38
例如我想預測11月每天的某個數值,11月的天氣現在是拿不到的呀
但是我可以知道哪天放假
※ 編輯: ken83715 (140.96.111.100), 09/19/2018 15:56:18
3F:推 whsunset: 要預測明天的天氣的話,就會拿過去以及今天的資訊來預測 09/19 19:43
4F:→ whsunset: 呀,請問你想要拿什麼資訊卻拿不到呢? 09/19 19:43
因為現有的模型都是以當天的資料預測當天的數值
或是特定那個小時的資料預測該小時的數值
還有用過去以及今天的資訊也是一種
但是如果要預測的範圍離現在非常遠呢?
例如半年後 的數值
現在就是在想有沒有什麼是可以拿到的
※ 編輯: ken83715 (140.96.111.100), 09/20/2018 17:19:50
5F:→ toy9986619: 通常半年後的預測,不太容易準確吧? 09/26 11:11
6F:推 a78998042a: 就是背景知識、他領域的理論延伸的模型,像是物理學上 09/28 18:24
7F:→ a78998042a: 怎樣預測行星始亡,都是依靠假設的物理模型。金融方面 09/28 18:24
8F:→ a78998042a: 就是從基本面展望公司未來的收益。如果單純想收集一些 09/28 18:24
9F:→ a78998042a: 既有資料,難度跟偏誤都不小吧 09/28 18:24