Soft_Job 板


LINE

※ 引述《popcorny (畢業了..@@")》之銘言: : 分享一下我們開發的工具 : https://artivc.io/ : : 用法跟 git 很類似,但是就是拿來備份大的檔案。 : 更精確的說是 snapshot 檔案,每個版本類似 git 的 commit : : 有支援,可以參考 : https://artivc.io/use-cases/backup/ : 目前有支援 local, remote(透過ssh), 還有 aws s3, google cloud storage, azure blob : 我們工具只要是連得到你存放的位置,都可以同步 : 但是也先說明一下,目前我們的東西對 linux 跟 mac 比較友善 : 如果要在 windows 用可能要裝 WSL : 相關資訊在這裡 https://artivc.io/usage/windows-supports/ : 有問題也可以私訊我 : -- :



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.57.79 (臺灣)
: ※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1649817739.A.49E.html : 推 jackyhuang: 看起來和git非常相似,好奇開發這套的動機是什麼? 04/14 23:53 : 推 chchwy: 回樓上 不就為了版控大檔? 04/18 19:49 感謝詢問,來說說動機 首先 git 是 source code version control ArtiVC 是給 data version control 這是最大的不同 source code 需要好的 diff/branch/merge 的機制 所以 git 的解決方法是每個 local 都有 local repository 所以你的所有 version control 的動作都是在 local 做 最後再透過 push/pull/fetch 跟遠端同步 但是這樣做對 data version control 的缺點是 有時候 data 太大,你可能只要一個版本的資料 再來就是 git server 成本太高,所以 github/gitlab 都有檔案上限 當然有很多人試著從 git extension 做解決。 業界比較有名的兩個 git lfs 跟 dvc git lfs 是 github 出的, https://git-lfs.github.com/ 他讓server多了一個endpoint專門處理大檔案,他會特別的處理。 但是缺點也很明顯 第一個價錢不便宜, 第二個不能放在自己的 storage (例如s3) 再來就是你要特別指定哪些東西叫做大檔案 另外一個是 dvc https://dvc.org/ dvc 不在 server 做手腳 而是 client 自己有兩個 repo,一個是 git repo,一個是 dvc repo 但是很麻煩的也是,你要指定哪些在 git,哪些在 dvc 但是 dvc 是可以把資料放在所有主流的 cloud storage。 但是如果有做資料的人可能都有同樣的想法 我的大資料要放哪? 當然是放在 s3 或是各個雲端平台的 cloud storage 如果資料要放那,那為什麼我版控還需要另外一個 git server 去做版控? 何不直接在 cloud storage 做版控? 如果我一個 service 就可以解決的 service,那為什麼要兩個 service? 不管用 git lfs 或是 dvc,data就是二等公民 即使你的 project 沒有 code,你還是需要開個 git repo 可能有人會說,可是我就是想要 data 跟 code 一起 version control 啊 我會跟你說,code的進版跟data的進版是兩回事 例如你有個 project 是要爬股票資料 你可能寫好了之後 code 都不需要再動了 但是你的 data 會一直進版啊,因為永遠都有新的資料。 另外有人可能會說,我根本不需要版控啊 反正我在 s3 上面每有新版本就開心目錄就好了 以我的經驗來講,做 data project 有些時候data producer 跟 data consumer 是不同人 對於一些不定時更新的 data,我還是希望有版號 最好可以像是 git 一樣,我可以 pull 最新版本,或是很明確我用的是哪個版本 data version control 不是必要,但是是一個好的 practice 就像 source version control,我們還是可以開目錄或是包個zip/tgz檔名放版號 但是如果要有更好的quality 更好的 process,就需要更多的工具輔助 而回到動機,就是我覺得 data version control 所有的 data version 應該發生在你放data的storage 不是 git repo,也不是一個外部的一個 dataset/model registry 而是你的 s3,你的 datalake,或是你的NFS server --



※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.103.224 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Soft_Job/M.1650504654.A.83A.html
1F:推 quickbym1: 推 04/21 13:35
2F:推 Odia: git lfs有收費喔!還以為是免費的 04/21 15:42
3F:→ popcorny: git lfs本身是open source,但用github上的超過額度要錢 04/21 15:49
4F:→ kojj: 要錢的產品,還有一個選擇 "Perforce" 04/21 17:08
5F:推 lf2net: lfs 有人有做plug-in 可以改變 blob的reference路徑,gith 04/21 18:23
6F:→ lf2net: ub 找一下就有了 04/21 18:24
7F:推 appleboy46: 有看有推 04/21 21:29
8F:推 nicetw20xx: 推分享 04/22 08:49
9F:推 qrtt1: 有下有推 04/22 09:17
10F:→ Chikei: lfs.url表示:... 04/22 10:56
抱歉,我git lfs說得不夠精確 如果你自己架git lfs server,當然有機會放在別的storage.. github有open source他們的git lfs reference implementation 也有人推放到支援放到s3的方案 但是這都是可行但是不會我選擇的方案 理由是如果要那麼麻煩就去用dvc就好了, 會選擇 git lfs 對我只有一個考量,就是我的git repo說有支援git lfs 然後我也不care資料實際放在哪裡,可存的量跟費用我可以接受 但不管怎麼樣,這都說明了現在放version control 大檔的難處 只是為了這個需求還要operate一個git lfs server是否太搞剛? ※ 編輯: popcorny (114.25.88.185 臺灣), 04/23/2022 06:59:09
11F:推 x246libra: 給推 04/23 10:19
12F:推 jackyhuang: thanks for the explanation! 04/24 03:10
13F:推 wulouise: 就算git lfs不是first class citizen...他們在git下XD 04/29 23:39







like.gif 您可能會有興趣的文章
icon.png[問題/行為] 貓晚上進房間會不會有憋尿問題
icon.pngRe: [閒聊] 選了錯誤的女孩成為魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一張
icon.png[心得] EMS高領長版毛衣.墨小樓MC1002
icon.png[分享] 丹龍隔熱紙GE55+33+22
icon.png[問題] 清洗洗衣機
icon.png[尋物] 窗台下的空間
icon.png[閒聊] 双極の女神1 木魔爵
icon.png[售車] 新竹 1997 march 1297cc 白色 四門
icon.png[討論] 能從照片感受到攝影者心情嗎
icon.png[狂賀] 賀賀賀賀 賀!島村卯月!總選舉NO.1
icon.png[難過] 羨慕白皮膚的女生
icon.png閱讀文章
icon.png[黑特]
icon.png[問題] SBK S1安裝於安全帽位置
icon.png[分享] 舊woo100絕版開箱!!
icon.pngRe: [無言] 關於小包衛生紙
icon.png[開箱] E5-2683V3 RX480Strix 快睿C1 簡單測試
icon.png[心得] 蒼の海賊龍 地獄 執行者16PT
icon.png[售車] 1999年Virage iO 1.8EXi
icon.png[心得] 挑戰33 LV10 獅子座pt solo
icon.png[閒聊] 手把手教你不被桶之新手主購教學
icon.png[分享] Civic Type R 量產版官方照無預警流出
icon.png[售車] Golf 4 2.0 銀色 自排
icon.png[出售] Graco提籃汽座(有底座)2000元誠可議
icon.png[問題] 請問補牙材質掉了還能再補嗎?(台中半年內
icon.png[問題] 44th 單曲 生寫竟然都給重複的啊啊!
icon.png[心得] 華南紅卡/icash 核卡
icon.png[問題] 拔牙矯正這樣正常嗎
icon.png[贈送] 老莫高業 初業 102年版
icon.png[情報] 三大行動支付 本季掀戰火
icon.png[寶寶] 博客來Amos水蠟筆5/1特價五折
icon.pngRe: [心得] 新鮮人一些面試分享
icon.png[心得] 蒼の海賊龍 地獄 麒麟25PT
icon.pngRe: [閒聊] (君の名は。雷慎入) 君名二創漫畫翻譯
icon.pngRe: [閒聊] OGN中場影片:失蹤人口局 (英文字幕)
icon.png[問題] 台灣大哥大4G訊號差
icon.png[出售] [全國]全新千尋侘草LED燈, 水草

請輸入看板名稱,例如:iOS站內搜尋

TOP