作者jerryskin (小光)
看板Python
標題[問題] 請問如何大量下載某網頁上的圖片
時間Wed Jan 22 23:20:51 2020
——2/1——
感謝板友的回覆與來信
全部的照片已手動備份完畢
現階段還是很多人
因無法一次性備份照片而苦惱
被這款流氓app綁架中...
——1/24——
處於放棄狀態…一天一天備份中
感謝板友
——1/23——
瀏覽器使用chrome,網頁完整儲存檔案
https://tinyurl.com/wr4sera
請板友幫忙看網頁結構,謝謝
————————
因為從小孩2015年出生到現在
都使用(時光小屋)這個APP
從2018年8月開始
APP製造商不再提供照片批次備份程式
網頁也沒有備份照片的按鈕可以按
只能透過手機APP,一天一天的去備份照片
備份下來再想辦法傳送到電腦
我有3個小孩,分別使用4年2年1年
我有3個小孩,分別使用4年2年1年
我有3個小孩,分別使用4年2年1年
全部7年,一共2100天,等於要備份2100次
google許多方法都無效
(可以google"時光小屋備份"就知道了)
後來發現有python
研究了一兩天還是沒有辦法成功一次性的下載
目前自行摸索狀況如下
import requests
from bs4 import BeautifulSoup
res = requests.get('
https://www.peekaboomoments.com/zh-CN/home/537104626')
soup = BeautifulSoup(res.text)
for img in soup.select('???????'):
print ???????
卡關了.....不知該如何繼續下去
來此版尋求幫助,謝謝各位
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.175.13.86 (臺灣)
※ 文章網址: https://webptt.com/m.aspx?n=bbs/Python/M.1579706454.A.5E1.html
1F:→ dododavid006: 如果要知道如何下載需要知道網頁的結構,但你給出的01/22 23:34
2F:→ dododavid006: 如果要知道如何下載需要知道網頁的結構,但你給出的01/22 23:34
3F:→ dododavid006: 網址似乎需要登入才能看到內容,所以如果你無法給出01/22 23:34
4F:→ dododavid006: 網址似乎需要登入才能看到內容,所以如果你無法給出01/22 23:34
5F:→ dododavid006: 一個範例來我覺得版上的大大們也是會愛莫能助01/22 23:35
6F:→ dododavid006: 你可以把網頁存下來,存的時候選完整內容,然後會拿01/22 23:36
7F:→ dododavid006: 到一個 html 檔與一個資料夾,資料夾中你可以把你的01/22 23:36
8F:→ dododavid006: 小孩的照片刪掉,再把檔案跟資料夾一起壓縮傳到雲端01/22 23:37
9F:→ dododavid006: 這樣網頁中照片的部份就會處於遺失圖片的狀態,但這01/22 23:37
10F:→ dododavid006: 不會影響到檢查網頁結構的部份01/22 23:38
11F:→ dododavid006: 另外我個人的意見是,雖然 python 也是能做這種事,01/22 23:38
12F:→ dododavid006: 但因為還要處理登入的問題,所以可能使用瀏覽器的01/22 23:39
13F:→ dododavid006: userscript 會比較方便01/22 23:39
感謝d大,我再下載整個網頁給板友們幫忙看網頁結構
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 00:28:26
14F:→ vi000246: 你要不要直接發案給別人接比較快01/23 01:49
感謝v大
沒有這樣子的經驗,請問如果依此案的需求可能會需要多少費用呢?
沒有這樣子的經驗,請問如果依此案的需求可能會需要多少費用呢?
如果不方便透漏也可以站內信,謝謝
15F:推 fiorentino: 可以用Python的selenium來做01/23 04:46
16F:推 fiorentino: 可以用Python的selenium來做01/23 04:46
感謝f大
我再朝selenium的方向前進看看
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:40:17
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:50:43
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:50:43
※ 編輯: jerryskin (1.175.13.86 臺灣), 01/23/2020 07:51:25
17F:推 shala: 從提供的網頁結構仍無法確定大圖網址,幫不上忙01/24 16:59
18F:推 shala: 從提供的網頁結構仍無法確定大圖網址,幫不上忙01/24 16:59
感謝s大
目前處於放棄狀態 以天備份中
不過如果有方法的話 應該可以幫到很多人
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 17:13:22
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 17:15:16
19F:→ s860134: 我嘗試註冊 看起來沒有提供網頁板?01/24 22:25
回s大
我沒有單純使用網頁註冊,一開始用app註冊
後來開網頁登入,一樣可以上傳照片
※ 編輯: jerryskin (223.139.250.36 臺灣), 01/24/2020 22:39:52
20F:推 windclara: 建議去CodeJob發案吧。用爬蟲是有很大機會能做到。但01/25 10:33
21F:推 windclara: 建議去CodeJob發案吧。用爬蟲是有很大機會能做到。但01/25 10:33
22F:→ windclara: 卡在需要登入,你無法隨意公開自己的帳密。再來您對Py01/25 10:33
23F:→ windclara: thon也不算熟悉。所花的時間成本更巨大。但發案頂多101/25 10:33
24F:→ windclara: 個人知道,且還可以改掉密碼,避免洩漏自己常用密碼。01/25 10:34
25F:推 nyitalumnus: 好像有個軟體叫做: offline enterprise.可以把整個02/01 23:49
26F:→ nyitalumnus: 網站都下載下來。02/01 23:49
※ 編輯: jerryskin (1.175.4.84 臺灣), 02/02/2020 08:44:14
※ 編輯: jerryskin (1.175.4.84 臺灣), 02/02/2020 17:29:22